新闻中心

了解枢维智能的最新动态和行业见解

枢维智能完成 Pre-A 轮融资,将加速大模型应用研发

📅 2026 年 4 月 28 日 融资

合肥枢维智能科技有限公司宣布完成数千万元 Pre-A 轮融资,由某知名科技创投基金领投。 本轮融资将用于加大研发投入,扩大大模型应用训练、推理优化等核心技术的研发力度, 加速产品迭代和市场拓展。

阅读更多
技术分享

vLLM 推理优化实践:如何实现 5 倍性能提升

2026 年 4 月 25 日

深入解析 vLLM 的核心优化技术,包括 PagedAttention、连续批处理等, 分享我们在生产环境中的优化实践。

阅读更多
产品发布

枢维知识库问答系统 2.0 正式发布

2026 年 4 月 20 日

全新升级的 RAG 引擎,支持混合检索、多路召回、智能重排序, 问答准确率提升至 95% 以上。

阅读更多
公司新闻

枢维智能与某三甲医院达成 AI 医疗合作

2026 年 4 月 15 日

双方将共同开发 AI 辅助诊断系统,基于大模型技术提升诊疗效率, 预计年内将在多个科室试点应用。

阅读更多
技术分享

小程序集成 AI 能力的最佳实践

2026 年 4 月 10 日

分享在微信/支付宝小程序中集成大模型能力的技术方案, 包括 API 设计、性能优化、用户体验等方面。

阅读更多
公司动态

枢维智能团队规模突破 50 人

2026 年 4 月 5 日

随着业务快速发展,公司持续引进优秀人才, 目前团队已汇聚来自清华、北大、斯坦福等名校的 AI 专家。

阅读更多
技术分享

Kubernetes 上的大模型部署指南

2026 年 4 月 1 日

详细介绍如何在 K8s 集群上部署大模型服务, 包括资源配置、弹性伸缩、监控告警等最佳实践。

阅读更多

技术博客

深度技术文章,分享我们的思考与实践

RAG 技术

RAG 系统中的混合检索策略设计与实现

探讨如何结合语义检索、关键词检索和元数据过滤, 构建高效的混合检索系统,提升问答准确率。

2026 年 3 月 28 日 · 10 分钟阅读
模型优化

大模型量化技术详解:从理论到实践

深入分析 INT8、INT4 量化技术原理,分享在实际项目中的 量化经验和性能对比数据。

2026 年 3 月 20 日 · 15 分钟阅读
AI Agent

构建自主 AI Agent 的架构设计与实现

介绍 AI Agent 的核心组件:任务规划、工具调用、记忆管理, 以及实际应用场景中的挑战与解决方案。

2026 年 3 月 15 日 · 12 分钟阅读
云原生

大模型服务的弹性伸缩策略研究

分析不同负载场景下的伸缩策略,包括基于 QPS、 延迟、GPU 利用率等多维度的自动伸缩方案。

2026 年 3 月 10 日 · 8 分钟阅读

订阅技术通讯

每月一期,精选技术文章、行业动态和产品信息, 帮助您紧跟 AI 技术发展脉搏