新闻动态 - 合肥枢维智能科技有限公司

新闻中心

了解枢维智能的最新动态和行业见解

公司新闻

枢维智能完成 Pre-A 轮融资，将加速大模型应用研发

📅 2026 年 4 月 28 日融资

合肥枢维智能科技有限公司宣布完成数千万元 Pre-A 轮融资，由某知名科技创投基金领投。本轮融资将用于加大研发投入，扩大大模型应用训练、推理优化等核心技术的研发力度，加速产品迭代和市场拓展。

技术分享

vLLM 推理优化实践：如何实现 5 倍性能提升

2026 年 4 月 25 日

深入解析 vLLM 的核心优化技术，包括 PagedAttention、连续批处理等，分享我们在生产环境中的优化实践。

产品发布

枢维知识库问答系统 2.0 正式发布

2026 年 4 月 20 日

全新升级的 RAG 引擎，支持混合检索、多路召回、智能重排序，问答准确率提升至 95% 以上。

公司新闻

枢维智能与某三甲医院达成 AI 医疗合作

2026 年 4 月 15 日

双方将共同开发 AI 辅助诊断系统，基于大模型技术提升诊疗效率，预计年内将在多个科室试点应用。

技术分享

小程序集成 AI 能力的最佳实践

2026 年 4 月 10 日

分享在微信/支付宝小程序中集成大模型能力的技术方案，包括 API 设计、性能优化、用户体验等方面。

公司动态

枢维智能团队规模突破 50 人

2026 年 4 月 5 日

随着业务快速发展，公司持续引进优秀人才，目前团队已汇聚来自清华、北大、斯坦福等名校的 AI 专家。

技术分享

Kubernetes 上的大模型部署指南

2026 年 4 月 1 日

详细介绍如何在 K8s 集群上部署大模型服务，包括资源配置、弹性伸缩、监控告警等最佳实践。

行业洞察

技术博客

深度技术文章，分享我们的思考与实践

RAG 技术

RAG 系统中的混合检索策略设计与实现

探讨如何结合语义检索、关键词检索和元数据过滤，构建高效的混合检索系统，提升问答准确率。

2026 年 3 月 28 日 · 10 分钟阅读

模型优化

大模型量化技术详解：从理论到实践

深入分析 INT8、INT4 量化技术原理，分享在实际项目中的量化经验和性能对比数据。

2026 年 3 月 20 日 · 15 分钟阅读

AI Agent

构建自主 AI Agent 的架构设计与实现

介绍 AI Agent 的核心组件：任务规划、工具调用、记忆管理，以及实际应用场景中的挑战与解决方案。

2026 年 3 月 15 日 · 12 分钟阅读

云原生

大模型服务的弹性伸缩策略研究

分析不同负载场景下的伸缩策略，包括基于 QPS、延迟、GPU 利用率等多维度的自动伸缩方案。

2026 年 3 月 10 日 · 8 分钟阅读

新闻中心

枢维智能完成 Pre-A 轮融资，将加速大模型应用研发

vLLM 推理优化实践：如何实现 5 倍性能提升

枢维知识库问答系统 2.0 正式发布

枢维智能与某三甲医院达成 AI 医疗合作

小程序集成 AI 能力的最佳实践

枢维智能团队规模突破 50 人

Kubernetes 上的大模型部署指南

技术博客

RAG 系统中的混合检索策略设计与实现

大模型量化技术详解：从理论到实践

构建自主 AI Agent 的架构设计与实现

大模型服务的弹性伸缩策略研究

订阅技术通讯