北极雄芯QM935-A芯片适配多个大模型，加速车载应用升级_新闻动态_关于我们

北极雄芯QM935-A芯片适配多个大模型，加速车载应用升级

2025-03-14

过去一年，大模型技术呈现爆发式演进态势：一方面，国内科技企业持续突破大模型基座能力边界，另一方面，应用层厂商依托基座模型构筑起丰富的AI应用生态。在用户感知最直接的终端设备领域，大模型已实现从云端到边缘的跨越式渗透：无论是更智能的语音助手、更通用的 AI Agent 等人机交互方式，还是多模态环境理解——如车载场景中对周边环境的分析和对驾驶员的提示，这些都显著拉近了机器与用户之间的距离，在车载场景中赋能更加智慧的舱驾体验，加速迈向“人机合一”的“赛博时代”，开启智慧出行新篇章。

与云端高并发场景不同，端侧部署大模型主要面向单并发使用，模型推理时的“带宽瓶颈”尤为突出。每生成一个“Token”即对应一次模型推理（又称解码），势必需要至少一次模型数据访问。北极雄芯的 QM935-A08 通过充分利用内存带宽资源、优化非参数类算子计算、简化系统交互，并结合算法层面的改进，成功实现端侧大模型部署效率的逐步提升。

近期，北极雄芯已在多个大模型（如 DeepSeek、面壁智能 MiniCPM 等）上完成初版芯片部署测试。基于 QM935-A08 开发原型板的实测结果显示：面壁智能 MiniCPM-2B 端侧大模型最高可实现12.8～13.5token/s/req（端侧常见为单用户请求）的吞吐量，DeepSeek Distill Qwen 1.5B 端侧大模型的最高吞吐量则可达到16.4~18.8token/s/req。在相同的模型部署条件下，该性能在国内端侧 SoC 产品中处于领先地位。

（1）DeepSeek大模型在QM935-A08芯片上的运行效果

（2）DeepSeek大模型在QM935-A08芯片上的运行效果

（3）MiniCPM-2B大模型在QM935-A08芯片上的运行效果

北极雄芯 QM935-A 系列芯片在多个大模型上的成功适配，充分展现了其在大模型领域的广阔潜力。展望未来，北极雄芯将持续推动 QM935-A 与更多主流大模型的适配与优化，充分发挥自有芯片的软硬件优势，提供更高性能的解决方案，为大模型体验不断升级提供坚实支撑。

新闻动态

北极雄芯QM935-A芯片适配多个大模型，加速车载应用升级

微信二维码