2025年03月27日
在AI技术飞速发展的当下,AI大模型的应用正从云端向端侧加速渗透。
作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在AI大模型端侧部署的赛道上率先发力,其端侧AI大模型解决方案备受瞩目,为AI设备的革新注入了澎湃动力。
万亿级市场蓝海显现,端侧AI大模型加速落地
近年来,端侧AI市场呈现出惊人的增长态势。据头豹研究院发布的《2024 年中国端侧 AI 场景应用分析:智能终端与边缘计算的融合创新》报告预测,2023年中国端侧 AI 市场规模达1,939亿元,预计2028年将增至19,071亿元,年均复合增长率高达58%。
从千亿级迈向万亿级,这一数据背后,是端侧设备对智能化、实时性需求的爆发式增长。然而,端侧AI的崛起并非偶然。通过将AI大模型部署在端侧,不仅解决了云端部署在网络延迟、隐私安全、算力成本等方面的问题,更释放了设备端的算力潜力,为AI应用的深度拓展提供了可能。
在应用方面,端侧AI大模型的落地速度远超预期。在CES 2025上,AI PC、AI手机、AI眼镜、AI智能家电等一系列具备AI能力的终端设备纷纷亮相,充分展示了端侧AI的无限可能。
三大核心驱动力, 端侧AI部署正当时
当前,端侧AI的部署正以前所未有的速度推进。这背后离不开以下三大核心驱动力的支撑。
端侧AI算力的提升。面向端侧AI应用,移远通信打造了丰富的AI算力模组,其中,SG885G基于高通QCS8550平台开发,AI综合算力高达48 TOPS,能够轻松满足复杂模型本地化推理的算力需求。
AI模型小型化发展。DeepSeek的出现,以及量化和蒸馏技术的应用,推动了AI模型的小型化发展。现阶段,3B或4B参数级别的AI模型已等效于之前的7B参数AI模型,这使得小算力芯片、小容量存储以及小BOM设计就能实现高性能的端侧AI方案。
客户需求的拉动。AI大模型的端侧部署方式具备诸多优势,不仅确保了终端设备的实时响应和隐私安全,还能在无网环境下保持稳定运行,同时显著降低推理成本,这极大地激发了客户在端侧部署AI的积极性。
移远端侧大模型解决方案:技术三角重构智能逻辑
在AI大模型领域,移远通信率先布局,于2024年8月份便推出了AI大模型解决方案,为AI大模型技术在端侧的落地做好了充分准备。
移远通信端侧AI大模型解决方案以“LLM(大语言模型)+ RAG(检索增强生成)+ Agent(智能体)”技术三角为核心,通过对AI模型的深度优化与增强,重新定义了 AI 端侧设备的智能化逻辑。
该方案基于移远高算力AI模组SG885G-WF,其48 TOPS的AI综合算力可为方案功能的实现提供充足的算力支持。同时,方案在全语音链路上实现了无缝衔接与高效运行,从KWS语音唤醒到VAD人声检测,再到ASR语音识别,最后通过TTS语音播报,能够为用户带来更自然的语音交互以及更加个性化的服务体验。
得益于移远通信全方位的工程能力,其端侧AI大模型解决方案可广泛应用于机器人、医疗诊断、教育学习机、智能座舱、智能客服、智能点单机、PDA、对讲机、陪伴玩具、智能网关、广告机等众多场景。
日前,移远通信联合德壹发布的AI具身理疗机器人,便是基于其端侧AI大模型解决方案打造的。该机器人在无需理疗师介入、无网络连接的环境下,能够快速且准确地理解用户指令和意图,高效完成通用聊天、医疗领域RAG问答、指令控制等任务,充分展现了移远端侧AI大模型解决方案的实用价值。