九卦 | 端侧觉醒:AI 的下一场突围?
发布时间:2025-06-28 12:41 浏览量:1
来 源 | 九卦金融圈
在全球人工智能浪潮奔涌之际,技术先锋企业面壁智能凭借其创新成果与前瞻布局,已成为行业关注焦点。
近日,新网银行“AI构造力”栏目中,清华大学经济管理学院中国金融研究中心副主任黄张凯与面壁智能联合创始人兼CEO李大海进行了深度对话。本次直播已在新网银行及清华大学经济管理学院官方直播间同步呈现。
作为公司的掌舵者,李大海具备丰富的企业组织领导、开发管理、产品商业化落地经验,他带领面壁成为全球知名的端侧智能代表性企业,并致力于推动AI与产业的深度赋能。本次直播中,李大海分享了 其对AI行业发展趋势的洞察,并阐述面壁智能的创新实践与未来战略。
端侧智能:为何成为 AI 新焦点?
为何长期押注“端侧”
黄张凯:面壁为何长期押注“端侧”?与主流大模型“大力出奇迹”的路径有何不同?
李大海:端侧智能是将大模型推理能力嵌入终端设备,利用本地算力在无网络依赖下进行本地推理。其优势包括:保护用户隐私,本地处理避免信息外泄;高可靠性和低延迟,如自动驾驶需即时响应,无法容忍网络抖动;三是成本效益,高带宽场景下端侧成本远低于云端。
面壁公司选择聚焦终端,作为创业公司,优势在于打造知识密度高的模型,实现同等参数下性能更高、成本更低的效果(如 2.4B 模型实现 7B 模型效果)。在端侧,模型大小受限时,高知识密度可使模型更聪明且成本更低,这一优势在端侧具有决定性价值。
MiniCPM 4.0:
端侧智能的 “稀疏高效” 突破
黄张凯:面壁MiniCPM 4.0提出“稀疏高效”战略,它对端侧的最大价值是什么?
李大海:面壁智能的小钢炮MiniCPM系列自 2024 年 2 月推出 1.0 版本后持续迭代,语言模型已发展到MiniCPM 4.0,该版本在同尺寸下综合表现略胜Qwen 3,且在长文本推理速度上优势显著,实现了长文本推理常规 5 倍加速,极限场景220 倍加速,因此公司内部将其命名为科幻小说《三体》中的加速概念——前进四。
此次MiniCPM 4.0 的技术突破最为关键的是上下文稀疏化技术以及高效的数据工程。上下文稀疏化技术可将长文本分块并智能筛选关键信息区块,最高减少 95% 计算量,使模型能高效处理百万级上下文,同时保持精度;而高效数据工程则仅用不到 10T 高质量数据即训练出顶级性能模型,大幅降低训练成本。二者结合实现 “又快又好” 的端侧智能升级。
模型架构的 “密度革命”:技术落地与硬件变革
“稀疏高效” 技术:
从理论到应用
黄张凯:“稀疏高效”技术
在具体应用中如何落地?
李大海:以 “个性化端侧 AI 助理” 为例,若用户希望基于微信聊天记录、购物记录等隐私数据提供个性化服务,传统云端方案因隐私限制无法实现,而端侧长文本能力(如处理 十万、百万级上下文)可支持此类场景。
例如,用户询问 “今晚有什么安排?”,端侧助理可直接调取一个月前的聊天记录,准确回复预约信息。类似地,智能座舱可通过端侧感知舱内外环境,在信号弱或断网时触发安全报警,保障用户安全。
端侧智能:
驱动硬件形态的未来变革
黄张凯:端侧智能的发展是否
会推动新的硬件形态?
李大海:端侧智能的发展必然会推动新的硬件形态出现。当前移动互联网的交互依赖 “人迁就设备”(如主动输入指令),而未来端侧智能将实现 “设备理解人” —— 通过 “始终在线(Always on)” 的感知能力(如智能眼镜实时观察环境),结合超长上下文(用户所有历史交互数据),设备能主动提供更懂用户、更个性化的服务。这类产品的隐私密度(掌握用户全量上下文)极高,未来甚至可能需通过生物识别等权限控制保障安全。
端侧智能的多元应用场景
黄张凯:端侧智能的具体应用场景有哪些?
李大海:端侧智能具体应用场景丰富。在个性化服务方面,MiniCPM 4.0 模型首次在端侧实现了长文本能力,可处理更长的上下文,实现更个性化的服务。例如基于手机APP聊天记录的个人助理,能根据用户的聊天记录和收藏资料提供信息查找和个性化服务。
在具身智能方面,具身智能的商业应用落地依赖端侧智能的进展。未来的机器人和机器狗需清晰划分云侧和端侧分工,端侧智能可确保设备在断网时仍能正常反应和决策。
在智能座舱领域,面壁智能将端侧模型与现有的智能座舱深度结合,为车厂赋能。目前已与长安汽车、上汽大众、长城汽车等车厂深度合作,最早量产的是长安马自达的 EZ-60 SUV。智能座舱可通过舱内舱外摄像头感知环境,实时告知风险,保障安全。
在玩具领域,面壁智能为玩具领域提供的端侧方案可解决现有云端服务玩具的延迟和网络连接问题,实现即开即用,无需联网,响应速度快。还可通过摄像头观察用户环境,提供情绪价值。
AI 落地产业现场:
效率提升与行业变革
人工智能的未来格局:
“3+X”
黄张凯:如何看待人工智能领域未来1~3年的格局?面壁智能的定位是什么?
李大海:未来人工智能领域格局可能是 “3+X” ——3 家提供通用 API 的云厂商(量大低毛利),X 是将大模型与行业深度融合的垂直领域企业(高壁垒)。面壁智能属于 “X”,通过高知识密度模型,在如汽车、手机、电脑、具身智能、教育等端侧场景中提供更加智能、便捷的服务。例如我们与清华大学计算机系、学生发展中心等部门合作研发的学生AI成长助手“清小搭”,为清华在校学生配备具有智能问答、智能伴学功能的专属智能助手,提供全过程、全方位、全天候的陪伴和支持。
AI 提升普通用户
工作效率
黄张凯:人工智能对普通用户的工作效率提升有哪些?
李大海:人工智能对普通用户的工作效率提升有诸多具体应用。当前已落地的包括:智能写作工具,辅助论文框架生成,减少初期工作量;行业助理进行合同风险分析、尽调报告生成;个人效率工具基于端侧的 “记忆” 能力,实现更精准的日程管理、需求响应。未来,随着端侧算力提升,这类应用将更普及。
人工智能对行业的
深远影响
黄张凯:人工智能主要影响哪些行业?
李大海:从长远上看,人工智能对任何一个行业都会有巨大的正向影响,目前只是因为各类因素和条件的影响,人工智能在部分行业的赋能率先展现出来。比如在金融领域,大模型可用于尽调、风险评估等,提升工作效率。在生产领域,人工智能将带来需求端变革,使需求更加个性化。未来,生产端的柔性化生产能力提升,需求端与生产端可通过智能体直接对接,实现柔性化生产。
不仅如此,人工智能对于提升企业管理效率上也将带来很大的帮助。比如,结合人工智能和大数据等技术,与企业管理系统、体系融合,可使管理更高效、简单,未来可能出现只有一个 CEO 的独角兽公司,通过 AI Agent 就能完成业务落地。
在生产领域,人工智能将带来需求端变革,使需求更加个性化。未来,生产端的柔性化生产能力提升,需求端与生产端可通过智能体直接对接,实现柔性化生产。
战略与思辨:
端侧智能的未来与人才需求
端侧智能:
中国 AI 的差异化路径
黄张凯:为什么说“端侧智能”是中国AI的一条独特路径?
李大海:中国制造业规模全球第一,但管理效率如组织协同、决策流程方面仍有提升空间。AI 可通过 “上下文感知” 优化管理,例如管理者通过端侧设备实时获取业务数据(生产、销售、用户反馈),提高企业信息流转效率,并结合历史经验快速决策;企业通过 AI Agent 自动处理重复性工作(会议纪要、邮件回复),释放人力专注创新。
面壁智能的未来目标
与人才战略
黄张凯:面壁智能未来5年的目标是什么?需要怎样的人才?
李大海:面壁智能的愿景是 “AGI for Lives(普惠通用人工智能)”,希望到 2030 年全球 400 亿智能设备中大部分搭载面壁端侧模型。我们的人才需求聚焦于 “AI 原生能力” —— 不仅能使用 AI 工具,更能将 AI 融入思维方式,主动发现问题、定义问题而非仅解决问题。
传统 “小镇做题家” 式技能(单一编程能力)价值趋弱,洞察问题、创新思考的能力将成为未来人才的核心竞争力。面壁智能需要聪明、能定位问题、提出问题的人才。随着大模型 AI 能力增强,解决问题的能力权重将逐渐降低,定位和提出问题的能力更为重要。同时,我们强调人才的 AI 原生能力,即能将 AI 能力融入自身能力体系。
大学生专业选择:
底层能力与未来竞争力
黄张凯:对大学生专业选择有何建议?
李大海:我对大学生专业选择的建议是,世界变化快速,专业选择应关注 “底层能力” 而非短期就业。技术能力理工科(数学、计算机)仍是基础,但需结合 AI 工具提升效率。与此同时,科技需人文对冲,文化、艺术等领域仍有不可替代的价值。一些底层素质包括逻辑能力、问题洞察力、团队协作力是个人长期竞争力。建议选择能培养这些能力的学校与专业,而非单纯追逐 “热门”专业。