大模型不再只是“比参数”,而是深入到各种具体场景

发布时间:2025-08-04 22:24  浏览量:2

大模型不再只是“比参数”,而是深入到各种具体场景——从车内座舱到生产车间,从线上客服到展馆咖啡机器人,都能看到它的身影。

首先是大模型本身的能力跃迁。阶跃星辰发布的新一代基础模型 Step 3,采用3210亿参数的MoE架构,激活参数38亿,是其首个全尺寸原生多模态推理模型。它能同时理解文本、图片和数学符号,并在国产芯片上实现推理解码效率的跨代提升,意味着“更聪明但更省算力”的模型正走向应用一线。

而在“怎么用”上,MiniMax给出了另一种答案——直接把模型变成能执行任务的全栈智能体 MiniMax Agent。它能分解任务、调用API、发起支付并调度长流程,在展会现场的演示中,用一句话生成企业数据看板或自动搭建简易电商网站并完成支付闭环,展现出“AI同事”的雏形。一个月内快速迭代12次,也折射出这一赛道的竞争节奏。

安全问题则被合合信息单独拎了出来。其AI鉴伪技术可在毫秒级识别深度伪造,对金融、政务等行业尤为关键。展台以“名画找茬”互动吸引大量观众:被篡改过的《蒙娜丽莎》《向日葵》通过模型扫描后,会显示伪造区域的光影和纹理异常,并给出真伪评分。这套技术同样适用于人脸换装、票据篡改等高风险场景。

百度在展会上展示的是一整套“应用生成流水线”。一边是 GenFlow 2.0,能调度多智能体一次性生成PPT、图表、网页和脚本;另一边是 秒哒平台,用户用一句话描述需求,三分钟就能生成可运行的应用。现场演示“会务签到小程序”,从界面到逻辑全自动生成。数字人 Nova 的升级版也同步亮相,动作更自然、语音克隆更接近真人主,为直播和短视频营销场景准备。

聚焦实时交互的声网则发布新版对话式AI引擎,新增声纹识别、视觉理解、数字人交互三大能力。互动毛绒宠物“芙崽”成了现场人气展品:它能在嘈杂环境中分辨不同人的声音,精准响应指令,并通过摄像头识别手势、表情做出拟人化反馈,面向教育、客服和娱乐的应用潜力清晰可见。

阿里云正式发布首款专为AI Agents打造的“超级大脑”——无影 AgentBay。这台云端电脑能同时运行代码、网页、数据分析、表格制作等任务,具备视觉理解、自然语言控制、任务解析等多项AI能力,并可在Windows、Linux、Android等系统间无缝切换,只需三行代码即可接入,实现“拎包入住”。

本次大会,阿里云还完整呈现了从基础设施到模型再到平台应用的全栈能力:包括云原生CPU 倚天710、飞天云计算操作系统、HPN7.0智算网络架构、AI Stack一体机,以及通义千问、通义万相大模型系列和百炼、PAI平台。

整体看,今年的生成式AI展区呈现两大信号:一是多模态和Agent化成为共识,大模型正在变成能“干活”的工具而非展示参数的噱头;二是安全与成本话题被前置,厂商开始正面应对伪造治理与推理效率。

如有侵权,请联系我们删除

商务合作-《AI发展研究院》