腾讯研究院AI速递 20250812

发布时间:2025-08-12 00:01  浏览量:1

生成式AI

一、 马斯克旗下的xAI宣布,Grok 4向全球所有用户免费开放

1. xAI宣布Grok 4向全球所有用户免费开放,但每12小时限制使用5次,达到限制后Grok完全不可用;

2. 此举被认为是为了跟进GPT-5的发布策略,但引发付费用户强烈不满,认为订阅费被"背刺";

3. 同时Grok Imagine视频生成服务更新,新增视频分享功能、修复下载问题并增加静音控制,增强了图片审核机制。

二、 浪潮发布面向万亿参数的超节点AI服务器「元脑SD200」

1. 浪潮信息发布超节点AI服务器"元脑SD200",将64张卡融合成统一内存、统一编址的超节点,能同时运行DeepSeek R1、Kimi K2等四大国产开源模型;

2. 产品采用3D Mesh开放架构,通过远端GPU虚拟映射技术实现地址空间扩增8倍,整机可实现4TB显存与64TB内存,满足超万亿参数大模型推理需求;

3. 推理性能实现超线性扩展,64卡一同运行DeepSeek R1时性能提升达3.7倍,Kimi K2达1.7倍,专为解决Agentic AI带来的计算与通信需求爆发设计。

三、 智谱发布GLM-4.5技术报告,从预训练到后训练细节公开

1. 智谱发布GLM-4.5技术报告,详细揭示预训练与后训练细节及开源强化学习框架slime,首次在单模型中实现推理、编码和智能体能力原生融合;

2. GLM-4.5采用MoE架构和深层"瘦高"结构设计,通过多阶段训练从15T通用数据和7T专业数据,再到多任务中期训练,提升长上下文和智能体能力;

3. 在12项ARC(智能体、推理、代码)基准测试中表现优异,超越Claude Opus 4等闭源顶尖模型,在AIME 24和SciCode上甚至超过OpenAI o3。

四、 昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周

1. 昆仑万维发布基于DiT视频扩散模型的SkyReels-A3,能生成长达一分钟的高质量数字人视频,专门优化手部动作交互、运镜控制和美感表达;

2. 该模型使用改进的插帧方法和ControlNet镜头控制模块,解决了AI视频长时间稳定性和多种专业运镜控制问题,打破了固定机位的呆板视觉效果;

3. 这是昆仑万维五天技术发布周的第一款产品,未来还将发布多个涵盖多模态AI核心场景的前沿模型,模型已上线SkyReels官网Talking Avatar工具。

五、 「CubeMe-小小的我」接入腾讯混元,更强 3D 生成能力

1. 创想三维与腾讯云达成战略合作,旗下AI建模平台MakeNow接入腾讯混元大模型,为"CubeMe-小小的我"等工具提供增强3D生成能力;

2. 腾讯混元3D v2.5采用业界首创稀疏3D原生架构,实现可控与超高清3D生成能力的飞跃,模型几何分辨率达1024³级,纹理贴图分辨率达4K;

3. MakeNow平台通过接入混元3D能力,用户可通过上传照片五分钟内获得可打印的Q版人物手办,支持三种风格模型并可通过提示词微调个性化表达。

六、 阿里开源 VLA 模型、世界理解模型与机器人上下文协议

1. 阿里达摩院开源三款具身智能核心组件:视觉-语言-动作模型RynnVLA-001-7B、世界理解模型RynnEC及机器人上下文协议RynnRCP;

2. RynnRCP是首个机器人上下文协议,可打通从传感器数据采集、模型推理到机器人动作执行的完整工作流,已支持Pi0、GR00T N1.5等多款热门模型;

3. RynnVLA-001基于视频生成和人体轨迹预训练,能从第一人称视角视频学习人类操作技能,RynnEC则将多模态大语言模型引入具身世界,仅靠视频序列建立连续空间感知。

七、 百川智能第二款医疗增强大模型Baichuan-M2正式上线

1. 百川智能发布32B参数医疗增强大模型Baichuan-M2,在OpenAI的HealthBench评测中击败包括gpt-oss-120b在内的所有开源模型,仅次于GPT-5;

2. 模型核心技术包括Large Verifier System验证系统、患者模拟器、中期训练和多阶段强化学习,让模型严格遵循中国医疗指南并适配本土临床场景;

3. 医疗推理能力增强的同时保持通用能力,4bit量化后可在RTX4090单卡部署,成本比DeepSeek-R1 H20双节点部署降低57倍,已适配国产芯片。

前沿科技

八、 灵巧智能的柔性灵巧手,「柔性」驾驭「刚性」的技术路线

1. 灵巧智能展示22个自由度高灵巧度机器人手DexHand021 Pro,通过双绳绳驱技术精确模拟人手功能,实现对拇指的"对指"等高级操作;

2. 产品采用"串并混联的双绳正反向刚柔耦合驱动"设计,解决传统灵巧手遇到的摩擦损耗、预紧力稳定性和系统集成复杂度问题;

3. 在260×86×50mm手掌空间内集成12个电机、全关节位置传感、多点阵力传感和高速通讯系统,四指单指负载>1kg,大拇指>2kg,抓握负载>5kg,成本比同类产品低十倍。

报告观点

九、 GPT-5 = Scaling Law失效?毕树超:永远有效,客观规律

1. 前OpenAI多模态后训练负责人Shuchao Bi认为,Scaling Law不会失效,失效的是数据,因为它反映的是数据内在结构和客观规律;

2. Bi指出数据、效率、探索和安全是通往AGI路上的核心问题,强调Scaling Law源于数据分布的幂律特性,这解释了为何模型能力并非平滑增长;

3. 解决方案是通过强化学习将计算资源转化为新知识和数据,建立"生成-验证-学习"的正向飞轮,用可验证任务驱动模型探索与进化。

十、 2025全球大模型应用报告:用户脚踏4.7条船!忠诚度低

1. 最新调研显示45%企业已将大模型部署到生产环境;关于付费,32%仅构建定制化模型,27%仅通过API购买服务,16%的受访者是白嫖党;

2. 用户大多同时使用多家大模型,平均使用4.7家不同产品,显示红海竞争下品牌粘性低;ChatGPT保持领先,谷歌Gemini与DeepSeek进步最快;

3. 55%受访者接受中国产大模型但要求部署在中国以外,大模型训练硬件市场英伟达占据78%绝对优势,可靠性、成本和智能水平仍是AI落地三大阻碍。

👇加入AGI数据库,AI智能问答

👇订阅下方合集,获取每日推送