腾讯研究院AI速递 20250812

发布时间：2025-08-12 00:01 浏览量：13

生成式AI

一、马斯克旗下的xAI宣布，Grok 4向全球所有用户免费开放

1. xAI宣布Grok 4向全球所有用户免费开放，但每12小时限制使用5次，达到限制后Grok完全不可用；

2. 此举被认为是为了跟进GPT-5的发布策略，但引发付费用户强烈不满，认为订阅费被"背刺"；

3. 同时Grok Imagine视频生成服务更新，新增视频分享功能、修复下载问题并增加静音控制，增强了图片审核机制。

二、浪潮发布面向万亿参数的超节点AI服务器「元脑SD200」

1. 浪潮信息发布超节点AI服务器"元脑SD200"，将64张卡融合成统一内存、统一编址的超节点，能同时运行DeepSeek R1、Kimi K2等四大国产开源模型；

2. 产品采用3D Mesh开放架构，通过远端GPU虚拟映射技术实现地址空间扩增8倍，整机可实现4TB显存与64TB内存，满足超万亿参数大模型推理需求；

3. 推理性能实现超线性扩展，64卡一同运行DeepSeek R1时性能提升达3.7倍，Kimi K2达1.7倍，专为解决Agentic AI带来的计算与通信需求爆发设计。

三、智谱发布GLM-4.5技术报告，从预训练到后训练细节公开

1. 智谱发布GLM-4.5技术报告，详细揭示预训练与后训练细节及开源强化学习框架slime，首次在单模型中实现推理、编码和智能体能力原生融合；

2. GLM-4.5采用MoE架构和深层"瘦高"结构设计，通过多阶段训练从15T通用数据和7T专业数据，再到多任务中期训练，提升长上下文和智能体能力；

3. 在12项ARC(智能体、推理、代码)基准测试中表现优异，超越Claude Opus 4等闭源顶尖模型，在AIME 24和SciCode上甚至超过OpenAI o3。

四、昆仑万维发布新模型 SkyReels-A3，开启五天技术发布周

1. 昆仑万维发布基于DiT视频扩散模型的SkyReels-A3，能生成长达一分钟的高质量数字人视频，专门优化手部动作交互、运镜控制和美感表达；

2. 该模型使用改进的插帧方法和ControlNet镜头控制模块，解决了AI视频长时间稳定性和多种专业运镜控制问题，打破了固定机位的呆板视觉效果；

3. 这是昆仑万维五天技术发布周的第一款产品，未来还将发布多个涵盖多模态AI核心场景的前沿模型，模型已上线SkyReels官网Talking Avatar工具。

五、「CubeMe-小小的我」接入腾讯混元，更强 3D 生成能力

1. 创想三维与腾讯云达成战略合作，旗下AI建模平台MakeNow接入腾讯混元大模型，为"CubeMe-小小的我"等工具提供增强3D生成能力；

2. 腾讯混元3D v2.5采用业界首创稀疏3D原生架构，实现可控与超高清3D生成能力的飞跃，模型几何分辨率达1024³级，纹理贴图分辨率达4K；

3. MakeNow平台通过接入混元3D能力，用户可通过上传照片五分钟内获得可打印的Q版人物手办，支持三种风格模型并可通过提示词微调个性化表达。

六、阿里开源 VLA 模型、世界理解模型与机器人上下文协议

1. 阿里达摩院开源三款具身智能核心组件：视觉-语言-动作模型RynnVLA-001-7B、世界理解模型RynnEC及机器人上下文协议RynnRCP；

2. RynnRCP是首个机器人上下文协议，可打通从传感器数据采集、模型推理到机器人动作执行的完整工作流，已支持Pi0、GR00T N1.5等多款热门模型；

3. RynnVLA-001基于视频生成和人体轨迹预训练，能从第一人称视角视频学习人类操作技能，RynnEC则将多模态大语言模型引入具身世界，仅靠视频序列建立连续空间感知。

七、百川智能第二款医疗增强大模型Baichuan-M2正式上线

1. 百川智能发布32B参数医疗增强大模型Baichuan-M2，在OpenAI的HealthBench评测中击败包括gpt-oss-120b在内的所有开源模型，仅次于GPT-5；

2. 模型核心技术包括Large Verifier System验证系统、患者模拟器、中期训练和多阶段强化学习，让模型严格遵循中国医疗指南并适配本土临床场景；

3. 医疗推理能力增强的同时保持通用能力，4bit量化后可在RTX4090单卡部署，成本比DeepSeek-R1 H20双节点部署降低57倍，已适配国产芯片。

前沿科技

八、灵巧智能的柔性灵巧手，「柔性」驾驭「刚性」的技术路线

1. 灵巧智能展示22个自由度高灵巧度机器人手DexHand021 Pro，通过双绳绳驱技术精确模拟人手功能，实现对拇指的"对指"等高级操作；

2. 产品采用"串并混联的双绳正反向刚柔耦合驱动"设计，解决传统灵巧手遇到的摩擦损耗、预紧力稳定性和系统集成复杂度问题；

3. 在260×86×50mm手掌空间内集成12个电机、全关节位置传感、多点阵力传感和高速通讯系统，四指单指负载>1kg，大拇指>2kg，抓握负载>5kg，成本比同类产品低十倍。

报告观点

九、 GPT-5 = Scaling Law失效？毕树超：永远有效，客观规律

1. 前OpenAI多模态后训练负责人Shuchao Bi认为，Scaling Law不会失效，失效的是数据，因为它反映的是数据内在结构和客观规律；

2. Bi指出数据、效率、探索和安全是通往AGI路上的核心问题，强调Scaling Law源于数据分布的幂律特性，这解释了为何模型能力并非平滑增长；

3. 解决方案是通过强化学习将计算资源转化为新知识和数据，建立"生成-验证-学习"的正向飞轮，用可验证任务驱动模型探索与进化。

十、 2025全球大模型应用报告：用户脚踏4.7条船！忠诚度低

1. 最新调研显示45%企业已将大模型部署到生产环境；关于付费，32%仅构建定制化模型，27%仅通过API购买服务，16%的受访者是白嫖党；

2. 用户大多同时使用多家大模型，平均使用4.7家不同产品，显示红海竞争下品牌粘性低；ChatGPT保持领先，谷歌Gemini与DeepSeek进步最快；

3. 55%受访者接受中国产大模型但要求部署在中国以外，大模型训练硬件市场英伟达占据78%绝对优势，可靠性、成本和智能水平仍是AI落地三大阻碍。

👇加入AGI数据库，AI智能问答

👇订阅下方合集，获取每日推送

标签：腾讯速递智能体研究院昆仑万维

腾讯研究院AI速递 20250812

相似文章

资讯分类

相关品牌

热门资讯

热门标签

热门产品