腾讯研究院AI速递 20250812
发布时间:2025-08-12 00:01 浏览量:1
生成式AI
一、 马斯克旗下的xAI宣布,Grok 4向全球所有用户免费开放
1. xAI宣布Grok 4向全球所有用户免费开放,但每12小时限制使用5次,达到限制后Grok完全不可用;
2. 此举被认为是为了跟进GPT-5的发布策略,但引发付费用户强烈不满,认为订阅费被"背刺";
3. 同时Grok Imagine视频生成服务更新,新增视频分享功能、修复下载问题并增加静音控制,增强了图片审核机制。
二、 浪潮发布面向万亿参数的超节点AI服务器「元脑SD200」
1. 浪潮信息发布超节点AI服务器"元脑SD200",将64张卡融合成统一内存、统一编址的超节点,能同时运行DeepSeek R1、Kimi K2等四大国产开源模型;
2. 产品采用3D Mesh开放架构,通过远端GPU虚拟映射技术实现地址空间扩增8倍,整机可实现4TB显存与64TB内存,满足超万亿参数大模型推理需求;
3. 推理性能实现超线性扩展,64卡一同运行DeepSeek R1时性能提升达3.7倍,Kimi K2达1.7倍,专为解决Agentic AI带来的计算与通信需求爆发设计。
三、 智谱发布GLM-4.5技术报告,从预训练到后训练细节公开
1. 智谱发布GLM-4.5技术报告,详细揭示预训练与后训练细节及开源强化学习框架slime,首次在单模型中实现推理、编码和智能体能力原生融合;
2. GLM-4.5采用MoE架构和深层"瘦高"结构设计,通过多阶段训练从15T通用数据和7T专业数据,再到多任务中期训练,提升长上下文和智能体能力;
3. 在12项ARC(智能体、推理、代码)基准测试中表现优异,超越Claude Opus 4等闭源顶尖模型,在AIME 24和SciCode上甚至超过OpenAI o3。
四、 昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周
1. 昆仑万维发布基于DiT视频扩散模型的SkyReels-A3,能生成长达一分钟的高质量数字人视频,专门优化手部动作交互、运镜控制和美感表达;
2. 该模型使用改进的插帧方法和ControlNet镜头控制模块,解决了AI视频长时间稳定性和多种专业运镜控制问题,打破了固定机位的呆板视觉效果;
3. 这是昆仑万维五天技术发布周的第一款产品,未来还将发布多个涵盖多模态AI核心场景的前沿模型,模型已上线SkyReels官网Talking Avatar工具。
五、 「CubeMe-小小的我」接入腾讯混元,更强 3D 生成能力
1. 创想三维与腾讯云达成战略合作,旗下AI建模平台MakeNow接入腾讯混元大模型,为"CubeMe-小小的我"等工具提供增强3D生成能力;
2. 腾讯混元3D v2.5采用业界首创稀疏3D原生架构,实现可控与超高清3D生成能力的飞跃,模型几何分辨率达1024³级,纹理贴图分辨率达4K;
3. MakeNow平台通过接入混元3D能力,用户可通过上传照片五分钟内获得可打印的Q版人物手办,支持三种风格模型并可通过提示词微调个性化表达。
六、 阿里开源 VLA 模型、世界理解模型与机器人上下文协议
1. 阿里达摩院开源三款具身智能核心组件:视觉-语言-动作模型RynnVLA-001-7B、世界理解模型RynnEC及机器人上下文协议RynnRCP;
2. RynnRCP是首个机器人上下文协议,可打通从传感器数据采集、模型推理到机器人动作执行的完整工作流,已支持Pi0、GR00T N1.5等多款热门模型;
3. RynnVLA-001基于视频生成和人体轨迹预训练,能从第一人称视角视频学习人类操作技能,RynnEC则将多模态大语言模型引入具身世界,仅靠视频序列建立连续空间感知。
七、 百川智能第二款医疗增强大模型Baichuan-M2正式上线
1. 百川智能发布32B参数医疗增强大模型Baichuan-M2,在OpenAI的HealthBench评测中击败包括gpt-oss-120b在内的所有开源模型,仅次于GPT-5;
2. 模型核心技术包括Large Verifier System验证系统、患者模拟器、中期训练和多阶段强化学习,让模型严格遵循中国医疗指南并适配本土临床场景;
3. 医疗推理能力增强的同时保持通用能力,4bit量化后可在RTX4090单卡部署,成本比DeepSeek-R1 H20双节点部署降低57倍,已适配国产芯片。
前沿科技
八、 灵巧智能的柔性灵巧手,「柔性」驾驭「刚性」的技术路线
1. 灵巧智能展示22个自由度高灵巧度机器人手DexHand021 Pro,通过双绳绳驱技术精确模拟人手功能,实现对拇指的"对指"等高级操作;
2. 产品采用"串并混联的双绳正反向刚柔耦合驱动"设计,解决传统灵巧手遇到的摩擦损耗、预紧力稳定性和系统集成复杂度问题;
3. 在260×86×50mm手掌空间内集成12个电机、全关节位置传感、多点阵力传感和高速通讯系统,四指单指负载>1kg,大拇指>2kg,抓握负载>5kg,成本比同类产品低十倍。
报告观点
九、 GPT-5 = Scaling Law失效?毕树超:永远有效,客观规律
1. 前OpenAI多模态后训练负责人Shuchao Bi认为,Scaling Law不会失效,失效的是数据,因为它反映的是数据内在结构和客观规律;
2. Bi指出数据、效率、探索和安全是通往AGI路上的核心问题,强调Scaling Law源于数据分布的幂律特性,这解释了为何模型能力并非平滑增长;
3. 解决方案是通过强化学习将计算资源转化为新知识和数据,建立"生成-验证-学习"的正向飞轮,用可验证任务驱动模型探索与进化。
十、 2025全球大模型应用报告:用户脚踏4.7条船!忠诚度低
1. 最新调研显示45%企业已将大模型部署到生产环境;关于付费,32%仅构建定制化模型,27%仅通过API购买服务,16%的受访者是白嫖党;
2. 用户大多同时使用多家大模型,平均使用4.7家不同产品,显示红海竞争下品牌粘性低;ChatGPT保持领先,谷歌Gemini与DeepSeek进步最快;
3. 55%受访者接受中国产大模型但要求部署在中国以外,大模型训练硬件市场英伟达占据78%绝对优势,可靠性、成本和智能水平仍是AI落地三大阻碍。
👇加入AGI数据库,AI智能问答
👇订阅下方合集,获取每日推送