腾讯研究院AI速递 20250626
发布时间:2025-06-26 00:01 浏览量:1
生成式AI
一、 谷歌Gemini 家族新成员,机器人上本地运行的具身智能来了
1. Gemini Robotics On-Device是首个能在机器人本地运行的视觉-语言-动作模型,无需网络连接,适用于延迟敏感型应用;
2. 该模型可执行高度灵巧任务如拉开拉链、折叠衣物,展现出优于其他本地模型的泛化性能和多步骤指令处理能力;
3. 仅需50-100个演示即可适应新任务,能跨平台泛化到不同机器人如Franka FR3和Apollo人形机器人。
二、 谷歌 Imagen 4 / Ultra 上线 AI Studio!将集成 Jules 和 MCP
1. 谷歌将最新的Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API,普通版每张约4美分,Ultra版约6美分,生成速度接近实时;
2. Imagen 4 Ultra对prompt理解更精准,能生成高质量图像,支持每次生成最多四张1024×1024的图片,测试显示能生成逼真的超现实场景;
3. 谷歌AI Studio未来将整合MCP服务器功能和Jules SWE Agent,界面也将更新,提供更统一的工作流和复杂操作能力。
三、 消息称OpenAI秘密开发文档协作工具,直击微软Office腹地?
1. OpenAI正在开发ChatGPT文档协作功能,使用户能在平台上共同编辑文档并进行聊天交流,直接挑战微软Office和Google Workspace;
2. 这项功能是Sam Altman将ChatGPT打造为"超级智能工作助手"战略的一部分,可能进一步扩展至文件存储等生产力功能;
3. OpenAI已推出Canvas功能作为第一步,预计到2030年企业订阅ChatGPT将带来约150亿美元收入,但这可能加剧与最大股东微软的竞争关系。
四、 惊艳的艺术界「时空旅行」,一家名为ODDY工作室脑洞作品
1. AI技术复活世界名画与艺术家走秀视频爆红,ODDY工作室创作的《名作艺术秀》将梵高、达利、蒙娜丽莎等经典艺术元素以时装秀形式呈现;
2. 视频重现多位艺术巨匠及其作品:梵高的《星夜》、波提切利的《维纳斯诞生》、克里姆特的《吻》、达利的超现实主义等,让艺术跨越时空界限;
3. 最后场景中梵高、达利、莫奈、达芬奇等艺术大师同台相拥谢幕,这场AI视觉盛宴不仅完美还原艺术作品细节,更引发观众情感共鸣与泪目。
五、 AI新物种TicNote,3mm的「随身AI大脑」可吸附在手机上
1. 出门问问推出全球首款Agentic AI硬件TicNote,3mm超薄设计可磁吸手机背面,支持120+语言转写,精度达98%;
2. 搭载Shadow AI智能体,能自动总结、生成思维导图,20小时超长续航,适用会议记录、课堂笔记等多场景;
3. 产品展现"软硬结合+AI"战略成果,将Agent技术落地实用化,为职场人提供高效AI助手。
六、 AI出海黑马 Readdy.ai:如何通过界面之美,铸就爆发式增长
1. AI设计工具Readdy.ai上线4个月实现近500万美元ARR,成为增长最快的AI出海应用之一,借助短视频在TikTok等平台病毒式传播;
2. 产品成功关键在于生成界面质量超高,平衡专业设计规范与美学表现,让用户只需简单文本描述即可获得高完成度UI设计;
3. 背后团队是打造蓝湖和MasterGo的中国顶尖设计工具团队,以产品驱动增长策略,专注解决"无需设计基础也能产出专业界面"的痛点。
七、 Delphi拿下了红杉领投的1600万美元A轮,要做数字永生
1. AI创业公司Delphi获红杉领投1600万美元A轮融资,创建数字化身让用户在赛博世界"永生",已有情感导师靠此年入百万;
2. 创始人Ladjevardian的初衷是为中风无法说话的爷爷创建"数字大脑",将其回忆录中的智慧数字化,实现数字疗愈;
3. Delphi提供多级订阅服务,可复制用户语言风格、知识体系和表达方式,用户可对每次对话收费并获85%以上收入,吸引作家、教练、投资人等创建数字思维扩展影响力。
八、 阿里云平台开发者们的「Agent应用」可直接获取用户打赏
1. 阿里云百炼平台与支付宝合作推出"AI打赏"功能,开发者的Agent应用可直接获取用户打赏,金额转入开发者个人支付宝账户;
2. 开发者只需两步即可配置打赏功能:开启"支付宝AI收"功能并为Agent完成"赞赏卡片"配置,平台随机生成10元以内打赏金额;
3. 百炼平台已有超10万开发者创建了30多万个Agent,未来将支持在任意渠道发布Agent并实现变现,为开发者创造创造收益方式。
前沿科技
九、 Biomni通用生物医学Agent,可由「任务」自主生成工作流
1. 斯坦福、基因泰克等机构联合开发通用生物医学AI智能体Biomni,能自主执行跨领域研究任务,无需预定义工作流程;
2. Biomni由两部分组成:Biomni-E1(统一生物医学环境,包含150个专用工具、105个软件和59个数据库)和Biomni-A1(智能体架构,结合大语言模型推理与代码执行);
3. 系统在遗传学、基因组学等领域表现出色,能分析可穿戴设备数据、处理复杂RNA数据并自主设计实验方案,已上线免费使用,有望加速生物医学研究创新。
报告观点
十、 对话Linux基金会创始人:AI基模都将开源,战场在应用端
1. Linux基金会执行董事Jim Zemlin认为AI基础模型终将全面开源,真正的竞争将转向应用层,DeepSeek证明了小公司也能开发出媲美顶级闭源模型的产品;
2. 开源模式能吸引顶尖人才共同创新,调查显示开发者参与开源的首要动机是"完成工作"而非金钱,这种协作能带来闭源难以企及的创新速度;
3. AI开源与传统软件开源的区别在于需要共享数据、模型权重等多层次组件,而非仅代码;未来公司的竞争优势将体现在用户体验、专业服务等应用层面,而非基础模型本身。
👇加入AGI数据库,AI智能问答
👇订阅下方合集,获取每日推送