我给豆包,加了个绿色按钮… 由此,聊聊人机协作的设计

发布时间:2025-06-27 15:52  浏览量:1

前几天,豆包上线了「AI 客」

给一个PDF,或网址链接,就会生成一段播客 (双人相声)

比如说,我的这篇月度总结《 围城:模型困局、垂类竞速与 Agent 逐鹿|赛博月刊 2506

可以听一下:产品非常好,效果非常不错

用了几次之后,我还是关掉了页面:
我很难每天手动打开网站、传一份PDF,再坐那听

这让我想起一个更深层的问题:
为什么很多优秀产品,最后进了收藏夹?

故事由此开始

00|AI 播客的悖论

先聊聊 AI 播客:NotebookLM 的播客功能爆火后,几乎每家大厂都在跟进,甚至很多创业公司都推出了类似产品

技术门槛看起来不高,用户需求似乎也很明确: 把文字内容,转成可听的播客

但奇怪的是,这么多团队做了这么久,AI 播客却一直没有真正火起来,背后的困局非常有趣。

第一重困局:时间错位

人什么时候会听播客?
以我自己为例,临上飞机之前,还会缓存一批音频

类似的场景呢?
通勤路上、跑步时、做家务时——这些时候,你根本没办法主动去生成一个播客

小恐龙啊~小恐龙

第二重困局:内容孤岛

每个播客产品,都想做闭环

你要在我的平台上传内容,在我的平台上生成,在我的平台上收听。

而用户的内容,则散落在各处,比如微信、邮件、PDF、网页、笔记软件...

用户很难为了听一个播客,把各种内容,从不同平台搬到你的产品。

除此之外,AI 播客产品之间无法互通 。在 A 平台生成的播客,无法在 B 平台播放;在 C 平台整理的内容,无法在 D 平台转换 每个产品,都在自建围墙

最后,用户要么不用,要么只能选择一个平台把所有内容都搬过去 但搬运成本太高,大多数人选择了不用

第三重困局:习惯断层

用户听播客的习惯,很早之前就已经被 Spotify、Apple Podcasts、小宇宙这些平台深度绑定

从习惯的角度: 大家会在通勤路上打开熟悉的播客app,看到订阅列表,点击最新一期

AI 播客呢?
要求用户在想听播客的时候,先回忆起几天前生成的那个内容在哪里

同时,AI 生成的播客没有连续性
传统播客有主播、有风格、有更新节奏,用户会形成订阅习惯

用户想看到的
是比如「《屠龙之术》第114514期」

这便是我看到的 三重困局:时间错位、内容孤岛、习惯断层

所以呢?或许...
播客要被嵌入到一个流程之中,而不是独立存在

01|The Information

再说个背景,我订阅了《The Information》,一个很棒的科技媒体付费刊物

The Infomation 首页很贵的定价

另一方面,豆包的 AI 播客功能恰好提供了另一种入口:
只要投喂文字,就能生成“可听的内容”

灵机一动: 中间的人工步骤,能否省略?

于是,我魔改了豆包,让它多了个【The Infomation】

02|背后的思路:避免摩擦

在之前的流程里:

打开The Information →
登录 →
找到当天文章 →
下载为PDF →
上传至豆包 →
点击生成 →
播放播客

在这个链路中,每一步都不难:登录只需要几秒,下载PDF也就点个按钮,上传文件更是拖拽即可

但问题在于: 当这些简单的步骤组合到一起后,用户行为就断了

对此,有个「 微小摩擦力 」理论:
即使动机很强,如果执行的摩擦力过大,行为依然不会发生

真的,每天早上我需要主动打开两个网站,主动完成一系列操作,太难了

于是,这里写了一个脚本,搭配 Tampermonkey 插件,在豆包网页版加了一个绿色按钮:「The Information」

整个流程被压缩成了: 打开豆包 → 点一下绿色按钮 → 播客自动生成 → 开始听

03|从工具到嵌点

这个小改造,让我开始思考另一个问题

有没有一种形式,可以:
在不打扰用户前提下,让 AI 与人协作?

现在的 AI 产品,很多会强调自己有多智能、多全能:

我能做 PPT、我能发小红书、我能剪视频...
反正我都可以,都用我

AI 真正需要的,只是一个按钮、一次默认行为,就能触发它做完一件不需要人主动决策的事

亦或许,豆包提供的,除了“AI 助手”外,还可以是一系列「嵌点」

对于嵌点,想想这些:

这些成功交互,形态都有一个共同特征:
并非独立存在的,而是嵌入用户路径之中

对了,「嵌点」这个词没听过?
没关系,我现编的

04|AI 要顺手

用户不会主动想起用 AI

我们的世界,何尝不是一只猫?

这并不是坏事,对于经验和刻板印象的依赖,会帮助我们节省太多的精力,比如:

这种依赖一旦形成,再想改变,就需要极大的推动力

你看,很多人还在用 Windows XP,或者 Word 2003

还有很多教程,教你如何保存成「.doc」

每一个新学的东西,都是对既有记忆的背叛

划词翻译

差别在哪?
后者没有打断你的阅读流程, 结构能插得上,比功能是否足够强更重要

再想一想
很多公司,都有所谓的内部交流工具,功能异常齐全。但还是拦不住大家用微信

为什么?
微信已经是人们生活的一部分, 切换成本太高,难以推动

05|利用嵌点

大多数产品,并不缺界面,而缺嵌点

我们每天使用的产品中,充满了“未被使用的触发位”

这些位置就像城市中的黄金地段,位置绝佳,人流量大,但还没有被合理开发,让我们看看这些潜在的嵌点:

报告页面的顶部

邮件阅读完之后

协作文档的侧边栏

视频播放器的进度条

我们看到很多的海外信息,截图都是中文的

在这个功能没有之前,你得把 Twitter 内容复制出来、打开翻译软件、粘贴、看译文...然后...你忘了它讲啥

而现在?一个小小的"翻译推文"按钮,让全球信息的流通变得无比顺畅

这就是 嵌点的力量

而豆包呢?也可以成为能力提供者 ,把AI能力嵌入到各种产品的关键节点上

06|Less is More

很多产品会强调:能做什么
另一个问题也该被思考: 何时出现

产品经理会假设:
用户会主动来找AI

在现实之中:
用户总在正忙自己的事,才不管你 AI

用户和产品经理,并不在同一个视角

电力改变了人类文明,并嵌入到了每个地方:墙上的插座、手中的充电器、街边的路灯...到处都是电
我们使用电力时,想的不是“我在用电”,而是“我要开空调”、“我要给手机充电”

同样的还有互联网:
小时候,我们会说“去上网”,但现在没人说了,因为我们时刻都在网上

相信,豆包里的这些功能,都会变得无感

它不应该试图替代你正在使用的工具,而是让既有工具变得更好用
它不应该改变你的工作流程,而应该让你的工作流程更顺畅

技术的价值,不仅在于先进,而在于它能自然融入
当技术隐身之后,才是它的魅力时刻