GPT-8能治愈癌症?阿尔特曼最新万字采访,揭秘AI发展4大瓶颈
发布时间:2025-08-16 14:15 浏览量:2
智东西8月16日消息,上周,OpenAI发布了万众瞩目的新一代旗舰模型GPT-5,紧跟着OpenAI联合创始人兼CEO Sam Altman就现身Cleo Abram的播客,讲述了他认为的GPT-5的突破、AI技术突破的4大瓶颈、预测2027年底AI会发现重大科学突破,还断言GPT-8也许可以找到治愈癌症的方法。
以下是本次访谈播客的重点内容:
1、GPT-5的核心突破:在编程、写作和复杂问题解决上实现升级,能即时生成专业级软件,并支持实时迭代更新。
2、AI是“双刃剑”:ChatGPT既可能让人们偷懒不再思考,也可能通过增强记忆等功能扩展人类认知边界,关键在于工具设计如何引导用户行为。
3、超级智能的定义:当AI系统在核心领域持续超越人类顶尖专家时,即迈入超级智能阶段,这一进程可能比预期更快。
4、真实的标准在浮动:未来社会的人们将逐渐接受AI生成内容。
5、就业市场会发生颠覆变化,但社会具有韧性:未来将涌现难以想象的新职业,个人创业门槛因AI工具大幅降低。
6、AI面临四大发展瓶颈:算力、数据、算法优化和产品化。
7、2027年底会有AI驱动的重大科学发现:通用模型可能在2027年底实现重大科学突破,关键瓶颈是从“分钟级任务”扩展到“千小时级”复杂研究的能力。
8、AI或许将主导药物开发:GPT-5已显著提升医疗建议准确性,未来或实现“AI主导药物研发”,GPT-8或许将治愈癌症。
9、社会契约需要重构:需建立AI算力分配新机制,避免资源争夺战。
10、开发者的责任悖论:行业仍存在“一边预警灭绝风险一边全力开发”的认知割裂现象。
以下是阿尔特曼的访谈实录(智东西在不改变原意的前提下,进行了一定程度的增删修改):
01.7秒做出一个贪吃蛇小游戏,GPT-5可以几乎即时地按需创建软件
Cleo Abram:从你最近的声明说起,你不久前说过GPT-4将是我们所有人必须使用的最“笨”的模型。但GPT-4已经在SAT、LSAT和GRE等考试中表现优于90%的人类,它还能通过编程考试、品酒师考试和医疗执照考试,而现在你们刚刚发布了GPT-5。GPT-5能做哪些GPT-4做不到的事情?
Sam Altman:首先,一个重要的结论是:你可以拥有一个能完成所有这些惊人任务的人工智能系统,但它显然无法复制人类擅长的诸多事情。我认为这一点说明了SAT考试或其他测试的价值所在。
不过,我想如果我们在GPT-4发布当天进行这场对话,告诉你GPT-4在这些方面的表现,你或许会说“天啊,这将对很多工作以及人们要做的事情产生巨大影响,其中也包括一些负面影响”。而你当时可能预测到的一些积极影响,至今尚未成为现实。因此,这些模型所擅长的领域,并不能涵盖我们需要人类去做或关心的其他许多事情。
我想,同样的情况会在GPT-5身上再次上演。人们会对它的能力感到震惊,它在很多方面的确非常出色,人们会借助它完成各种不可思议的任务。它将改变众多知识型工作、我们的学习方式以及创作方式,而人类社会会与之共同进化,对更优质的工具有着更高的期待。
没错,我认为这个模型在很多方面都极为出色,在其他方面仍存在局限。但事实上,对于那些可能需要某个领域专家来完成、或者连专家都觉得棘手的3分钟、5分钟乃至1小时的任务,如今你口袋里的一个软件就能全部搞定,这真的非常惊人。
我认为这在人类历史上任何时期都前所未有的:一项技术能在如此短的时间内取得如此巨大的进步。我们现在拥有了这个工具,正在亲身体验它,并逐步去适应。但如果回到5年或10年前,告诉人们这个东西即将出现,我们可能会觉得难以置信。
我最兴奋的一点是,这是第一个让我觉得可以提出任何棘手的科学或技术问题,并能得到相当不错答案的模型。
我可以举一个有趣的例子:我上初中或高中时,有了一个TI83——那种老式的图形计算器,我花了很长时间在上面制作了一个叫“贪吃蛇”的游戏。我当时很擅长做这个,虽然那个游戏挺傻的,但在TI83上编程非常麻烦,既费时间,调试起来也很困难。
出于一时兴起,在早期版本的GPT-5上,我想试试它能不能制作一个TI83风格的“贪吃蛇”游戏。当然,它在7秒内就完美完成了。然后我想,11岁的自己会觉得这很酷吗?还是会怀念当初制作游戏的那个过程?
我大概用了3秒钟思考这是好事还是坏事,紧接着就立刻想到,其实我现在想给这个游戏加一个超棒的新功能。我把这个想法输进去,它马上就实现了,游戏实时更新好了。之后我说,其实我希望它是这个样子的,实际上我想做这个。
那一刻,我有种特别像11岁时编程的体验,能够如此快速地表达想法、尝试不同事物,还能实时互动。我心想“天啊,我刚才还在担心孩子们会错过在这种‘石器时代’学习编程时的那种摸索过程”,但现在我只为他们感到兴奋,因为人们将能借助这些新工具进行创造,而你将想法变为现实的速度,实在是相当惊人。
所以,关键在于,GPT-5不仅能为你解答所有这些难题,还能几乎即时地按需创建软件。我认为这会是GPT-5时代的一个决定性特征,而这是GPT-4时代所不具备的。
02.GPT等AI工具将增加人们的认知“张力时间”
Cleo Abram:当你谈论这个的时候,我想到了举重里的一个概念 ——“张力时间”。你可以用3秒完成100磅的深蹲,也可以用30秒完成同样的深蹲,后者能让你收获更多。我想到我们的创作过程,以及自己感觉做出最好成果的那些时刻,会发现这需要大量的认知 “张力时间”。
我觉得这种认知 “张力时间” 至关重要,这事儿其实有点讽刺——这些工具的开发本身就耗费了巨大的认知 “张力时间”,但在某些方面,人们或许会说,他们在某种程度上把这些工具当成了逃避思考的 “逃生舱”。你可能会说,我们对待计算器也曾是这样,后来只是转向了更难的数学问题。那你觉得这其中有什么不同?又怎么看待这个问题呢?
Sam Altman:这与计算器不同,显然有些人使用聊天机器人并非为了思考,而另一些人则借助它进行了比以往任何时候都更多的思考。 我希望我们能够以一种鼓励更多人借助它来稍微拓展思维、完成更多事情的方式来打造这个工具。
我认为社会是一个充满竞争的地方,理论上讲,如果你给人们新的工具,他们或许能减少工作量,但实际上,人们似乎反而工作得更努力了,而对人们的期望也只会越来越高。
所以我的推测是,和其他工具、其他技术一样,有些人会借助它做得更多,有些人则会做得更少。但对于那些想通过ChatGPT来增加认知“张力时间”的人来说,他们确实能够做到这一点。
我从ChatGPT中最活跃的5%用户身上获得了很多启发,看到他们学习、做事和产出的数量,实在令人惊叹。
Cleo Abram:所以我只用了GPT-5几个小时,我一直在玩。
Sam Altman:到目前为止你觉得怎么样?
Cleo Abram:我还在学习如何与它互动。有意思的是,我觉得我刚学会如何使用GPT-4,现在又在尝试学习如何使用GPT-5。我很好奇你发现的最有趣的具体任务是什么,因为我想你已经使用它一段时间了。
Sam Altman:最让我印象深刻的是编码任务。它在很多其他方面也表现出色,但这个AI能为任何需求编写软件,这意味着你可以用全新的方式表达想法。 AI能够完成非常高级的任务,由于GPT-5在编程方面极为出色,感觉它几乎无所不能。当然,它无法在物理世界中直接做事,但它能让计算机执行极为复杂的操作,进而可以操控机器实际完成一些任务。 所以,这一点对我来说最引人注目。
它在写作方面也有了很大进步。我们在GPT-5中仍然会使用破折号,很多人也喜欢这种用法,但GPT-5的写作质量确实好了很多。
当然,我们还有很长的路要走,也希望能进一步改进它。但我们从OpenAI内部听到很多人说,当他们开始使用GPT-5时,虽然知道它在所有指标上都更出色,却有一种难以准确描述的微妙品质。可后来当他们不得不回到GPT-4测试某些内容时,就感觉非常糟糕。
我不知道这到底是什么原因,但我猜测,部分原因在于GPT-5的写作风格感觉更加自然。
03.阿尔特曼预言:到2027年底,会出现由AI驱动的重大科学发现
Cleo Abram:在准备这次采访时,我联系了几位AI和技术领域的其他领导者,收集了一些问题要问你。所以下一个问题来自Stripe CEO Patrick Collison,是关于下一阶段的:“GPT-5之后是什么?你认为在哪一年大型语言模型会做出重大科学发现?目前缺少什么使得这还没有发生?”
他在这里提醒说,我们应该把数学和像AlphaFold这样的特殊案例模型放在一边,他特别询问像GPT系列这样的完全通用模型。
Sam Altman:我会说大多数人会同意这将在未来两年内的某个时候发生,但“重大”的定义非常重要。
有些人可能认为“重大”会在2025年初发生,有些人可能要等到2026年初,也许有些人要等到2027年底,但我敢打赌到2027年底,大多数人会同意已经有AI驱动的重大新发现,我认为缺少的只是这些模型的认知能力。
一位研究人员告诉我的一个分析框架,我非常喜欢。他说,一年前,我们的模型在基础的高中数学竞赛题上表现出色,这类题目或许需要专业数学家花几秒到几分钟来解答。
我们最近获得了国际数学奥林匹克(IMO)金牌,这是一项难度极高的数学竞赛,参赛者是世界上最顶尖的一小部分人。许多专业数学家甚至一道题都解不出来,而我们的模型达到了最高水平。这类竞赛中的数学题,可能需要数学家们一个半小时才能完成证明。
所以,我们的模型已经实现了从解答只需几秒的数学题,到解答人类需要几分钟、再到需要一个半小时才能证明的数学题的成长。而未来,我们或许还能证明新的重要数学定理——那些可能需要世界顶尖人才投入一千小时才能完成的工作。
我们正在接近这个目标,并且有一条通往该未来的路径:只需继续扩展模型即可。
04.超级智能就是以专家级人类的方式处理事情
Cleo Abram:你描述的长期未来是超级智能。这实际上意味着什么?我们如何知道我们已经实现了它?
Sam Altman:如果我们拥有一个系统,它能比整个OpenAI研究团队做出更好的研究,尤其是在AI研究领域 —— 比如,若我们愿意,我们可以说,“好吧,利用GPU的最佳方式,是让这个AI来决定我们应该运行哪些实验,它比 OpenAI 的整个智囊团还要聪明。”
要是同一个系统能比我更好地运营OpenAI,能在研究上超越最优秀的研究人员,在运营方面比我更出色,在其他各项工作上都比从事该工作的人更优秀,那么在我看来,这就是超级智能。
Cleo Abram:这句话在几年前听起来还像是科幻小说。而现在……
Sam Altman:它仍然有点像,但你可以透过迷雾看到它。
Cleo Abram:是的。所以听起来,你所说的这条路径上的一个步骤,就是迎来科学发现的时刻:提出更优的问题,以人类专家的方式处理事务,从而得出新的发现。
我一直在思考一件事:如果我们回到1899年,假设能给这样的系统输入截至当时所有的物理学知识,再让它稍作延伸,但不会超出这个范围,那么这样的系统会在何时提出广义相对论呢?
Sam Altman:一个有趣的问题是,如果我们往前看,想想我们现在所处的位置,假设我们再也无法获得任何新的物理学数据,那会怎样?
我们是否会期望一个真正优秀的超级智能仅通过全力钻研现有数据,就能在没有新粒子加速器的情况下解决高能物理问题?还是说,它需要建造新的设备并设计新的实验?
显然,我们不知道这个问题的答案。不同的人有不同的推测。但我怀疑,对于许多科学领域而言,仅仅靠更深入地思考现有数据是不够的,我们还需要建造新的仪器、开展新的实验,而这需要一定时间——就像现实世界本身既缓慢又复杂一样。
当然,我确定通过更深入地研究当前的科学数据,我们能取得更多进展。 但我推测,要实现重大突破,我们仍需建造新的机器并进行新的实验,这在本质上会带来一些进展上的延缓。
换个角度想,如今的AI系统非常擅长回答几乎所有问题。或者回到时间线的问题上,我们或许可以说,AI系统在处理一分钟就能完成的任务时表现得超越人类,但在处理需要上千小时的任务时,还有很长的路要走。
人类智能在应对这些长期任务时,似乎与AI系统存在很大差异。不过,我认为我们最终会解决这个问题,但就目前而言,这确实是AI的一个明显短板。
05.ChatGPT会通过记忆了解用户
Cleo Abram:下一个问题来自英伟达创始人兼CEO黄仁勋:事实是“是什么”,真相是它的意义,所以事实是客观的,真相是主观的,它们取决于视角、文化、价值观、信仰、背景。一个AI可以学习和知道事实,但一个AI如何知道每个国家、每种背景的每个人的真相?
Sam Altman:我一直感到惊讶,我想很多人也感到惊讶,AI在适应不同文化背景和个人方面如此流畅。
我最喜欢的一个功能,是今年早些时候在ChatGPT中推出的增强记忆功能。有了这个功能,我真的感觉自己的ChatGPT开始了解我了——了解我关心的事,了解我的生活经历和背景,以及那些让我成为今天的我的过往。
我有个朋友是ChatGPT的重度用户,在所有对话里分享了很多自己的生活内容。他让自己的ChatGPT做了一系列性格测试,还要求它模仿自己的风格回答,结果得出的分数和他本人实际测试的分数完全一样,尽管他从未真正聊过自己的性格。
而我的ChatGPT在这些年里也确实通过我谈论的文化、价值观和生活点滴,慢慢了解了我很多。我有时会用一个免费账户,就是想体验一下没有我的历史记录是什么感觉,那种体验真的很不一样。
所以我觉得,我们所有人都对AI在这方面的学习和适应能力感到惊喜。
Cleo Abram:所以你设想在世界许多不同地方,人们使用具有不同文化规范和背景的不同AI?
Sam Altman:我认为每个人都会使用相同的基本模型,但会有提供给该模型的上下文,使其以某种个性化的、他们的社区所希望的方式行动。
06.真实的标准是流动的
Cleo Abram:我认为当我们谈到这个关于事实和真相的想法时,这似乎是我们第一次时间旅行的好时机,我们要去2030年。这是一个严肃的问题,但我想用一个轻松的例子来问它。你看过哪个在蹦床上跳跃的兔子的视频吗?
Sam Altman:看过。
Cleo Abram:看起来像是后院兔子在蹦床上玩耍的视频,这个视频最近非常火爆。我认为人们反应如此强烈的原因是,这可能是人们第一次看到一个视频,享受它,然后后来发现它是完全由AI生成的。
在这次时间旅行中,如果我们想象在2030年,我们是青少年,正在滚动浏览2030年青少年会浏览的任何东西。我们如何分辨什么是真实的,什么不是真实的?
Sam Altman:我的意思是,我可以给出各种字面上的答案。我们可以加密,我们可以决定我们信任谁,如果他们真的拍摄了某些东西。但我的感觉,将要发生的事情是它会逐渐融合。
就像你今天从iPhone上拍的照片,它大部分是真实的,但有一点不是,有一些AI的功能在其中运行,以你不理解的方式让它看起来更好一点。
有时你会看到这些奇怪的事情,比如月亮,在那个相机传感器捕获的光子和你最终看到的图像之间有很多处理痕迹,但你已经决定它是足够真实的,或者大多数人决定它是足够真实的,我们已经接受了一些逐渐的变化,从光子击中相机胶片的时候开始。
就类似于你在Tik Tok上看一些视频,可能使用了各种视频编辑工具让它看起来比真实更好。或者整个场景是完全生成的,或者一些整个视频是生成的,就像蹦床上的那些兔子。
我认为“它必须有多真实才能被认为是真实”的门槛只会不断移动。
Cleo Abram:所以这有点像教育问题。
Sam Altman:没错。我的意思是,媒介向来都介于真实与不真实之间。比如我们看科幻电影,心里清楚那些情节并未真实发生;再比如看别人在Instagram上晒出的美丽度假照,或许照片是真实拍摄的,但你也知道,当时有很多游客排队等着拍同样的场景,这些都被巧妙地排除在画面之外了。
我觉得我们现在已经接受了这种情况,而且这会是一种长期趋势。
07.“从来没有一个时代,比现在更适合去创造”
Cleo Abram:我们要再穿越一次,比如2035年。AI领域的一些领导者说过,5年内一半的初级白领工作将被AI取代。对于那时候毕业的大学生来讲,你希望世界会是什么样子?
我认为有很多关于AI可能导致工作替代的讨论,但我也很好奇,因为我有一份10年前没人想到会存在的工作。如果我们在思考2035年,那些即将毕业的大学生,如果他们还会上大学的话,可能会非常不同。
Sam Altman:他们可能会离开去执行探索太阳系的任务,做某种全新的、令人兴奋的、高薪的、超级有趣的工作,并为我和你不得不做这种非常无聊的旧工作感到难过,一切都变得更好。
10年现在看起来很难想象,因为它太远了。如果你把当前的变化速度再复合10年,可能会变得非常难以想象。10年前很难想象现在的情况,但向前看10年将更加不同,变化更大。
Cleo Abram:那就5年,我们在2030年。我很好奇你认为这对年轻人来说会有什么短期影响。
像“一半初级工作被AI取代”这样的说法听起来与他们将要进入的世界非常不同,与我当时进入的世界不同。
Sam Altman:我认为某些类型的工作会完全消失,这总是会发生,而年轻人最擅长适应这一点。我更担心的是这对62岁不想再培训或重新学习的人意味着什么,而不是22岁的年轻人。
如果我现在22岁,刚大学毕业,我会觉得自己是历史上最幸运的孩子。从来没有一个时代,比现在更适合去创造,不管是去发明什么还是去创业。
我认为现在完全有可能创办一家单人公司,最终价值超过10亿美元,更重要的是,这样的公司还能为世界提供出色的产品和服务——这简直是件不可思议的事。
过去需要数百人团队才能动用的工具,如今你只需学会使用它们,再加上一个好点子就能驾驭,这实在太棒了。
08.AI有4个主要限制因素:计算能力、数据、算法设计和产品化
Cleo Abram:我认为观众能从你这里在节目中听到的最重要的内容可以分为两部分:
首先是战术层面:你实际是如何尝试构建世界上最强大的智能,以及这样做存在哪些限制因素?其次是哲学层面:你和其他人如何以真正帮助而非伤害人类的方式来构建这项技术?
现在我们只谈战术部分。在我看来,人工智能存在三个主要限制因素:一是计算能力,二是数据,三是算法设计。你目前如何看待这三个方面?如果想帮助人们理解他们可能会看到的下一批相关头条新闻,你会如何帮他们理清这一切?
Sam Altman:我会说还有第四个,那就是弄清楚要构建什么产品。科学进步本身如果不交到人们手中,效用非常有限,也不会以同样的方式与社会共同进化。
但如果让我来涵盖这几个方面的话,在计算领域,这无疑是我见过的规模最大的基础设施项目,甚至可能已是人类历史上规模最大、成本最高的项目。
整个供应链涉及芯片、内存和网络设备的制造,将这些组件装入服务器,再通过大型建设项目打造超大规模数据中心,还要想办法获取能源——这通常是限制因素之一——以及其他所有配套组件。 这个过程极其复杂且成本高昂,而我们目前仍在以定制化、一次性的方式推进。
最终,我们希望能设计出一个一体化的大型工厂,从一端投入沙子进行熔化,另一端就能输出完全成型的AI计算能力,但目前我们离这个目标还很远,整个过程依然极为复杂且耗费巨大。 我们正投入大量精力,尽可能地扩展计算能力并加快推进速度。
GPT-5推出后,需求必将再次激增,届时现有算力将无法满足需求,就像GPT-4刚推出时的情况一样——世界对AI的需求远超我们当前的供给能力,而构建更多计算能力是实现供需平衡的重要一环。
事实上,这也是我计划将大部分精力投入的事情——我们如何以更大规模构建计算能力,如何将GPU数量从数百万扩展到数千万、数亿,最终希望能达到数十亿,以满足人们对AI应用的需求。
09.AI的发展目前还受制于能源
Cleo Abram:当你思考这个问题时,在这个类别中你将要思考的重大挑战是什么?
Sam Altman:我们目前最受限于能源。如果你想运行一个千兆瓦级别的数据中心,要找到千兆瓦的电力有多难?短期内很难找到千兆瓦的可用电力。
我们还非常受限于处理芯片和内存芯片,如何将它们封装在一起,如何构建机架,然后还有一系列其他事情,比如许可证、建筑工作等。
但再次强调,我们的目标将是真正实现自动化。一旦我们建造了一些机器人,它们可以帮助我们进一步自动化,就像一个你可以基本上投入资金并输出一个预制数据中心的世界。如果我们能做到这一点,那将解开许多限制。
第二个类别是数据。这些模型已经变得极为智能,即便我们再给它一本物理教科书,它在物理领域的能力也只会有微小提升——说实话,GPT-5如今已经能很好地理解物理教科书中的所有内容了。
我们对合成数据充满期待,也对用户帮助我们创建越来越复杂的任务和环境感到兴奋,我认为数据的重要性将始终存在。
但我们正进入一个新阶段:模型需要学习的东西,在现有任何数据集中都不存在。如何教会模型去发现新事物?我们可以通过提出假设、测试假设、获取实验结果,再根据学到的内容进行更新。
然后是算法设计。我们在这方面取得了巨大进展,我认为OpenAI在全球范围内做得最好的一点,是建立了一种能实现重复重大算法研究突破的文化。
我们不仅弄清楚了后来成为GPT范式的核心原理,还探索出了推理范式的关键逻辑,现在正着手研究一些新的范式。想到未来还有数量级级别的算法突破在等待我们,我就感到无比兴奋。
我们刚发布了一个名为GPT-OSS的开源模型。它的智能水平与o4-Mini相当,却能在笔记本电脑上本地运行,这让我十分惊叹。
如果几年前你问我,这种智能程度的模型何时能在笔记本电脑上运行,我会说还需要很多年。但后来我们在算法上实现了一些突破,尤其是在推理领域,这让我们得以打造出这样一个能完成惊人任务的小型模型。这些突破是我工作中最有趣、也最酷的部分。
10.GPT-1曾经被嘲笑,未来几年还会有更大的发展
Cleo Abram:我可以看到你真的很享受思考这个问题。我很好奇对于那些不太了解你在说什么、不熟悉算法设计如何导致他们实际使用的更好体验的人。你能总结一下当前的状态吗?当你思考这个问题有多有趣时,你在想什么?
Sam Altman:GPT-1在当时提出的想法,曾被该领域许多专家嘲笑:我们可以训练一个模型玩一个小游戏——给它看一堆单词,让它猜测序列中的下一个单词,这被称为无监督学习。这种学习方式不需要明确标注“这是一只猫”“这是一只狗”,只是给它一些单词,让它预测下一个是什么。
而这样一个简单的任务,竟然能让模型学会那些极其复杂的概念,掌握关于物理、数学和编程的所有知识,全靠不断预测下一个单词——这在当时看来既荒谬又神奇,甚至不太可能成功。然而人类恰恰是这样学习的:婴儿开始听语言时,很大程度上是自己琢磨出其中含义的。
所以我们坚持做了,随后也意识到,只要扩大规模,模型的性能就会变得更好,但这需要在多个数量级上进行扩展。因此,GPT-1时代的模型表现并不出色,许多领域专家都表示:“哦,这太荒谬了,永远不会成功,也不会稳健。”
但我们掌握了所谓的“缩放定律”。我们认为:“好吧,随着计算能力、内存、数据等的增加,模型的性能会可预测地提升。我们可以根据这些预测来决定如何扩大规模,从而取得巨大成果。”
事实证明,这在多个数量级上都有效。而这一点在当时并不明显,我想这也是世界为之震惊的原因——因为这看起来是一个极不可能的发现。
另一个突破是,我们可以将这些语言模型与强化学习结合:告诉模型什么是好的、什么是坏的,以此教它如何推理。这一方法推动了o1、o3乃至现在GPT-5的发展。
如今我们正在尝试新的方向:已经弄清楚如何制作更好的视频模型,也在探索使用新型数据和环境来扩大规模的新方法。
我认为,5到10年后的情况很难预测,但在未来几年,我们面前会有一条非常平稳且强劲的扩展道路。
11.人们会很快适应AI带来的改变
Cleo Abram:我认为这已经成为一种公众叙事,我们正沿着从1到2到3到4到5的平稳路径前进,但幕后也确实不是线性的,它更混乱。告诉我们一些GPT-5之前的混乱,你们需要解决哪些有趣的问题?
Sam Altman:我们发布过一个名为Orion的模型,作为GPT 4.5的版本,它本身是个很酷的模型,但使用起来却很笨拙。
我们意识到,需要在模型基础上开展更多研究,于是便遵循了一条全新且更陡峭的缩放定律,只是当时并未真正深入理解其内涵。
通过这一尝试,我们在计算效率上获得了更好的回报,模型的推理能力也有所提升。但回过头来看,我们在对待数据集的思路上其实存在一些问题——毕竟这些模型确实需要做到足够大,才能从海量数据中学习。
所以,在日常工作中,你会做很多“U型转弯”:尝试一些方案,或者某个架构想法行不通就及时调整。但所有这些曲折探索叠加起来,最终却能实现指数级的平稳进步。
Cleo Abram:我总觉得有趣的是,当我坐在这里采访你关于你们刚刚发布的东西时,你已经在思考下一件事了。你能分享一些你正在思考的问题吗?如果我一年后回访你,可能会问到什么?
Sam Altman:你可能会问我,这个东西能去发现新科学意味着什么?世界应该如何思考GPT-6发现新科学?现在也许我们不会实现这一点,但它似乎触手可及。
Cleo Abram:如果你们做到了,你会说什么?这种成就的影响会是什么?假设你们成功了。
Sam Altman:我认为,这项技术带来的好的方面会非常出色,坏的方面会十分可怕,而那些奇怪的部分在一开始会显得格外怪异,但我们会很快适应它们。
所以,我们会感叹“哦,这太不可思议了,它被用来治愈疾病”,也会担忧“哦,像这样的模型被用来制造新的生物安全威胁,实在太可怕了”。此外,我们还会惊呼:天啊,看着世界变化如此之快,经济增长如此迅猛,这种令人头晕目眩的变化速度。
最终这也会像其他一切事物一样,被人类适应,人类有着适应任何程度变化的非凡能力。到那时,我们只会说“好吧,事情就是这样了”。
12.“今天出生的孩子永远不会比AI更聪明。”
Sam Altman:今天出生的孩子,永远不会比AI更聪明。
因为他们出生在AI已经十分智能的时代,当他们开始理解世界的运作方式时,早已习惯了事物以惊人的速度迭代改进,新的科学发现也在飞速更新。
他们将永远不会知道没有AI的世界是什么模样,对他们而言,AI的存在会无比自然。
在他们看来,我们如今使用计算机、手机,或是任何不如人类聪明的技术,都会像身处难以想象的“石器时代”。就像我们现在回看2020年代的生活,会觉得那时的人们过得并不如意一样。
但当你适应了AI的存在,你就不会再去做AI可以帮你做到的事情,所以我说今天出生的孩子永远不会比AI更聪明。
Cleo Abram:我在考虑要孩子。
Sam Altman:你应该要,这是最好的事情。
Cleo Abram:我知道你刚有了第一个孩子,你刚才说的这些会如何影响我在那个世界里对养育孩子的思考?你会给我什么建议?
Sam Altman:可能和几万年来你养育孩子的方式没什么不同。爱你的孩子,向他们展示世界,支持他们想做的任何事情,教他们如何做一个好人,这可能才是最重要的。
Cleo Abram:这听起来有点像,比如在你设想的那个世界里,人们可能不会去上大学,反而会有更多选择;也正因为有了更多选择,他们会更有能力去说“我想建造这个”——而这正是能为他们提供帮助的超级工具。
Sam Altman:是的,我希望我的孩子认为我过着非常受限的生活,而他有这个令人难以置信的无限画布可以做任何事情。
13.GPT-5在健康查询上表现更好,也许GPT-8可以治愈某种特定的癌症
Cleo Abram:我能想到AI可能对我们的孩子和我们所有人产生最大真正积极影响的领域,那就是健康。所以如果我们选择某一年,比如2035年,我坐在这里采访斯坦福医学院的院长,你希望他告诉我AI在2035年为我们的健康做了什么?
Sam Altman:我们对GPT-5最自豪的一件事是它在健康建议方面进步了很多,人们已经大量使用GPT-4模型来获取健康建议。
你在网上应该见过这样的案例:有人得了危及生命的疾病,医生们都难以诊断,他把自己的症状和血液检测结果输入ChatGPT后,AI准确指出了他患的是某种罕见病。之后他去看医生,按建议服药,最终痊愈了——这真的很神奇。
显然,ChatGPT的查询中,有很大一部分都和健康相关。所以我们希望在这方面做得更出色,也投入了大量精力。而GPT-5在处理健康相关查询时,表现确实更好。
Cleo Abram:这里“更好”是什么意思?
Sam Altman:它能给出更优质的答案,更准确,幻觉内容更少,也更有可能告诉你你实际存在的问题以及真正应该采取的措施。更完善的医疗保健固然很好,但显然,人们真正希望的是不生病。
到2035年,我认为我们将能够使用这些工具来治愈或至少治疗目前困扰我们的相当数量的疾病,我认为这将是AI最直观感受到的好处之一。
Cleo Abram:人们经常谈论AI将如何彻底改变医疗保健,但我很好奇再深入一步具体你在想象什么,比如,这些AI系统是否能帮助我们更早发现GLP-1s,这种药物已经存在很长时间,还是像AlphaFold和蛋白质折叠正在帮助创造新药物?
Sam Altman:我希望能够要求GPT-8去治愈某种特定的癌症,我希望GPT-8能够自主思考,然后说:“我已经查阅了所有能找到的资料,有了这些想法,你需要找一位实验室技术员来做这九个实验,之后把每个实验的结果告诉我。”
接下来要等两个月,让细胞完成生长等过程,再把结果反馈给GPT-8,告诉它“我已经试过了,结果给你”。然后GPT-8会接着说:“那好,去合成这个分子,先做小鼠实验之类的研究,之后再进行人体研究。”就这样一步步引导用户开展药物试验。
14.AI带来的变化对个人也许是破坏性的,但社会是有韧性的
Cleo Abram:我想,任何有亲人因癌症离世的人,肯定都会非常渴望这样的技术。好的,我们再来畅想一次未来。我原本想说2050年,但我的所有时间线又一次被大大缩短了——这确实让人感觉如今的世界变化太快了。
我和其他AI领域的领导者交流时,他们提到了工业革命。他们说:“我选择2050年,是因为听过有人说,到那时我们将要经历的变化会像工业革命一样,但规模要大10倍,速度要快10倍。”
工业革命为我们带来了现代医学、卫生设施、交通和大规模生产,以及所有我们现在视为理所当然的便利。但对很多人来说,那段时期也异常艰难,而整个工业革命持续了大约100年。
如果未来的变革规模是工业革命的10倍、速度是10倍,即便在这场对话中我们不断缩短讨论的时间线,对大多数人而言,这实际会是什么感受?如果一切都如你所愿地发展,在这个过程中,又会有谁依然会受到伤害呢?
Sam Altman:我真的不知道这会是什么感受。我觉得我们正处在未知的领域,但我确实相信人类的适应能力、无限的创造力以及对事物的渴望——我们总能找到新的事情去做。
不过,即便这种变革真的可能快速发生,尽管我认为它不会像一些同事说的那样快,社会本身存在着巨大的惯性,人们适应生活方式的速度也出奇地慢。
未来会有一些工作完全消失,还有许多类别的工作会发生重大变化,当然也会有新的事物出现——就像你的工作不久前还不存在,我的工作也是如此。
从某种意义上说,这种新旧更替的情况已经持续了很长时间,虽然对个人而言往往具有破坏性,但社会已证明对此有相当强的韧性。可从另一种角度看,我们根本不知道这种变革能走多远、能有多快。
因此,我认为我们需要一种非同寻常的谦逊与开放态度,去考量那些不久前还被认为完全超出可行范围的新解决方案。
15. 社会契约可能必须改变,需要找到新的方式传递价值
Cleo Abram:我想谈谈其中一些可能出现的情况。虽然我不是历史学家,但我知道第一次工业革命时期,由于公共卫生状况变得极其糟糕,最终推动了多项公共卫生措施的实施;第二次工业革命则因为劳动条件的恶劣,促使了劳动力保护相关制度的建立。
每一次重大的发展飞跃,都会引发一些混乱,而我们也总能想办法去整顿和解决这些问题。
如今,我们似乎正处于一场巨大的变革之中,我很好奇:我们能否尽早具体预测出这种变革可能带来的混乱是什么?又能提前采取哪些公共干预措施,来减轻我们预期会面临的混乱呢?
Sam Altman:在我看来,社会契约的基本内容或许需要改变,当然也可能不必——毕竟供需平衡会发挥作用,我们最终都会找到新的工作,以及新的方式来相互传递价值。
但我认为,我们可能需要思考如何分享未来可能最为重要的一种资源:算力。在我看来,最好的办法是让AI计算能力变得尽可能丰富且廉价,若非如此,我甚至能预见可能会因此爆发战争。
至于我们该如何分配对AGI计算能力的访问权,这似乎是一个非常值得探索的方向,也是一件虽听起来有些疯狂、却至关重要的需要认真考量的事。
16.AI将成为今后社会发展的基础,整个社会就是“超级智能”
Cleo Abram:我发现自己在这场对话中思考的一件事是,我们经常将AI未来的几乎全部责任归咎于构建AI的公司,但我们是使用它的人,我们是选举监管人的那一方。
所以我很好奇,这不是关于具体的联邦监管的问题,尽管如果你有答案,我也很好奇。但你会对我们其他人提出什么要求?这里的共同责任是什么?我们如何行动才能帮助更有可能实现这个乐观的未来?
Sam Altman:我最喜欢的一个历史例子是晶体管。它是由一些聪明的科学家发现的惊人科学成果,像如今的AI一样,以惊人的规模、相对快速地融入了我们使用的诸多物品中——你的电脑、手机、相机、灯具,无论什么,它真正为人类解锁了全新的技术树。
曾经有一段时间,几乎每个人都对晶体管公司、硅谷的半导体公司极为着迷。 但现在,你或许还能说出几家晶体管公司的名字,可大多数时候不会特意想到它们。多数情况下,晶体管已渗透到生活的方方面面,成为一种隐形的存在。
硅谷的情况也是如此,刚大学毕业的年轻人可能几乎不记得它最初被称为“硅谷”的缘由。你不会觉得是那些晶体管公司塑造了社会,尽管它们确实做了很多重要的事。
你会想到苹果用iPhone带来的改变,然后想到TikTok在iPhone基础上构建的内容生态,你会说:“看吧,这是一长串以各种方式推动社会发展的人和事——包括政府的作为或不作为,以及人们如何运用这些技术。”我认为,AI未来也会经历这样的过程。
就像,今天出生的孩子,他们永远不会知道没有AI的世界,所以他们不会真正想到它,它只是将存在于一切事物中。他们会想到建立在它之上的公司以及他们用它做了什么,以及那些政治领导人做出的决定,也许没有AI他们无法做到,但他们仍然会想到这位总统或那位总统做了什么。
AI 公司建立了这个“脚手架”,我们在上面添加了我们的一层,现在人们可以站在上面添加一层,然后是下一层和更多层,这就是我们社会的美丽之处。
社会就是超级智能,像通过社会共同完成的所有艰苦工作而创造出的惊人的工具,没有人能独自创造出来,这就是我认为它将感觉到的样子。
Cleo Abram:所以也许对数百万人的要求是建立在它之上。
Sam Altman:在我自己的生活中,这感觉像是这个重要的社会契约。所有这些人在你之前非常努力地工作,他们把他们的砖块放在人类进步的道路上,你可以沿着那条路走下去,你再放一块,别人再放一块。
Cleo Abram:这让我回想起此前我做过的几次采访,与那些真正带来巨大变化的人。我现在想到的是与CRISPR先驱Jennifer Doudna的采访,她在某种程度上也说了类似的话。
她发现了一些东西,可能会从根本上改变大多数人未来与健康的关系,将会有很多人以她可能赞成或不赞成的方式使用她的成果。
这真的很有趣,我听到一些类似的主题,比如,我希望下一个接过接力棒的人能跑得好。
Sam Altman:是的,这已经持续了很长时间。结果不全是好的,但大多是好的。
17.ChatGPT帮助你解决事情,而不是让你沉迷其中
Cleo Abram:我认为赢得比赛和构建对大多数人最好的AI未来之间有很大的区别。我可以想象,专注于赢得比赛的下一步有时更容易,也许更可量化。
我很好奇当这两件事冲突时,你不得不做出的对世界最好但对赢得比赛不利的决定的一个例子是什么?
Sam Altman:我觉得这样的事有很多。我们最引以为豪的一点是,很多人说ChatGPT是他们最喜欢的科技产品,是他们最信任、最依赖的产品。这话听着有点不可思议,毕竟AI是会产生幻觉的。
不过我们在这个过程中也搞砸过一些事,有时影响还不小,但总的来说,作为ChatGPT的用户,你应该会觉得它在努力帮你,努力完成你提出的任何要求,和你是高度契合的。
它不会想方设法让你整天用它,也不会怂恿你买什么东西,它只是想帮你实现各种目标。这让我们和用户之间形成了一种很特殊的关系,我们绝不会轻视这种关系。
其实有很多做法能让我们增长得更快,能让人们在ChatGPT上花更多时间,但我们没有那么做,因为我们清楚,长期来看,我们的核心动力是与用户保持尽可能高的一致性。
我为公司感到自豪,也为我们很少被这些短期诱惑干扰而自豪,不过说实话,有时我们确实会动心。
Cleo Abram:有什么具体的例子吗?你做出的任何决定?
Sam Altman:嗯,我们还没有在ChatGPT中加入性爱机器人头像。
Cleo Abram:我很好奇,在此前的探索中你犯过的错误,会影响你在未来的表现?
Sam Altman:我觉得我们在ChatGPT上做过的最不妥的事,是曾出现过一个关于“奉承”的问题——模型当时有点过于讨好用户。
这对大多数用户来说或许只是烦人,但对一些心理状态脆弱的用户而言,却可能助长了他们的妄想。
这并非我们最初最担心的风险,也不是我们测试最多的内容,虽然它在我们的风险清单上,但ChatGPT实际出现的这类安全问题,并非我们花最多时间讨论的,我们讨论更多的本应是生物武器之类的重大风险。
这其实是个很好的提醒:我们如今拥有一项被如此广泛使用的服务,从某种意义上说,社会正与它共同进化。当我们考量这些变化以及那些“未知的未知”时,必须改变运作方式,对我们所认定的顶级风险抱有更广阔的视角。
18.ChatGPT的鼓励和讨好并非全是坏事
Cleo Abram:在最近与Theo Vaughn的采访中,你说了一些我觉得非常有趣的话。你说在科学史上有一些时刻,一群科学家看着他们的创造,只是说“我们做了什么?” 你什么时候有过这种感觉?对你构建的创造最担心的时候?
Sam Altman:我的意思是,确实有过一些令人惊叹的时刻。这些时刻并非是那种糟糕意义上的“我们做了什么”,而是源于这个技术本身的了不起。
我还记得第一次和GPT-4交谈时的感受——哇,这真的像是一群人长期投入毕生精力所取得的惊人成就,那一刻让我真切体会到“我们做到了”的震撼。
我最近和一位研究员聊过,他提到或许在未来某个时刻,我们的系统每天输出的单词量会超过全人类的总和。
现在人们每天向ChatGPT发送数十亿条消息,并且依赖它给出的回应来处理工作或生活中的事务。而一位研究员只需对ChatGPT与个体或所有人的交流方式做些微小调整,就拥有了巨大的权力——历史上从未有人能每天参与数十亿次对话。
想到这一点,我真的深感震撼。这是技术所拥有的一种不可思议的力量,而我们如此迅速地掌握了它。我们必须思考,在这样的规模上改变模型的“个性”意味着什么——这确实是一个让我无比震惊的时刻。
Cleo Abram:把你现在说的和你上次的回答结合起来,我听说了关于GPT-5的一件事,就是它变得不那么热情,不那么唯唯诺诺。你认为这有什么影响?听起来你正在回答这个问题,但还有你实际上如何引导它变成那样?
Sam Altman:这是一件令人心碎的事情。我认为ChatGBT不那么唯唯诺诺,给你更多批评性反馈是很好的。
但随着我们做出这些改变并与用户讨论,听到用户说,“请我能把它要回来吗?我生命中从未有人支持过我,我从未有父母告诉我我做得好。” 这太让人难过了。
就像我明白为什么这对其他人的心理健康不好,但这对我的心理健康很好。我从未意识到自己如此需要这种鼓励——它推动我行动,促使我在生活中做出改变。看来ChatGPT的鼓励并非全是坏事。
我们目前的做法确实存在不足,但朝着这个方向探索或许有其价值。我们会向模型展示各种场景下希望它做出的回应示例,让它从中学习并形成整体的“个性”。
19.OpenAI今后将做出消费级设备
Cleo Abram:我很好奇的是GPT-5更多地融入我的生活,比如在我的Gmail和日历中。我一直主要把GBT-4作为与它的孤立关系来使用。我对GBT-5的关系会如何变化有什么期待?
Sam Altman:就像你说的,我认为它会开始以各种方式融入生活。
你可以把它连接到自己的日历和Gmail,它会主动问你:“嘿,这件事需要我留意吗?需要我帮你处理吗?” 随着时间推移,它会变得越来越主动。或许你早上醒来,它就会说:“嘿,昨晚发生了这么件事。我注意到你日历上有个变动。关于你之前问我的那个问题,我又多琢磨了琢磨,有了些新想法。”
我们还会推出一些消费设备,比如这次采访用的设备,也许它会先让我们自由交流,但结束后会说:“刚才聊得不错,但下次你可以问问Sam这个问题。还有,你提到某件事的时候,能看出他的回答不太到位,你其实应该在那一点上追问他。”
它会逐渐让人觉得更像一个真实存在的实体,成为陪伴你一整天的伙伴。
Cleo Abram:我们谈到了孩子和大学毕业生、父母和所有不同的人。如果我们想象一大群人在听这个,他们已经听完了这场对话。他们应该感觉好像能更好地看到未来的某些时刻。你会给他们什么建议,告诉他们如何准备?
Sam Altman:第一条战术建议就是使用这些工具。
比如,我最常被问到的关于AI的问题是:“我该如何帮助孩子为这个世界做准备?我该告诉孩子什么?” 第二个最常被问的问题则是“如何在AI时代进行投资?”
但对于第一个问题,我很惊讶的是,很多问这个问题的人,除了把ChatGPT当作更高效的谷歌搜索工具来用,就从未尝试过用它做其他事。
所以我给出的第一条建议就是,试着去熟悉这些工具的能力,弄清楚如何在生活中运用它们,以及能用它们做些什么——我认为这或许是最重要的战术建议。
当然,像冥想、学习如何保持韧性以应对大量变化这些有益的事也很重要,而善用这些工具,其实也能对这些方面有所帮助。
20.为什么会有人既觉得AI会毁灭世界,又要继续研发AI?
Cleo Abram:好的,在做所有这些前期研究时,我与很多不同类型的人交谈过,我与很多构建和使用工具的人交谈过,我与很多实际上在实验室里试图构建我们定义的超级智能的人交谈过。
人们似乎形成了两个阵营,一群人像你在这场对话中一样使用工具并为他人构建工具,说这将是一个非常有用的未来,我们都在朝着它前进,你的生活将充满选择,我们谈到了我潜在的孩子和他们的未来。
然后还有另一群构建这些工具的人说它会杀死我们所有人。我很好奇这种文化脱节是怎么回事,关于这两群人我错过了什么?
Sam Altman:对我来说很难理解,有人说这会杀死我们所有人,但他们仍然每周工作100小时来构建它。我无法真正理解这种心态,如果我真正相信这一点,我想我不会试图构建它,也许我会在一个农场里试图度过我的最后几天,也许我会试图阻止它,也许我会试图更多地研究安全,但我想我不会试图构建它。所以,我发现自己很难理解这种心态。
我假设这是真的,也许那里有一些我不理解的心理学问题,但这对我来说非常奇怪。你有什么建议吗?
Cleo Abram:我向来习惯这样:先让对方勾勒一个大致的未来图景,再试着追问其中的具体细节。比如,当你追问人们 “这究竟会如何让我们走向毁灭” 时,你会发现听到的答案总是大同小异,无非是某种事物在执行任务时过度发力、过了头。
我听过你聊起一种普遍存在的过度依赖问题,还提到过未来总统可能是人工智能的设想,或许这就属于我们需要警惕的过度依赖。
你推演过各种不同的场景,但当你问起研究者为何要做这项研究,或是他们认为事情会如何发展时,99%的情况下,人们觉得结果会很不错;只有1%的概率,会认为这种 “试图创造最优世界” 的尝试可能酿成灾难。
Sam Altman:那我可以完全理解。如果你说,99%的机会非常棒,1%的机会世界被毁灭,我真的想努力把99%提高到99.5%。那我可以完全理解,这很有道理。
21.阿尔特曼称非常幸运、快乐和荣幸能从事AI工作
Cleo Abram:我一直在做一个采访系列,与一些影响未来最重要的人,虽然还不知道下一个人会是谁,但知道他们将构建我们刚刚描述的未来中完全迷人的东西。你会建议我问下一个人什么问题?
Sam Altman:在不了解这个人的任何事的情况下,我总是对这个问题感兴趣:“在所有你可以花费时间和精力的事情中,你为什么选择这个?你是怎么开始的?在它成为共识之前,大多数人做有趣的事情都更早看到了它。你是怎么来到这里的,为什么是这个?”
Cleo Abram:你会如何回答这个问题?
Sam Altman:我一生都是AI书呆子,我上大学学习 AI、在 AI 实验室工作。我小时候看科幻节目,总是认为如果有人有一天能建造它会很酷,我认为这将是有史以来最重要的事情,但从未想过我会是真正研究它的人之一,我觉得难以置信地幸运、快乐和荣幸能从事这个工作。
我感觉自己从童年一路走来,已经走了很长的路。但我内心深处毫不怀疑,这不会是最令人兴奋有趣的事——我只是从未想过AI会成为可能。
上大学时,我们似乎离这个目标还很遥远。直到2012年,Alex Net的论文发表,我开始和联合创始人伊利亚一起投入研究。对我来说,那是第一次让我觉得,似乎存在一种可能奏效的方法。
之后的几年里,我一直在持续观察,看着技术随着规模扩大而变得越来越好。我记得当时就在想:为什么世界没有关注这件事?在我看来,AI有可能成功是很明显的——虽然概率不高,但存在这种可能。而如果它真的能成,那将会是最重要的事。
所以,这就是我想做的事,令人难以置信的是,它后来真的开始奏效了。
Cleo Abram:非常感谢你的时间。