来源:AI寒武纪
OpenAI表示,预计到2025年,ChatGPT将具备独立执行任务的能力,这将成为一个主要主题;未来GPT产品线中的AI 智能体将成为下一个重大突破;大胆预测,到2025年所有LLM基准测试将趋于饱和,意味着LLM会有重大突破。
OpenAI CEO Sam Altman携Kevin Weil (首席产品官)、Srinivas Narayanan (工程副总裁)、Mark Chen (高级研究副总裁) 在Reddit搞了个AMA(Ask Me Anything)!非常值得一看
照例先给大家划个重点:
? Sam Altlman 首次正面回答:Ilya看到了超凡的未来
? OpenAI相信AGI在当前硬件条件下是可实现的
? LLM架构上的突破,或许是现有模型提出的,可能有助于实现AGI
? 预计到2025年,ChatGPT将具备独立执行任务的能力,这将成为一个主要主题
? 未来GPT产品线中的AI 智能体将成为下一个重大突破
? 大胆预测,到2025年所有LLM基准测试将趋于饱和,意味着LLM会有重大突破
以下是网友和OpenAI高管问答详细信息
Sam Altman
vigneshwarar: 说真的,Ilya看到了什么?
Sam Altman:超凡的未来
Ilya是一位非常有远见的人,他对未来的洞察力比几乎任何人都清晰。他早期的想法、热情和远见对我们所做的很多事情都至关重要,例如,他是最终成为O1的一些想法的关键早期探索者和拥护者之一。这个领域很幸运拥有他。
07vex: 你如何看待人们使用ChatGPT进行心理治疗?
Sam Altman: 它显然不是治疗师,但很明显,很多人通过与它谈论他们的问题而获得价值。我们看到很多创业公司真正在探索如何在这里做得更多;我希望有人能做出一些很棒的东西!
Cynicaltarzan: 你见过的ChatGPT在实际应用中的最佳案例是什么?还有,你认为它和未来版本(未来几年)在哪些方面可能特别擅长?
Sam Altman: 有很多很棒的案例,但听到人们找到了衰弱性疾病的病因,然后完全康复的故事真的很棒。它能成为一名非常优秀的软件工程师的能力,即使现在也感觉被深深低估了。更广泛地说,它帮助科学家更快地发现新知识的能力将会非常棒
Mcppoyles: 是否有计划增加出版商的整合,以验证和注册账户,让他们能够看到他们是如何出现在ChatGPT中的?理想情况下,他们可以看到他们被引用的方式和频率
Sam Altman: 这是个好主意!我们会讨论一下。不过目前还没有计划
Skibidimog: 你们什么时候会给我们一个新的文本到图像模型?DALL-E 3有点过时了
Sam Altman: 下一次更新值得等待!但我们还没有发布计划
bugbearmagic: 你会用ChatGPT来回答这些问题吗?
Sam Altman: 有时,是的。你能看出来吗?
Millenial_Uprising: 你好,OpenAI团队,感谢你们举办这次AMA。我的问题是关于SearchGPT与流行搜索引擎相比提供的价值。SearchGPT有哪些独特的优势或关键区别,可以让一个典型的搜索引擎用户选择它?
Sam Altman: 对于许多查询,我发现它是一种更快/更容易获得我想要的信息的方式。我认为我们会在需要更复杂研究的查询中尤其看到这一点。我还期待着未来,搜索查询可以动态呈现自定义网页作为响应!
laggymaster: chatgpt-5或其等效版本的发布日期?它的功能是什么?
Sam Altman: 今年晚些时候,我们将发布一些非常棒的版本!不过,我们不会发布任何名为GPT-5的东西
potato3445: 关于成年用户(如果需要)切换“nsfw”内容(在合理范围内)的能力的长期目标(在一个完美的世界里)?
Sam Altman: 我们完全相信应该像对待成年人一样对待成年用户。但这需要大量的工作才能做到这一点,而现在我们有更紧迫的优先事项。希望有一天能做好这件事!
abhishekbalak: 作为一个经验丰富的创始人,以及与许多创始人密切合作过的人,你如何看待AI在风险开发过程中增强创始人的能力?创业精神将因此发生怎样的变化?
Sam Altman: 对此非常兴奋!如果创始人能够将生产力提高10倍,我们就会拥有更多(并且更好)的初创公司。这在很多方面都比拥有一个10人的创始团队更好(例如,更少的协调开销)。虽然10倍的生产力提升在未来还很遥远,但我相信它会发生。由此带来的总体经济加速,尤其是对初创公司的经济加速,将会非常棒。
SnooDoodles5235: 在发布ChatGPT时,有什么事情让你感到惊讶吗?
Sam Altman: 最让我惊讶的是人们有多喜欢它。产品的早期版本是一个非常非常初级的原型。现在它相当不错,但当时肯定不是。它不是很准确,没有很多功能,而且经常宕机,等等。然而,人们发现了足够的价值并坚持使用它
used_steak: AGI可以用已知的硬件实现,还是需要完全不同的东西?
Sam Altman: 我们相信用现有的硬件就可以实现
ksprdk: 对2025年的大胆预测?
Sam Altman: 在所有基准测试中达到饱和
Kevin Weil (Chief Product Officer)
Mediocre_Line7407: 你好,我想问一下GPT4o的token上下文字段什么时候会增加。在我看来,特别是对于较长的编码或写作任务,32k与其他AI模型相比太小了
Kevin Weil: 同意。我们正在努力!
patchzy: 你的计划是从现在开始继续发布O系列模型吗?改进“常规”模型,例如GPT 3、4、4o、5。两者都有,还是两者的结合?
Kevin Weil: 两者都有!而且在某个时候,我预计它们会融合。
Vega: ChatGPT生日(指的是11月30日ChatGPT两岁生日)有什么特别的礼物吗?
Kevin Weil: GPU!
Snowstradomus: 我们是否会在某个时候看到Advance Voice放宽对音乐功能(如唱歌)的限制?这方面有什么时间表吗?
Kevin Weil: 我们正在努力!我也想听ChatGPT唱歌。
potato3445: ChatGPT最终能够自己执行任务吗?先给你发信息? Kevin Weil: 依我拙见,这将是2025年的一个重要主题。
Neon9987: O1将如何影响LLM的扩展?你们会继续按照比例定律扩展LLM,还是会将推理计算时间扩展作为重点,这意味着更小的模型具有更快和更长的推理?
Kevin Weil: 这不是非此即彼,而是两者兼而有之——更好的基础模型加上更多的strawberry scaling/推理时间计算。
standover_man: 关于ChatGPT的搜索产品的一个问题。在过去,企业主、网络出版商、附属公司等会担心搜索引擎优化,以确保他们的网站“排名”。你会告诉这些人,他们可以做些什么来确保他们在ChatGPT的搜索中被找到?
Kevin Weil: 这是一个很好的问题——该产品今天才发布,所以关于搜索在哪些方面与AI世界相似,在哪些方面不同,还有很多需要弄清楚。欢迎提供任何反馈!
Substantial_Scale698: 对那些想要为AI革命做出贡献的有抱负的年轻人有什么建议?
Kevin Weil: 我的建议:每天都使用它。用它来教你东西,学习你想学的任何东西——编码、写作、产品、设计,任何东西。如果你能比其他人学得更快,那么你就能做任何事。
mindfulshark: 什么是最好的提示词?
Kevin Weil: 这个在社交媒体上很流行,但我真的很喜欢“根据我们的互动,你能说出一些关于我的、我自己都不知道的事情吗?”
Helpdesk512: 我们能否获得一种免提的方式来结束与ChatGPT的语音对话?使用iPhone上的操作按钮快捷方式,但每次都需要手动关闭语音聊天。
Kevin Weil: 我喜欢这个主意。现在就与团队分享!
Srinivas Narayanan (VP Engineering)
Demondehellis: 你希望ChatGPT能做什么但现在还做不到的事情是什么?
Srinivas Narayanan: 我希望它能更好地理解我的个人信息,并代表我采取行动。
Fun_Spinach6914: 你们什么时候会发布ChatGPT的相机模式?
Srinivas Narayanan: 正在努力。还没有确切的日期。
Repulsive-Outcome-20: 一旦AGI实现,你最想把它应用到什么地方?在那一刻,是否有一个特定的领域是你的首选?
Srinivas Narayanan: 我希望它能加速科学发现。我个人对健康/医学非常感兴趣。
Substantial_Scale698: 对那些想要为AI革命做出贡献的有抱负的年轻人有什么建议?
Srinivas Narayanan: 使用AI工具来提高你在日常工作中的效率——这将带来有趣的想法。然后构建一些有趣的东西并与他人分享。
CleanRecommendation1: 你们是如何处理这么多高层离开OpenAI带来的压力的?这是否增加了额外的负担?我们离AGI还有多远?
Srinivas Narayanan: 虽然我们很遗憾没有了一些与我们密切合作过的人,但我们有一个非常有才华的团队,而且最近也有许多了不起的新人加入我们。我们一直在发布产品,这真的很重要 :)
scryptic0: 完整的o1真的比o1预览版有明显的改进吗?
Srinivas Narayanan: 是的。
firtdev: ChatGPT搜索是否仍在使用Bing作为幕后的搜索引擎?
Srinivas Narayanan: 我们使用一组服务,Bing是其中重要的一个。
Markavian: OpenAI认为推理成本降低的速度有多快,以便能够实现“思维链”或“多层思维树”?从业务逻辑的角度来看,我们希望尽可能快速、廉价地执行推理链。
Srinivas Narayanan: 我们预计推理成本将继续下降。如果你看一下去年的趋势,它已经下降了10倍左右。
surim0n: 你见过的最好的个人助理工作流程是什么?
Srinivas Narayanan: 有两个我非常感兴趣的:1/用它来总结医疗报告,并帮助你向医生提出正确的问题。2/人们上传他们的知识来创建其他人可以使用的自定义GPT(我的朋友和家人上传了课程笔记或旅行建议)——我认为这仍然是一个被低估和未被充分利用的用例。
Kathane37: 模型如何在英语以外的其他语言中改进?
Srinivas Narayanan: 我们一直在改进模型在其他语言上的性能。与4T相比,gpt-4o在分词和整体质量方面有了显著的提升(参见 https://openai.com/index/hello-gpt-4o/) - 我们希望保持这一趋势。
ApricotSharp6056: OpenAI认为AI在未来个性化辅导中扮演什么角色?
Srinivas Narayanan: 绝对是一个改变人们学习方式的巨大机会。https://www.khanmigo.ai/ 在这方面做了非常有趣的工作——它引导人们自己找到答案,从而促进对主题的更深入理解。它还可以帮助教师补充他们的课程计划。
FrameTall8755: 如果新毕业生想要让自己的技能适应未来,他们应该优先深入学习transformers等技术,还是应该加入/创建一家初创公司,学习更多的高级AI产品,如“代理”、LLM知识图、创造伟大的AI用户体验等等?谢谢!
Srinivas Narayanan: 它们都很有价值。我会做你更感兴趣的事情。学习transformers将为你提供构建特定用例的定制模型的技能——像蒸馏/微调这样的技术将很重要。在现有模型的基础上,还可以构建种类繁多的应用程序。如果你仍然在这两者之间难以抉择,我建议你从更高的层次开始,然后根据需要深入学习。
DajShung: 让我们回到另一个维度的时间。;) 如果你是一个19岁的开发者,正在考虑明年要做什么,你会用OpenAI的软件或API做什么?
Srinivas Narayanan: 选择你最喜欢的应用程序/产品。重新想象它与AI结合后的样子。为代理化的未来构建一些东西——一些可以整合跨应用程序工作流程的东西。
trycoconutoil: 关于未来。如果你今天15岁,你会专注于哪些技能或道路,以便在未来取得成功?
Srinivas Narayanan: 适应能力和学会学习可能是最重要的事情。
Mark Chen (SVP of Research)
Ok_Opportunity_4228: AGI是否可以用已知的神经网络架构实现,还是需要新的科学(基础)突破?
Mark Chen: 如果架构突破是由现有的LLM提出的,这算吗?
Only-Tells-The-Truth: 幻觉会成为一个永久性的特征吗?为什么即使是o1-preview,在接近“思考”的尾声时也会越来越多地出现幻觉?你将如何处理现在已经不再“真实”的旧数据(即使是2年前的数据)?不断地训练模型,还是某种垃圾收集?这在真实性方面是一个大问题。
Mark Chen: 我们非常关注减少幻觉,但这是一个根本性的难题——我们的模型从人类书写的文本中学习,而人类有时会自信地宣称他们不确定的事情。我们的模型在引用方面正在改进,这将它们的答案建立在可信的来源之上,我们也相信RL也将有助于解决幻觉问题——当我们能够以编程方式检查模型是否出现幻觉时,我们可以奖励它不这样做。
whosfuzz12: 在研究方面,你认为哪些领域将定义AI的下一个重大突破?你如何看待OpenAI对这些领域的独特贡献?
Mark Chen: 该模型可以处理中断,这从根本上来说是新的。它也比以前的模型快得多。弄清楚如何将这些融入产品设计并非一件小事