经济学人:
今年2 月初,全球最著名的人工智能公司Open AI发布了 Deep Research,它“旨在进行深入、多步骤的研究”。只需在键盘上敲几下,这个工具就可以在几分钟内生成有关任何主题的论文。许多学者都喜欢它。宾夕法尼亚大学的 Ethan Mollick 表示:“向 Open AI的 Deep Research 询问我正在写论文的主题,成果非常丰富。”一些经济学家走得更远。多伦多大学的 Kevin Bryan 说:“我 *确信* 在B级期刊上,你可以发表你一天内‘写’的论文。”乔治梅森大学的 Tyler Cowen 是硅谷一位享有盛誉的经济学家,他说:“我认为这种质量相当于聘请一位优秀的博士级研究助理,然后派他带着任务离开一两周。”
您是否应该每月为深度研究支付 200 美元?考恩先生过去曾大肆宣传时尚,就像他曾经大受欢迎的社交媒体网络 Web3 和 Clubhouse 一样。另一方面,如果像许多人认为的那样,深度研究近似于一种人工智能,那么每年 2,400 美元就是世界历史上最划算的了。为了帮助您做出决定,您的专栏作家 对新模式进行了测试。对于经济学家和其他人来说,深度研究作为研究助理有多好?
首先是显而易见的结论。深度研究无法进行初步研究,从在秘鲁组织民意调查到了解你可能做空的公司的首席执行官的肢体语言。它也不能煮咖啡,这使得它无法替代人类助手。另一个抱怨是,即使你要求深度研究更生动,它的输出也几乎总是枯燥乏味的散文。不过,大多数人从来都不是优秀的作家,所以他们几乎不会在意他们的人工智能助手是否有点乏味。
不过,使用 Deep Research 作为助手一段时间后,会出现三个更重要的问题:“数据创造力”、“多数人的暴政”和“智力捷径”。从数据创造力开始。Open AI的模型可以毫不费力地处理简单的问题——“2023 年法国的失业率是多少?”。它可以轻松处理稍微复杂一点的问题——“告诉我 2023 年法国、德国和意大利按人口加权的平均失业率是多少”。
然而,当涉及到需要更多创造力的数据问题时,该模型就遇到了困难。它错误地估计了 2021 年一个 25 至 34 岁美国家庭在威士忌上花费的平均金额,尽管任何熟悉劳工统计局数据的人都可以在几秒钟内找到确切的答案(20 美元)。它无法准确告诉你目前英国企业中有多少比例使用人工智能,尽管统计局会定期进行估算。对于更复杂的问题,包括那些涉及分析统计机构生成的源数据的问题,该模型的难度更大。对于这类问题,人类助手仍占优势。
第二个问题是多数人的暴政。深度研究基于大量公共数据进行训练。对于许多任务来说,这是一个优势。它在生成详细、有来源的摘要方面非常出色。考恩先生要求它写一篇十页的论文来解释大卫·李嘉图的租金理论。这份成果对任何教科书来说都是值得尊敬的补充。
然而,用于训练模型的内容数量庞大,这带来了一个智力问题。深度研究倾向于借鉴经常讨论或发表的想法,而不是最好的内容。信息量压倒了信息质量。统计数据也是如此:深度研究倾向于咨询容易获得的来源(例如报纸),而不是可能隐藏在付费墙后面或更难找到的更好的数据。
类似的事情也发生在思想上。考虑一下经济学家们经常讨论的问题——美国的收入不平等是否正在加剧。除非另有提示,否则该模型会平淡地假设不平等自 20 世纪 60 年代以来一直在飙升(这是传统观点),而不是保持平稳或仅略有增加(许多专家的观点)。或者考虑一下亚当·斯密“看不见的手”的真正含义,这是经济学的基本思想。在 1994 年发表的一篇论文中,哈佛大学的艾玛·罗斯柴尔德驳斥了斯密用这个术语来指自由市场的好处的说法。深度研究知道罗斯柴尔德女士的研究,但仍然重复了流行的误解。换句话说,那些使用深度研究作为助手的人冒着学习共识观点而不是行家观点的风险。对于任何通过个人创造力和思想赚取收入的人来说,这都是一个巨大的风险,无论是公共知识分子还是投资者。
白痴陷阱
聘请深度研究助理的第三个问题最为严重。这不是模型本身的问题,而是如何使用的问题。不可避免地,你会发现自己在走智力捷径。硅谷投资者保罗·格雷厄姆 (Paul Graham) 指出,人工智能模型通过代人写作,可能会使人们变得愚蠢。“写作就是思考,”他说。“事实上,有一种思考只能通过写作来实现。”研究也是如此。对于许多工作来说,研究就是思考:注意到传统智慧中的矛盾和差距。将所有研究外包给超级天才助理的风险在于,你会减少获得最佳想法的机会。
随着时间的推移,Open AI可能会解决其技术问题。在某个时候,Deep Research 也可能会想出绝妙的想法,将其从助手转变为首席研究员。在那之前,使用 Deep Research,即使每月 200 美元。只是不要指望它很快就能取代研究助理。并确保它不会让你变傻。
评论
发表评论