跳至主要内容

研究人员正在研究大型语言模型的工作原理

经济学人:

对大多数人来说,汽车发动机或计算机的内部工作原理都是一个谜。它可能就像一个黑匣子:只要它能正常工作,就不必担心里面发生了什么。此外,设计和构建这种复杂系统的人非常了解它们的工作原理,并且可以在出现问题时进行诊断和修复。但对于大型语言模型 (LLM ) 来说情况并非如此,例如 GPT -4、Claude 和 Gemini,它们处于人工智能 ( AI ) 热潮的前沿

LLM 是使用一种称为深度学习的技术构建的,其中数十亿个神经元组成的网络由软件模拟,并模仿人类大脑的结构,并接触数以万亿计的事物示例以发现内在模式。经过文本字符串训练后,LLM 可以进行对话、生成各种风格的文本、编写软件代码、在语言之间进行翻译等等。

人工智能初创公司 Anthropic 的研究员 Josh Batson 表示,模型本质上是培养出来的,而不是设计出来的。由于 LLM 并非经过明确编程,所以没有人完全确定它们为何具有如此非凡的能力。他们也不知道为什么 LLM 有时会行为不当,或者给出错误或虚构的答案,即所谓的 “幻觉”。LLM 确实是黑匣子。这令人担忧,因为它们和其他深度学习系统开始用于各种事情,从提供客户支持到准备文档摘要再到编写软件代码。

如果能够探究 LLm 内部发生了什么,将会大有裨益,就像使用合适的工具可以探究汽车发动机或微处理器一样。能够自下而上、详细地了解模型的内部运作,被称为“机械可解释性”。但对于拥有数十亿个内部神经元的网络来说,这是一项艰巨的任务。但这并没有阻止人们的尝试,包括巴特森博士和他的同事。在 5 月份发表的一篇论文中,他们解释了他们如何对 Anthropic法学硕士课程的运作方式有了新的认识。

人们可能会认为LLM中的单个神经元会对应特定的单词。不幸的是,事情并没有那么简单。相反,单个单词或概念与复杂的神经元模式的激活有关,单个神经元可能被许多不同的单词或概念激活。Anthropic 的研究人员在 2022 年发表的早期研究中指出了这个问题。他们提出并随后尝试了各种解决方法,并在 2023 年使用所谓的“稀疏自动编码器”在非常小的语言模型上取得了良好的效果。在他们的最新成果中,他们扩大了这种方法的规模,以与全尺寸LLM Claude 3 Sonnet 一起使用。

稀疏自动编码器本质上是第二个较小的神经网络,它根据LLM的活动进行训练,寻找当“稀疏”(即非常小)的神经元群体一起激发时活动的不同模式。一旦识别出许多这样的模式(称为特征),研究人员就可以确定哪些词触发了哪些特征。Anthropic 团队发现了与特定城市、人物、动物和化学元素相对应的个别特征,以及更高级的概念,如交通基础设施、著名的女网球运动员或保密概念。他们进行了三次这个练习,在 Sonnet LLM 中识别出 1m、4m 和最后一次的 34m 个特征

最终结果是一种 LLM 思维导图显示了从训练数据中学习到的一小部分概念。旧金山湾区地理位置相近的地方在概念空间中也“相近”,相关概念也是如此,例如疾病或情绪。“这很令人兴奋,因为我们有一张部分概念图,虽然很模糊,但可以反映正在发生的事情,”巴特森博士说。“这是起点——我们可以丰富这张图,并从那里开始扩展。”

集中注意力

除了看到LLM的某些部分在响应特定概念时亮起外,还可以通过操纵单个特征来改变其行为。Anthropic 通过“增加”(即调高)与金门大桥相关的特征来测试这个想法。结果是一个 Claude 版本,它对这座桥非常着迷,一有机会就会提到它。例如,当被问到如何花 10 美元时,它建议支付过桥费并开车过桥;当被要求写一个爱情故事时,它编造了一个关于一辆失恋汽车迫不及待地想过桥的故事。

这可能听起来很傻,但同样的原则也可以用来阻止模型谈论特定话题,比如生物武器生产。“人工智能安全是我们的主要目标,”巴特森博士说。它也可以应用于行为。通过调整特定特征,模型可以或多或少地变得谄媚、富有同情心或欺骗性。是否会出现与产生幻觉的倾向相对应的特征?“我们没有找到确凿的证据,”巴特森博士说。他说,幻觉是否具有可识别的机制或特征是一个“价值百万美元的问题”。另一组研究人员在《自然》杂志上的一篇新论文中对此进行了探讨。

牛津大学的 Sebastian Farquhar 及其同事使用一种称为“语义熵”的测量方法来评估法学硕士的陈述是否可能是幻觉。他们的技术非常简单:本质上,法学硕士会多次收到相同的提示,然后根据“语义相似性”(即根据其含义)对其答案进行聚类。研究人员的直觉是,这些答案的“熵”(换句话说,不一致的程度)与法学硕士的不确定性相对应,因此也与幻觉的可能性相对应。如果所有答案本质上都是主题的变体,那么它们可能不是幻觉(尽管它们可能仍然不正确)。

例如,牛津大学的研究小组询问朵音乐与哪个国家有关,模型一致回答说法朵是葡萄牙的国乐——这是正确的,而不是幻觉。但当被问及一种名为 StarD10 的蛋白质的功能时,模型给出了几个截然不同的答案,这表明这是一种幻觉。(研究人员更喜欢使用“虚构”一词,这是幻觉的一个子集,他们将其定义为“任意和不正确的生成”。)总体而言,这种方法能够在 79% 的时间内区分准确的陈述和幻觉;比以前的方法高出 10 个百分点。这项研究在许多方面是对 Anthropic 的研究的补充。

其他人也揭开了法学硕士的面纱:GPT- 4 和 Chat GPT 的制造商 Open AI 的 “超级对齐” 团队于 6 月发布了自己的稀疏自动编码器论文,尽管在几名研究人员离开公司后,该团队现已解散。但巴特森博士说,Open AI 的论文包含了一些创新的想法。“我们真的很高兴看到各地的团队都在努力更好地理解模型,” 他说。“我们希望每个人都这样做。”

评论

此博客中的热门博文

2014-2024,仅仅10年 大象公社

 《2014-2024,仅仅10年》 大象公社 十年前的夏天,年轻人不愿当公务员,国考人数锐减36万,热帖称“机关钱少活多”。 那年全国毕业生700余万,就业率超九成,复旦学生租游艇办毕业舞会,女孩们花两千元买晚礼服,夜游江海。 那年世界的齿轮咬合稳定,中美迎来建交35周年。美国民调中,超72%年轻人,将中国视为“朋友”。 夏天前,奥巴马夫人到访,体验了长城、紫禁城与成都火锅。 慕田峪长城上,总统夫人看燕山起伏,觉得一切宽阔且美妙,“长城的长度几乎相当于从美国缅因州到俄勒冈州的四倍”。 那年的国运也如山峦起伏。 夏天时,股市清冷,七成账户闲置,股民调侃关灯吃面,7月IPO开闸,并购潮掀起,年底股市单日放量7100亿,狂飙冲天。 楼市故事也相似。十年前的五一,房企奄奄一息,北京楼盘推出零首付,南京楼盘跳远减十万,上海房展出动比基尼美女吸引眼球。9月楼市松绑,炒房客陷入狂欢。 十年前的人们尚不知卷与颓,偶有下挫,也认为不过是插曲,对一切满怀自信。 贾跃亭宣布要造超级互联网汽车,罗永浩宣布要发布东半球最好用的手机。真正手机大卖的是小米,第一季度销量超过苹果。 夏天过后,雷军去乌镇参加首届互联网大会。他磕磕巴巴说,梦想还是要有,万一实现呢? 那年乌镇最风光还是BAT,三家都在硅谷设立了分支,李彦宏说机会太多,他很着急: 我们其实处在非常有意思的时代,这是魔幻一般的时代,正好我们这一代人赶上互联网的兴起。 入夜,乌镇白墙黑瓦水音桨声。丁磊拼起旧木桌,摆起乌镇宴,座中人微博记录:十几瓶黄酒喝去,陈年故事吐出,煮酒笑谈云中事,天罗地网立旌旗。 未被邀请的马云,才是那年真正的主角。十年前的夏天,阿里启动全球最大规模IPO。 上市前,马云发内部邮件,建议员工不要挥霍,处理好财富,“我们这么辛苦,可不是为了变成一群土豪”。 当年9月,阿里上市,马云登顶中国首富,万名阿里员工成千万富翁,宝马销售和房产中介堵在阿里园区门口。 十年前的夏天蒸腾如梦,浩荡热风吹过中国。北京高温刷新了1951年以来纪录,居民用水多喝出4.5个昆明湖。 济南、上海、重庆、吐鲁番尽成火炉,更大热浪在互联网彩票服务器上。那年是巴西世界杯,足彩卖出23亿。 在广州,恒大正在冲击中超三连冠,教练席上,新任助教李铁说,有很多东西不是金钱所能衡量,“我给自己十年左右的时间,争取成为国家队的主教练”。 那个夏天,恒大冰泉形象代

中国房地产泡沫早有警示信号,为何无人悬崖勒马? - 华尔街日报

纽约对冲基金经理奎林(Parker Quillen)在中国北方参观一个名为天津环亚国际(Tianjin Goldin Metropolitan)的华丽新项目时,他想知道开发商究竟会用何种方式吸引客户。 该项目的公寓起价为100万美元,此外,还计划建造一座比帝国大厦还高大的写字楼、一座歌剧院以及若干购物中心和酒店。项目总面积将超过摩纳哥的土地面积。 有吸引买家的计划吗?奎林问道。带他参观的营销代理回答说,马球。 奎林记得那人答道:“正是。” 这位营销人员当时身着马球服,带着奎林穿过一个内有100多匹马球马的马厩。奎林询问了环亚的创始人是否对该项目进行过可行性研究。该营销人员说不知道。这名创始人是一位靠销售电脑显示器致富的亿万富翁马球爱好者。 奎林说:“然后我就明白了,这个项目的想法是,国际高管会来到天津,在这里设立公司总部,理由是他们喜欢马球。”他表示:“我当时想,天哪。” 回到纽约后,奎林将更多资金投入到对中国房地产类股的做空押注中。 那是2016年,正是中国房地产热潮刚刚兴起的大好时光。即便在那时,对于任何一个有心观察的人来说,真相都显而易见: 这股热潮已经变成泡沫——而且很可能会以非常糟糕的结局收场。 然而,泡沫继续恶化,因为没有人希望盛宴终结。中国的开发商、购房者、房地产中介,甚至是为这场繁荣提供资金支持的华尔街银行,都忽视了警示信号。 开发商在投行人士和律师的帮助下,想方设法掩盖他们背负的债务金额。购房者虽然怀疑房地产市场过度膨胀,但还是在继续买房。寻求丰厚回报的中外投资者为开发商提供了大量资金。 大家当时都有一个似乎无懈可击的假设,即中国政府绝不会允许房地产市场崩溃。中国人把大部分财富都投资在了住房上。如果允许楼市暴跌,民众的大部分积蓄可能会化为乌有,对共产党的信心也会涣散。 现在,中国正为没有及早采取行动控制这一切付出代价。 目前已有50多家中国开发商拖欠国际债务。专注中国房地产的民间智库可研(Keyan)称,约有50万人失去了工作。全中国约有2,000万套住宅尚未完工,估计需要4,400亿美元才能完工。 3月份,中国主要城市二手房价格下跌5.9%。地方政府由于失去了向开发商出售土地的收入,在偿还债务方面面临困难。随着房地产和相关行业对经济增长的拖累加大,整体经济变得脆弱。房地产和相关行业一度占到中国国内生产总值的25%左右。 “一文不值” 2016年,

2023年8月,中国资本外流 490 亿美元,创 2015 年以来之最

2023年8月,中国资本外流 490 亿美元,创 2015 年以来之最,因为经济萎靡迫使投资者纷纷撤离。 彭博社汇编的国家外汇管理局数据显示,其中290亿美元流出证券投资。 上个月,外国投资者抛售了 120 亿美元的内地上市股票,创下历史新高,同时还抛售了中国债券。8 月份还出现了 168 亿美元的直接投资逆差,为 2016 年以来最严重的一次。 据彭博社报道,旅游旺季也使资本账户的下降更为严重,出境游给中国的服务业造成了损失。由于中国的入境游尚未恢复到以前的水平,服务贸易继续出现逆差。 中国上一次面临如此规模的资金外流是在 2015 年市场因货币意外贬值而陷入困境的时候。 在当前资本外流的情况下,中国政府采取了一些措施来支撑人民币,比如削减银行必须持有的外汇数量。   尽管如此,中国的离岸人民币(即在国外市场使用的自由流通货币)仍出现了大幅下跌。出口疲软和美国收益率日益增长的吸引力也助推人民币在 9 月份跌至 16 个月来的最低点。

CBS:中国非法移民是如何走线进入美国的

 在中国长期严格的 COVID 封锁摧毁了她的生意之后,一位妇女决定把两个年幼的孩子留给家人,自己前往墨西哥,从边境的一个洞口进入美国。 她并不孤单: 中国移民是试图从墨西哥进入美国的增长最快的群体。去年,美国海关和边境保护局报告称,有 3.7 万名中国公民在非法越境时被捕,比两年前增加了 50 倍。 许多移民说,他们此行是为了躲避中国日益压抑的政治气候和疲软的经济。这位母亲通过翻译告诉 "60 分钟",她的动机不仅仅是经济原因,可以用一个词来概括。 她说:"自由"。 中国移民是如何进入美国的? 移民并没有被旨在减少非法入境的政策所吓倒,他们正以前所未有的数量穿越美墨边境。去年,美国海关和边境保护局记录了两百五十万次拘留或拒绝试图从墨西哥进入美国的人的情况。 美国南部边境的移民  入境点之一是圣地亚哥以东 60 英里处边境围栏末端的一个 4 英尺缺口。偷渡者驾驶越野车沿着边境围栏狂奔,并在缺口附近放下移民。在四天时间里,"60 分钟 "目睹了近 600 名移民--成人和儿童--通过缺口,肆无忌惮地进入美国领土。 一名大学毕业生说,他从中国出发花了 40 天。他说,在前往美国边境的途中,他经过了泰国、摩洛哥、厄瓜多尔、哥伦比亚、巴拿马、哥斯达黎加和尼加拉瓜。 这个缺口是一个全球目的地,到处都是来自世界各地的旅行证件。在翻译的帮助下,"60 分钟 "采访了一些中国移民,包括一名教师、一名银行家、一些小企业主和一名工厂工人。 与通过中美洲艰苦跋涉的移民不同,一些来自中国的中产阶级移民带着滚动行李抵达。有些人说,他们乘坐飞机一路来到墨西哥。 许多人从中国飞往厄瓜多尔,因为厄瓜多尔对中国公民不需要签证。然后他们飞往提华纳。这些移民说,他们与偷渡者取得了联系,并支付了 400 美元,以便在一个小时的车程内到达边境的缺口处。 这些移民之所以知道这个缺口,是因为 TikTok。60 分钟 "回顾了该应用程序上的帖子,其中包括雇用偷渡者的步骤说明和前往边境缺口的详细路线。 穿过缺口后,移民们沿着尘土飞扬的道路步行约半英里,排队等待美国边境巡逻队的到来,以便投降。 为什么越来越多的中国移民转向美墨边境? 多年来,数以百万计的中国人持签证进入美国旅游、工作或学习。但在过去几年里,随着两国紧张局势的加

吕德文:2024年新春调查:基层存在撂挑子、脱实向虚、折腾等潜在风险

   本文作者:吕德文 ,社会学博士,武汉大学社会学院教授、博士生导师,武汉大学中国乡村治理研究中心研究员,长期从事田野调查、城乡社会观察和基层治理研究。      1、经济下行的影响是全方位的   工业园区的工厂普遍开工不足,几个厂子订单不少,但利润率下降。朋友的工厂,2023年内销非常差,但发展了一带一路国家外贸,还不错,但也有不确定性。有运往约旦一条船的货物,走了两个月还在新加坡。全年七八千万的货款,还有将近两千万没有回款,大年三十还在收款。   农民工只要想干活,找工作没问题,但不能谈待遇。前几年,如果工厂不足额发放加班工资,工人还可以反抗。现在是,只要反抗,工厂立马开工资让其走人。   调查的一个包工头,反映现在总包把利润压得极低,都是透明的,你不干有的是人想干。现在包工头的利润很有限,也得一起干活。但农民工工资有保证,都是专项账户,由包工头开单子,总包直接发到工人账户。只不过,平常只能发生活费,年底随工程进度发所有工资。   经济下行的最重要影响是大家都务实了一点,预期没那么高了,前些年地方政府透支发展以及普通人超前消费少了一些,但也造成了躺平、认命等消极心态。一些在前几年形成的新习俗顽固存在,好多人在抵抗。一位四十岁的亲戚,为人厚道,兢兢业业工作,可能也因为过于“老实”,还是单身。他说,与其花几十万彩礼娶媳妇,还不如攒钱下来养老。    2、基层面临撂挑子风险   调查的几个乡镇,多数乡镇政府勉强保运转,但多数乡镇干部绩效打折或无法兑现。有些村庄的村干部工资发不出来了。   但几乎所有地方的发展项目都受到了影响。有一个乡镇,街道挖了,但资金没法保证,停工了,过年期间道路坑坑洼洼,群众怨声载道。所有乡镇领导都说,发展是不可能了,尽力维持。   调查一个村的四个村干部,有一个村干部辞职不干,有两个村干部想辞职。村支书为了稳定村干部,帮这两个村干部找了副业,勉强维持。另一个村的村干部,因为垫资做村级事务,上级又不兑现补贴,实在受不了就辞职出去打工了,扬言垫出去的钱也不要了。   村级组织运转经费普遍无法保证,要依靠村集体自筹部分资金,但大多数村庄没有集体经济收入,只能靠乡贤向老板或政府部门化缘。因此,村书记的个人能力非常之关键。问题是,有能力的村支书,完全是凭热情,如果热情消耗,还不如辞职自己赚钱去了。调查一个村的村支书是富二代,已经下决心不干了,竟然和笔者