跳至主要内容

人工智能(AI)简史

 经济学人:

1956 年夏天,一小群人聚集在美国新罕布什尔州的达特茅斯学院,他们规模虽小,但都很杰出。其中包括信息论的创始人克劳德 · 香农,以及唯一同时获得瑞典皇家科学院颁发的诺贝尔经济学奖和美国计算机协会颁发的图灵奖的人赫伯 · 西蒙。年轻的研究员约翰 · 麦卡锡把他们召集在一起,想讨论 “如何让机器使用语言、形成抽象和概念” 以及“解决现在只能由人类解决的各种问题”。这是第一次学术聚会,专门讨论麦卡锡所说的“人工智能”。它为该领域接下来的 60 多年树立了模板,使之没有取得与其雄心相媲美的进展。

达特茅斯会议并没​​有标志着对能像人一样思考的机器的科学探索的开始。图灵奖以他的名字命名,他曾对此感到好奇;麦卡锡的灵感来源约翰 · 冯 · 诺依曼也是如此。到了 1956 年,已经出现了许多对这一问题的探讨;历史学家认为,麦卡锡为他的项目创造了人工智能 (后来的 AI) 一词的原因之一是,它足够宽泛,可以涵盖所有方法,而哪种方法最好则没有答案。一些研究人员青睐基于将世界事实与几何、符号逻辑等公理相结合的系统,以便推断出适当的反应;另一些人则倾向于建立一个系统,在这个系统中,一件事的概率取决于许多其他事物的概率(这些概率不断更新)。

                                        资料来源:斯坦福大学 2024 年人工智能指数报告

在接下来的几十年里,人工智能在学术界掀起了轩然大波,引发了激烈的争论。但到了 20 世纪 80 年代,大家对未来的发展方向达成了广泛共识:“专家系统”使用符号逻辑来捕捉和应用人类最精湛的技术。日本政府尤其支持这种系统及其可能需要的硬件。但在大多数情况下,这种系统过于死板,无法应对现实世界的混乱。到 20 世纪 80 年代末,人工智能声名狼藉,成为言过其实、交付不足的代名词。那些仍在该领域的研究人员开始回避这个术语。

正是这些坚持不懈的人们,催生了今天的繁荣。20 世纪 40 年代,随着脑细胞(一种神经元)工作方式的雏形被拼凑起来,计算机科学家开始怀疑机器是否可以以同样的方式连接起来。在生物大脑中,神经元之间存在连接,这使得一个神经元的活动可以触发或抑制另一个神经元的活动;一个神经元的活动取决于与其相连的其他神经元的活动。达特福德与会者马文·明斯基首次在实验室中尝试对此进行建模,使用硬件来模拟神经元网络。从那时起,互连的神经元层就开始用软件进行模拟。

这些人工神经网络不是使用明确的规则进行编程的,而是通过接触大量示例来“学习”。在训练过程中,神经元之间的连接强度(称为“权重”)会反复调整,最终给定的输入会产生适当的输出。明斯基本人放弃了这个想法,但其他人将其发扬光大。到 20 世纪 90 年代初,神经网络已经经过训练,能够通过识别手写数字来帮助对帖子进行分类。研究人员认为,增加更多层神经元可能会实现更复杂的效果。但这也使系统运行速度大大降低。

一种新型计算机硬件为解决这个问题提供了方法。2009 年,斯坦福大学的研究人员利用宿舍里的一台游戏电脑,将神经网络的运行速度提高了 70 倍,这一发现极大地证明了这种硬件的潜力。之所以能够做到这一点,是因为除了所有电脑都有的“中央处理器”(cpu )外,这款电脑还配备了“图形处理单元”(gpu),可以在屏幕上创建游戏世界。而且,gpu 的设计方式非常适合运行神经网络代码。

将硬件加速与更高效的训练算法相结合,意味着拥有数百万个连接的网络可以在合理的时间内完成训练;神经网络可以处理更大的输入,而且最重要的是,可以拥有更多的层数。这些“更深层”的网络被证明更加强大。

这种新方法被称为“深度学习”,其威力在 2012 年的 ImageNet 挑战赛中初露锋芒。参赛的图像识别系统获得了一个包含超过一百万个带标签图像文件的数据库。对于任何给定的单词,例如“狗”或“猫”,数据库中都包含数百张照片。图像识别系统将使用这些示例进行训练,将以图像形式的输入“映射”到以单词描述形式的输出上。然后,系统被要求在输入之前从未见过的测试图像时生成这样的描述。2012 年,当时在多伦多大学工作的杰夫·辛顿 (Geoff Hinton) 领导的团队使用深度学习实现了 85% 的准确率。它立即被认为是一项突破。

到 2015 年,图像识别领域几乎所有人都在使用深度学习,ImageNet 挑战赛的获胜准确率已达到 96%——高于人类的平均得分。深度学习还被应用于许多其他“人类专属问题”,这些问题可以归结为将一种事物映射到另一种事物上:语音识别(将声音映射到文本)、人脸识别(将人脸映射到姓名)和翻译。

在所有这些应用中,通过互联网获取的大量数据对于成功至关重要;此外,使用互联网的人数表明了巨大市场的可能性。网络越大(即越深),获得的训练数据越多,其性能就越好。

深度学习很快就被应用于各种新产品和服务中。亚马逊 Alexa 等语音驱动设备问世。在线转录服务变得实用。网络浏览器提供自动翻译。说这些事情是由人工智能实现的听起来很酷,而不是令人尴尬,尽管这也有点多余;当时和现在,几乎所有被称为人工智能的技术实际上都依赖于深度学习。

2017 年,计算能力和数据量的增加带来了质的变化:一种排列神经元连接的新方法,称为变换器。变换器使神经网络能够跟踪输入中的模式,即使模式中的元素相距甚远,也能够让神经网络将“注意力”集中在数据中的特定特征上。

Transformer 让网络能够更好地掌握上下文,这使它们适合一种称为“自我监督学习”的技术。本质上,在训练过程中,一些单词被随机删除,然后模型会自学填写最有可能的候选词。由于训练数据不必事先标记,因此可以使用从互联网上获取的数十亿个单词的原始文本来训练此类模型。

注意你的语言模型

2019 年,基于 Transformer 的大型语言模型(LLM )开始引起更广泛的关注,当时初创公司Open AI发布了GPT-2模型( GPT代表生成式预训练 Transformer)。事实证明,此类LLM能够表现出未经过明确训练的“突发”行为。吸收大量语言不仅使它们出人意料地擅长总结或翻译等语言任务,而且还擅长训练数据中隐含的事情(例如简单的算术和软件编写)。不太好的是,这还意味着它们会在输入的数据中重现偏见,这意味着人类社会许多普遍存在的偏见都会在它们的输出中显现出来。

2022 年 11 月,更大的开放AI模型GPT-3.5以聊天机器人的形式向公众展示。任何拥有网络浏览器的人都可以输入提示并获得响应。没有任何消费产品能够像它一样迅速流行起来。几周之内,聊天GPT便生成了从大学论文到计算机代码的所有内容。人工智能又一次实现了巨大的飞跃。

第一批人工智能产品基于识别,而第二批产品则基于生成。稳定扩散和DALL-E等深度学习模型也是在那时首次亮相,它们使用一种称为扩散的技术将文本提示转换为图像。其他模型可以制作出令人惊讶的逼真的视频、语音或音乐。

这一飞跃不仅仅是技术上的。制造东西会带来不同。Chat GPT和 Gemini(来自谷歌)和 Claude(来自 Anthropic,由 Open AI的前研究人员创立)等竞争对手都像其他深度学习系统一样通过计算产生输出。但它们以新颖的方式响应请求这一事实使它们感觉与识别人脸、接受听写或翻译菜单的软件非常不同。它们确实似乎“使用语言”和“形成抽象”,就像麦卡锡所希望的那样。

评论

此博客中的热门博文

2014-2024,仅仅10年 大象公社

 《2014-2024,仅仅10年》 大象公社 十年前的夏天,年轻人不愿当公务员,国考人数锐减36万,热帖称“机关钱少活多”。 那年全国毕业生700余万,就业率超九成,复旦学生租游艇办毕业舞会,女孩们花两千元买晚礼服,夜游江海。 那年世界的齿轮咬合稳定,中美迎来建交35周年。美国民调中,超72%年轻人,将中国视为“朋友”。 夏天前,奥巴马夫人到访,体验了长城、紫禁城与成都火锅。 慕田峪长城上,总统夫人看燕山起伏,觉得一切宽阔且美妙,“长城的长度几乎相当于从美国缅因州到俄勒冈州的四倍”。 那年的国运也如山峦起伏。 夏天时,股市清冷,七成账户闲置,股民调侃关灯吃面,7月IPO开闸,并购潮掀起,年底股市单日放量7100亿,狂飙冲天。 楼市故事也相似。十年前的五一,房企奄奄一息,北京楼盘推出零首付,南京楼盘跳远减十万,上海房展出动比基尼美女吸引眼球。9月楼市松绑,炒房客陷入狂欢。 十年前的人们尚不知卷与颓,偶有下挫,也认为不过是插曲,对一切满怀自信。 贾跃亭宣布要造超级互联网汽车,罗永浩宣布要发布东半球最好用的手机。真正手机大卖的是小米,第一季度销量超过苹果。 夏天过后,雷军去乌镇参加首届互联网大会。他磕磕巴巴说,梦想还是要有,万一实现呢? 那年乌镇最风光还是BAT,三家都在硅谷设立了分支,李彦宏说机会太多,他很着急: 我们其实处在非常有意思的时代,这是魔幻一般的时代,正好我们这一代人赶上互联网的兴起。 入夜,乌镇白墙黑瓦水音桨声。丁磊拼起旧木桌,摆起乌镇宴,座中人微博记录:十几瓶黄酒喝去,陈年故事吐出,煮酒笑谈云中事,天罗地网立旌旗。 未被邀请的马云,才是那年真正的主角。十年前的夏天,阿里启动全球最大规模IPO。 上市前,马云发内部邮件,建议员工不要挥霍,处理好财富,“我们这么辛苦,可不是为了变成一群土豪”。 当年9月,阿里上市,马云登顶中国首富,万名阿里员工成千万富翁,宝马销售和房产中介堵在阿里园区门口。 十年前的夏天蒸腾如梦,浩荡热风吹过中国。北京高温刷新了1951年以来纪录,居民用水多喝出4.5个昆明湖。 济南、上海、重庆、吐鲁番尽成火炉,更大热浪在互联网彩票服务器上。那年是巴西世界杯,足彩卖出23亿。 在广州,恒大正在冲击中超三连冠,教练席上,新任助教李铁说,有很多东西不是金钱所能衡量,“我给自己十年左右的时间,争取成为国家队的主教练”。 那个夏天,恒大冰泉形象代

中国房地产泡沫早有警示信号,为何无人悬崖勒马? - 华尔街日报

纽约对冲基金经理奎林(Parker Quillen)在中国北方参观一个名为天津环亚国际(Tianjin Goldin Metropolitan)的华丽新项目时,他想知道开发商究竟会用何种方式吸引客户。 该项目的公寓起价为100万美元,此外,还计划建造一座比帝国大厦还高大的写字楼、一座歌剧院以及若干购物中心和酒店。项目总面积将超过摩纳哥的土地面积。 有吸引买家的计划吗?奎林问道。带他参观的营销代理回答说,马球。 奎林记得那人答道:“正是。” 这位营销人员当时身着马球服,带着奎林穿过一个内有100多匹马球马的马厩。奎林询问了环亚的创始人是否对该项目进行过可行性研究。该营销人员说不知道。这名创始人是一位靠销售电脑显示器致富的亿万富翁马球爱好者。 奎林说:“然后我就明白了,这个项目的想法是,国际高管会来到天津,在这里设立公司总部,理由是他们喜欢马球。”他表示:“我当时想,天哪。” 回到纽约后,奎林将更多资金投入到对中国房地产类股的做空押注中。 那是2016年,正是中国房地产热潮刚刚兴起的大好时光。即便在那时,对于任何一个有心观察的人来说,真相都显而易见: 这股热潮已经变成泡沫——而且很可能会以非常糟糕的结局收场。 然而,泡沫继续恶化,因为没有人希望盛宴终结。中国的开发商、购房者、房地产中介,甚至是为这场繁荣提供资金支持的华尔街银行,都忽视了警示信号。 开发商在投行人士和律师的帮助下,想方设法掩盖他们背负的债务金额。购房者虽然怀疑房地产市场过度膨胀,但还是在继续买房。寻求丰厚回报的中外投资者为开发商提供了大量资金。 大家当时都有一个似乎无懈可击的假设,即中国政府绝不会允许房地产市场崩溃。中国人把大部分财富都投资在了住房上。如果允许楼市暴跌,民众的大部分积蓄可能会化为乌有,对共产党的信心也会涣散。 现在,中国正为没有及早采取行动控制这一切付出代价。 目前已有50多家中国开发商拖欠国际债务。专注中国房地产的民间智库可研(Keyan)称,约有50万人失去了工作。全中国约有2,000万套住宅尚未完工,估计需要4,400亿美元才能完工。 3月份,中国主要城市二手房价格下跌5.9%。地方政府由于失去了向开发商出售土地的收入,在偿还债务方面面临困难。随着房地产和相关行业对经济增长的拖累加大,整体经济变得脆弱。房地产和相关行业一度占到中国国内生产总值的25%左右。 “一文不值” 2016年,

2023年8月,中国资本外流 490 亿美元,创 2015 年以来之最

2023年8月,中国资本外流 490 亿美元,创 2015 年以来之最,因为经济萎靡迫使投资者纷纷撤离。 彭博社汇编的国家外汇管理局数据显示,其中290亿美元流出证券投资。 上个月,外国投资者抛售了 120 亿美元的内地上市股票,创下历史新高,同时还抛售了中国债券。8 月份还出现了 168 亿美元的直接投资逆差,为 2016 年以来最严重的一次。 据彭博社报道,旅游旺季也使资本账户的下降更为严重,出境游给中国的服务业造成了损失。由于中国的入境游尚未恢复到以前的水平,服务贸易继续出现逆差。 中国上一次面临如此规模的资金外流是在 2015 年市场因货币意外贬值而陷入困境的时候。 在当前资本外流的情况下,中国政府采取了一些措施来支撑人民币,比如削减银行必须持有的外汇数量。   尽管如此,中国的离岸人民币(即在国外市场使用的自由流通货币)仍出现了大幅下跌。出口疲软和美国收益率日益增长的吸引力也助推人民币在 9 月份跌至 16 个月来的最低点。

CBS:中国非法移民是如何走线进入美国的

 在中国长期严格的 COVID 封锁摧毁了她的生意之后,一位妇女决定把两个年幼的孩子留给家人,自己前往墨西哥,从边境的一个洞口进入美国。 她并不孤单: 中国移民是试图从墨西哥进入美国的增长最快的群体。去年,美国海关和边境保护局报告称,有 3.7 万名中国公民在非法越境时被捕,比两年前增加了 50 倍。 许多移民说,他们此行是为了躲避中国日益压抑的政治气候和疲软的经济。这位母亲通过翻译告诉 "60 分钟",她的动机不仅仅是经济原因,可以用一个词来概括。 她说:"自由"。 中国移民是如何进入美国的? 移民并没有被旨在减少非法入境的政策所吓倒,他们正以前所未有的数量穿越美墨边境。去年,美国海关和边境保护局记录了两百五十万次拘留或拒绝试图从墨西哥进入美国的人的情况。 美国南部边境的移民  入境点之一是圣地亚哥以东 60 英里处边境围栏末端的一个 4 英尺缺口。偷渡者驾驶越野车沿着边境围栏狂奔,并在缺口附近放下移民。在四天时间里,"60 分钟 "目睹了近 600 名移民--成人和儿童--通过缺口,肆无忌惮地进入美国领土。 一名大学毕业生说,他从中国出发花了 40 天。他说,在前往美国边境的途中,他经过了泰国、摩洛哥、厄瓜多尔、哥伦比亚、巴拿马、哥斯达黎加和尼加拉瓜。 这个缺口是一个全球目的地,到处都是来自世界各地的旅行证件。在翻译的帮助下,"60 分钟 "采访了一些中国移民,包括一名教师、一名银行家、一些小企业主和一名工厂工人。 与通过中美洲艰苦跋涉的移民不同,一些来自中国的中产阶级移民带着滚动行李抵达。有些人说,他们乘坐飞机一路来到墨西哥。 许多人从中国飞往厄瓜多尔,因为厄瓜多尔对中国公民不需要签证。然后他们飞往提华纳。这些移民说,他们与偷渡者取得了联系,并支付了 400 美元,以便在一个小时的车程内到达边境的缺口处。 这些移民之所以知道这个缺口,是因为 TikTok。60 分钟 "回顾了该应用程序上的帖子,其中包括雇用偷渡者的步骤说明和前往边境缺口的详细路线。 穿过缺口后,移民们沿着尘土飞扬的道路步行约半英里,排队等待美国边境巡逻队的到来,以便投降。 为什么越来越多的中国移民转向美墨边境? 多年来,数以百万计的中国人持签证进入美国旅游、工作或学习。但在过去几年里,随着两国紧张局势的加

吕德文:2024年新春调查:基层存在撂挑子、脱实向虚、折腾等潜在风险

   本文作者:吕德文 ,社会学博士,武汉大学社会学院教授、博士生导师,武汉大学中国乡村治理研究中心研究员,长期从事田野调查、城乡社会观察和基层治理研究。      1、经济下行的影响是全方位的   工业园区的工厂普遍开工不足,几个厂子订单不少,但利润率下降。朋友的工厂,2023年内销非常差,但发展了一带一路国家外贸,还不错,但也有不确定性。有运往约旦一条船的货物,走了两个月还在新加坡。全年七八千万的货款,还有将近两千万没有回款,大年三十还在收款。   农民工只要想干活,找工作没问题,但不能谈待遇。前几年,如果工厂不足额发放加班工资,工人还可以反抗。现在是,只要反抗,工厂立马开工资让其走人。   调查的一个包工头,反映现在总包把利润压得极低,都是透明的,你不干有的是人想干。现在包工头的利润很有限,也得一起干活。但农民工工资有保证,都是专项账户,由包工头开单子,总包直接发到工人账户。只不过,平常只能发生活费,年底随工程进度发所有工资。   经济下行的最重要影响是大家都务实了一点,预期没那么高了,前些年地方政府透支发展以及普通人超前消费少了一些,但也造成了躺平、认命等消极心态。一些在前几年形成的新习俗顽固存在,好多人在抵抗。一位四十岁的亲戚,为人厚道,兢兢业业工作,可能也因为过于“老实”,还是单身。他说,与其花几十万彩礼娶媳妇,还不如攒钱下来养老。    2、基层面临撂挑子风险   调查的几个乡镇,多数乡镇政府勉强保运转,但多数乡镇干部绩效打折或无法兑现。有些村庄的村干部工资发不出来了。   但几乎所有地方的发展项目都受到了影响。有一个乡镇,街道挖了,但资金没法保证,停工了,过年期间道路坑坑洼洼,群众怨声载道。所有乡镇领导都说,发展是不可能了,尽力维持。   调查一个村的四个村干部,有一个村干部辞职不干,有两个村干部想辞职。村支书为了稳定村干部,帮这两个村干部找了副业,勉强维持。另一个村的村干部,因为垫资做村级事务,上级又不兑现补贴,实在受不了就辞职出去打工了,扬言垫出去的钱也不要了。   村级组织运转经费普遍无法保证,要依靠村集体自筹部分资金,但大多数村庄没有集体经济收入,只能靠乡贤向老板或政府部门化缘。因此,村书记的个人能力非常之关键。问题是,有能力的村支书,完全是凭热情,如果热情消耗,还不如辞职自己赚钱去了。调查一个村的村支书是富二代,已经下决心不干了,竟然和笔者