跳至主要内容

人工智能(AI)简史

 经济学人:

1956 年夏天,一小群人聚集在美国新罕布什尔州的达特茅斯学院,他们规模虽小,但都很杰出。其中包括信息论的创始人克劳德 · 香农,以及唯一同时获得瑞典皇家科学院颁发的诺贝尔经济学奖和美国计算机协会颁发的图灵奖的人赫伯 · 西蒙。年轻的研究员约翰 · 麦卡锡把他们召集在一起,想讨论 “如何让机器使用语言、形成抽象和概念” 以及“解决现在只能由人类解决的各种问题”。这是第一次学术聚会,专门讨论麦卡锡所说的“人工智能”。它为该领域接下来的 60 多年树立了模板,使之没有取得与其雄心相媲美的进展。

达特茅斯会议并没​​有标志着对能像人一样思考的机器的科学探索的开始。图灵奖以他的名字命名,他曾对此感到好奇;麦卡锡的灵感来源约翰 · 冯 · 诺依曼也是如此。到了 1956 年,已经出现了许多对这一问题的探讨;历史学家认为,麦卡锡为他的项目创造了人工智能 (后来的 AI) 一词的原因之一是,它足够宽泛,可以涵盖所有方法,而哪种方法最好则没有答案。一些研究人员青睐基于将世界事实与几何、符号逻辑等公理相结合的系统,以便推断出适当的反应;另一些人则倾向于建立一个系统,在这个系统中,一件事的概率取决于许多其他事物的概率(这些概率不断更新)。

                                        资料来源:斯坦福大学 2024 年人工智能指数报告

在接下来的几十年里,人工智能在学术界掀起了轩然大波,引发了激烈的争论。但到了 20 世纪 80 年代,大家对未来的发展方向达成了广泛共识:“专家系统”使用符号逻辑来捕捉和应用人类最精湛的技术。日本政府尤其支持这种系统及其可能需要的硬件。但在大多数情况下,这种系统过于死板,无法应对现实世界的混乱。到 20 世纪 80 年代末,人工智能声名狼藉,成为言过其实、交付不足的代名词。那些仍在该领域的研究人员开始回避这个术语。

正是这些坚持不懈的人们,催生了今天的繁荣。20 世纪 40 年代,随着脑细胞(一种神经元)工作方式的雏形被拼凑起来,计算机科学家开始怀疑机器是否可以以同样的方式连接起来。在生物大脑中,神经元之间存在连接,这使得一个神经元的活动可以触发或抑制另一个神经元的活动;一个神经元的活动取决于与其相连的其他神经元的活动。达特福德与会者马文·明斯基首次在实验室中尝试对此进行建模,使用硬件来模拟神经元网络。从那时起,互连的神经元层就开始用软件进行模拟。

这些人工神经网络不是使用明确的规则进行编程的,而是通过接触大量示例来“学习”。在训练过程中,神经元之间的连接强度(称为“权重”)会反复调整,最终给定的输入会产生适当的输出。明斯基本人放弃了这个想法,但其他人将其发扬光大。到 20 世纪 90 年代初,神经网络已经经过训练,能够通过识别手写数字来帮助对帖子进行分类。研究人员认为,增加更多层神经元可能会实现更复杂的效果。但这也使系统运行速度大大降低。

一种新型计算机硬件为解决这个问题提供了方法。2009 年,斯坦福大学的研究人员利用宿舍里的一台游戏电脑,将神经网络的运行速度提高了 70 倍,这一发现极大地证明了这种硬件的潜力。之所以能够做到这一点,是因为除了所有电脑都有的“中央处理器”(cpu )外,这款电脑还配备了“图形处理单元”(gpu),可以在屏幕上创建游戏世界。而且,gpu 的设计方式非常适合运行神经网络代码。

将硬件加速与更高效的训练算法相结合,意味着拥有数百万个连接的网络可以在合理的时间内完成训练;神经网络可以处理更大的输入,而且最重要的是,可以拥有更多的层数。这些“更深层”的网络被证明更加强大。

这种新方法被称为“深度学习”,其威力在 2012 年的 ImageNet 挑战赛中初露锋芒。参赛的图像识别系统获得了一个包含超过一百万个带标签图像文件的数据库。对于任何给定的单词,例如“狗”或“猫”,数据库中都包含数百张照片。图像识别系统将使用这些示例进行训练,将以图像形式的输入“映射”到以单词描述形式的输出上。然后,系统被要求在输入之前从未见过的测试图像时生成这样的描述。2012 年,当时在多伦多大学工作的杰夫·辛顿 (Geoff Hinton) 领导的团队使用深度学习实现了 85% 的准确率。它立即被认为是一项突破。

到 2015 年,图像识别领域几乎所有人都在使用深度学习,ImageNet 挑战赛的获胜准确率已达到 96%——高于人类的平均得分。深度学习还被应用于许多其他“人类专属问题”,这些问题可以归结为将一种事物映射到另一种事物上:语音识别(将声音映射到文本)、人脸识别(将人脸映射到姓名)和翻译。

在所有这些应用中,通过互联网获取的大量数据对于成功至关重要;此外,使用互联网的人数表明了巨大市场的可能性。网络越大(即越深),获得的训练数据越多,其性能就越好。

深度学习很快就被应用于各种新产品和服务中。亚马逊 Alexa 等语音驱动设备问世。在线转录服务变得实用。网络浏览器提供自动翻译。说这些事情是由人工智能实现的听起来很酷,而不是令人尴尬,尽管这也有点多余;当时和现在,几乎所有被称为人工智能的技术实际上都依赖于深度学习。

2017 年,计算能力和数据量的增加带来了质的变化:一种排列神经元连接的新方法,称为变换器。变换器使神经网络能够跟踪输入中的模式,即使模式中的元素相距甚远,也能够让神经网络将“注意力”集中在数据中的特定特征上。

Transformer 让网络能够更好地掌握上下文,这使它们适合一种称为“自我监督学习”的技术。本质上,在训练过程中,一些单词被随机删除,然后模型会自学填写最有可能的候选词。由于训练数据不必事先标记,因此可以使用从互联网上获取的数十亿个单词的原始文本来训练此类模型。

注意你的语言模型

2019 年,基于 Transformer 的大型语言模型(LLM )开始引起更广泛的关注,当时初创公司Open AI发布了GPT-2模型( GPT代表生成式预训练 Transformer)。事实证明,此类LLM能够表现出未经过明确训练的“突发”行为。吸收大量语言不仅使它们出人意料地擅长总结或翻译等语言任务,而且还擅长训练数据中隐含的事情(例如简单的算术和软件编写)。不太好的是,这还意味着它们会在输入的数据中重现偏见,这意味着人类社会许多普遍存在的偏见都会在它们的输出中显现出来。

2022 年 11 月,更大的开放AI模型GPT-3.5以聊天机器人的形式向公众展示。任何拥有网络浏览器的人都可以输入提示并获得响应。没有任何消费产品能够像它一样迅速流行起来。几周之内,聊天GPT便生成了从大学论文到计算机代码的所有内容。人工智能又一次实现了巨大的飞跃。

第一批人工智能产品基于识别,而第二批产品则基于生成。稳定扩散和DALL-E等深度学习模型也是在那时首次亮相,它们使用一种称为扩散的技术将文本提示转换为图像。其他模型可以制作出令人惊讶的逼真的视频、语音或音乐。

这一飞跃不仅仅是技术上的。制造东西会带来不同。Chat GPT和 Gemini(来自谷歌)和 Claude(来自 Anthropic,由 Open AI的前研究人员创立)等竞争对手都像其他深度学习系统一样通过计算产生输出。但它们以新颖的方式响应请求这一事实使它们感觉与识别人脸、接受听写或翻译菜单的软件非常不同。它们确实似乎“使用语言”和“形成抽象”,就像麦卡锡所希望的那样。

评论

此博客中的热门博文

2014-2024,仅仅10年 大象公社

 《2014-2024,仅仅10年》 大象公社 十年前的夏天,年轻人不愿当公务员,国考人数锐减36万,热帖称“机关钱少活多”。 那年全国毕业生700余万,就业率超九成,复旦学生租游艇办毕业舞会,女孩们花两千元买晚礼服,夜游江海。 那年世界的齿轮咬合稳定,中美迎来建交35周年。美国民调中,超72%年轻人,将中国视为“朋友”。 夏天前,奥巴马夫人到访,体验了长城、紫禁城与成都火锅。 慕田峪长城上,总统夫人看燕山起伏,觉得一切宽阔且美妙,“长城的长度几乎相当于从美国缅因州到俄勒冈州的四倍”。 那年的国运也如山峦起伏。 夏天时,股市清冷,七成账户闲置,股民调侃关灯吃面,7月IPO开闸,并购潮掀起,年底股市单日放量7100亿,狂飙冲天。 楼市故事也相似。十年前的五一,房企奄奄一息,北京楼盘推出零首付,南京楼盘跳远减十万,上海房展出动比基尼美女吸引眼球。9月楼市松绑,炒房客陷入狂欢。 十年前的人们尚不知卷与颓,偶有下挫,也认为不过是插曲,对一切满怀自信。 贾跃亭宣布要造超级互联网汽车,罗永浩宣布要发布东半球最好用的手机。真正手机大卖的是小米,第一季度销量超过苹果。 夏天过后,雷军去乌镇参加首届互联网大会。他磕磕巴巴说,梦想还是要有,万一实现呢? 那年乌镇最风光还是BAT,三家都在硅谷设立了分支,李彦宏说机会太多,他很着急: 我们其实处在非常有意思的时代,这是魔幻一般的时代,正好我们这一代人赶上互联网的兴起。 入夜,乌镇白墙黑瓦水音桨声。丁磊拼起旧木桌,摆起乌镇宴,座中人微博记录:十几瓶黄酒喝去,陈年故事吐出,煮酒笑谈云中事,天罗地网立旌旗。 未被邀请的马云,才是那年真正的主角。十年前的夏天,阿里启动全球最大规模IPO。 上市前,马云发内部邮件,建议员工不要挥霍,处理好财富,“我们这么辛苦,可不是为了变成一群土豪”。 当年9月,阿里上市,马云登顶中国首富,万名阿里员工成千万富翁,宝马销售和房产中介堵在阿里园区门口。 十年前的夏天蒸腾如梦,浩荡热风吹过中国。北京高温刷新了1951年以来纪录,居民用水多喝出4.5个昆明湖。 济南、上海、重庆、吐鲁番尽成火炉,更大热浪在互联网彩票服务器上。那年是巴西世界杯,足彩卖出23亿。 在广州,恒大正在冲击中超三连冠,教练席上,新任助教李铁说,有很多东西不是金钱所能衡量,“我给自己十年左右的时间,争取成为国家队的主教练”。 那个夏天,恒大冰泉形象代

中国房地产泡沫早有警示信号,为何无人悬崖勒马? - 华尔街日报

纽约对冲基金经理奎林(Parker Quillen)在中国北方参观一个名为天津环亚国际(Tianjin Goldin Metropolitan)的华丽新项目时,他想知道开发商究竟会用何种方式吸引客户。 该项目的公寓起价为100万美元,此外,还计划建造一座比帝国大厦还高大的写字楼、一座歌剧院以及若干购物中心和酒店。项目总面积将超过摩纳哥的土地面积。 有吸引买家的计划吗?奎林问道。带他参观的营销代理回答说,马球。 奎林记得那人答道:“正是。” 这位营销人员当时身着马球服,带着奎林穿过一个内有100多匹马球马的马厩。奎林询问了环亚的创始人是否对该项目进行过可行性研究。该营销人员说不知道。这名创始人是一位靠销售电脑显示器致富的亿万富翁马球爱好者。 奎林说:“然后我就明白了,这个项目的想法是,国际高管会来到天津,在这里设立公司总部,理由是他们喜欢马球。”他表示:“我当时想,天哪。” 回到纽约后,奎林将更多资金投入到对中国房地产类股的做空押注中。 那是2016年,正是中国房地产热潮刚刚兴起的大好时光。即便在那时,对于任何一个有心观察的人来说,真相都显而易见: 这股热潮已经变成泡沫——而且很可能会以非常糟糕的结局收场。 然而,泡沫继续恶化,因为没有人希望盛宴终结。中国的开发商、购房者、房地产中介,甚至是为这场繁荣提供资金支持的华尔街银行,都忽视了警示信号。 开发商在投行人士和律师的帮助下,想方设法掩盖他们背负的债务金额。购房者虽然怀疑房地产市场过度膨胀,但还是在继续买房。寻求丰厚回报的中外投资者为开发商提供了大量资金。 大家当时都有一个似乎无懈可击的假设,即中国政府绝不会允许房地产市场崩溃。中国人把大部分财富都投资在了住房上。如果允许楼市暴跌,民众的大部分积蓄可能会化为乌有,对共产党的信心也会涣散。 现在,中国正为没有及早采取行动控制这一切付出代价。 目前已有50多家中国开发商拖欠国际债务。专注中国房地产的民间智库可研(Keyan)称,约有50万人失去了工作。全中国约有2,000万套住宅尚未完工,估计需要4,400亿美元才能完工。 3月份,中国主要城市二手房价格下跌5.9%。地方政府由于失去了向开发商出售土地的收入,在偿还债务方面面临困难。随着房地产和相关行业对经济增长的拖累加大,整体经济变得脆弱。房地产和相关行业一度占到中国国内生产总值的25%左右。 “一文不值” 2016年,

数千亿美元资金如何绕开管制逃离中国 - WSJ

  经济学家和《华尔街日报》(The Wall Street Journal) 的一项数据分析显示,过去几年中国资本外逃规模似乎令 2015 年和 2016 年相形见绌,那时的中国正遭遇着上一轮房地产市场低迷,引发了以美元计价的最大的一波资本外流。 《华尔街日报》的统计显示,在截至今年 6 月底的四个季度里,可能有多达 2,540 亿美元的资金非法流出中国。这超过了近 10 年前的那波资本外逃,当时的资金外流曾引发人们对中国可能爆发金融危机的担忧。但对这类资金外流的估计本身并不精确,而且,由于现在中国整体经济规模比当时大得多,资本外逃占中国经济总量的比例似乎也小于当时。 一些没有被统计在内的资金可能包括滞留在海外的出口收入,这些资金没有被带回中国,而是留在海外享受更高的存款利率和投资机会。 即便如此,这种现象对中国决策者来说仍值得担忧。在中国官员专注于严格管理人民币汇率之际,资本外流加大了人民币的压力,不过中国政府近期为刺激经济而采取的措施正在提振人民币和中国股市,可能会促使人们暂时将更多资金留在中国。 大批资本逃离也突显出一个事实,那些有资源,有财力,能把资金带出国门的人,对中国经济的发展道路越来越没有信心。 心灰意冷的投资者 为了绕开政府管制,人们用上了各种老办法,比如将贵重物品运往海外,或是为进口商品支付过高的价格,这些办法屡试不爽,但依然要冒风险。还有一些人想出了新点子,比如将装载着加密货币的电脑硬盘运往其他司法辖区,并在那里兑换成现金。 造成资金外流的原因包括新冠疫情,政府对民营部门的打击,以及人们广泛担心中国的高速增长时代已经结束。 国际货币基金组织 (International Monetary Fund, 简称 IMF) 数据显示,到本十年末,中国经济增速预计将从目前的 5% 左右放缓至 3% 左右,而 2020 年以前的增长率接近 7%。据巴克莱 (Barclays) 估计,2021 年以来,中国史诗级的房地产市场崩盘估计已导致约 18 万亿美元的家庭财富灰飞烟灭。 尽管中国政府最近出台的刺激措施(包括承诺加大财政支出)可能在一定程度上提振今年的经济增长,但现在断言这些措施能否带动经济持续复苏为时过早。 从长远来看,中国面临劳动力老龄化和萎缩带来的严峻挑战,而在贸易、安全和技术等一系列问题上,中国与美国领导的西方世界也陷入冲突。 中国官员试图用被抓

2023年8月,中国资本外流 490 亿美元,创 2015 年以来之最

2023年8月,中国资本外流 490 亿美元,创 2015 年以来之最,因为经济萎靡迫使投资者纷纷撤离。 彭博社汇编的国家外汇管理局数据显示,其中290亿美元流出证券投资。 上个月,外国投资者抛售了 120 亿美元的内地上市股票,创下历史新高,同时还抛售了中国债券。8 月份还出现了 168 亿美元的直接投资逆差,为 2016 年以来最严重的一次。 据彭博社报道,旅游旺季也使资本账户的下降更为严重,出境游给中国的服务业造成了损失。由于中国的入境游尚未恢复到以前的水平,服务贸易继续出现逆差。 中国上一次面临如此规模的资金外流是在 2015 年市场因货币意外贬值而陷入困境的时候。 在当前资本外流的情况下,中国政府采取了一些措施来支撑人民币,比如削减银行必须持有的外汇数量。   尽管如此,中国的离岸人民币(即在国外市场使用的自由流通货币)仍出现了大幅下跌。出口疲软和美国收益率日益增长的吸引力也助推人民币在 9 月份跌至 16 个月来的最低点。

中国股市迎来牛市,投资者该买哪些股票?

WSJ: 短短10天,中国股市就从乏人问津变成了今年表现最佳的市场,香港金融服务公司Gavekal的负责人Louis-Vincent Gave认为中国牛市已开启。 周三上午,iShares安硕MSCI中国ETF上涨6%,至55.67美元。过去两周,该基金累计上涨35%,此前中国政府各部门协同推出了一系列措施来稳定经济,包括进一步降息,对六家最大银行进行资本重组以应对房地产危机导致的债务上升压力,以及承诺推出更多刺激措施。 部分刺激措施的规模和范围细节尚未披露,因此未来几周市场可能会出现一些波动,具体取决于中国政府公布的信息。尽管中国经济仍面临结构性挑战,家庭和企业信心遭受重创可能需要一段时间才能恢复,但投资者往往会在情况从极度糟糕变成只是糟糕时赚得盆满钵满,尤其是在大多数人此前出于地缘政治和经济担忧而避开中国市场的情况下。中国政府现在至少表现出了要解决国内经济问题的意图,这是一个值得注意的转变。“我们看到(投资者的)看法发生了变化,”资深亚洲观察人士Gave在一个网络研讨会上表示。“中国已经进入牛市。当牛市启动时,它们会自行加强势头。” 中国市场容易出现五年一次的牛熊交替周期,牛市期间通常会有100%的涨幅,Gave认为最近的上涨就是这样一个周期的开始。在这种势头的背后,是股市背景的180度大转弯,从一系列指标看,中国股票都被严重低估。糟糕的势头、政策逆风和人民币疲软等许多负面因素都已逆转。 “你现在不投资,什么时候投资?”Gave说。“股价低,势头好,现在政府又助一臂之力。这构成三重有利局面。” Gave之所以感到乐观,部分源于美联储在中国政府采取刺激行动之前就已降息。这一转变改变了汇率动态,也改变了许多中国企业家和其他人在香港或其他地方持有美元的理由。 那些在香港持有美元、在美联储降息前赚取5%利息的人,换算成人民币的回报率曾接近8%至10%,因为人民币此前一直在贬值。但由于美联储降息,上述计算已发生足够大的变化,这些投资者现在正寻找其他地方投资,比如中国股市——如果不在内地,就在香港。这种买盘为中国股市的暴涨提供了一定助力。 Gave表示,近年来,中国政府决定整顿房地产市场和民营部门,虽然一些人认为这样的行动是政策失误,但这原本可能是解决中国自身弱点的一项更广泛计划的一部分。他指出,随着美中关系恶化,中国债务水平不断上升,社会不平等加剧,还有对西方存在过度依赖