跳至主要内容

政府比以往任何时候都更大,它们也更无用

经济学人: 


你可能会感受到政府的能力不如以前了。2021年进入主白宫后,拜登总统承诺振兴美国的基础设施。事实上,公路和铁路等方面的支出已经开始下降。一项旨在扩大美国农村的举措人快速宽带接入的旗舰计划迄今为止国民并没有对任何人提供帮助。英国健康服务体系吸收了越来越多的资金,提供的医疗服务却越来越差。尽管能源供应短缺,德国去年仍然如此关闭了最后三座核电站。该国的火车曾经是国家骄傲的源泉,但现在却总是晚点。

您可能还注意到,政府规模比以前更大了。1960年的政府支出约为GDP的30%,而现在则超过了40%。在国家,政府经济实力的增长更加显着。自1990年代中期以来,英国的政府支出占GDP的比例上升了6个百分点,而韩国的政府支出却上升了10个百分点。所有这些都引发了一场悖论:如果政府规模如此之大,为什么它们效果这么低?

答案是,它们已经变成了所谓的“笨拙的利维坦”。近几十年来,各国政府监督了福利支出的大幅增加。由于税收没有相应增加,再分配挤占了其他政府财政支出,这反过来又损害了公共服务和官僚机构的质量。这种现象可能有助于解释为什么富裕国家的人们对政客如此缺乏信心。它也可能有助于解释为什么富裕国家的经济增长按历史标准考察很疲软。

图表:经济学家

美国拥有一些最优质的财政数据,它向我们展示了一个政府是如何变得一个笨拙的利维坦的。我们估计,在20世纪50年代初,政府在公共服务方面的支出,包括从支付教师到建造医院等所有支出,工资占该国GDP的25%(见图表)。同期,一般上面的福利支出只是一个小项目,工资和其他福利支出约占GDP的3%。的情况差别很大。美国政府在福利方面的支出激增,而在公共服务方面的支出则大幅下降。现在,这一支出约占GDP的15%。

图表:经济学家

其他国家也走了类似的道路。我们研究了长期的GDP数据,研究了政府每年在社会福利和转移支出上耗费了多少。这包括税收和税收抵免等福利标准,也包括“景点”转移支付,例如医疗保险折扣和住房帮助。这两种类型的转移支付都变得更大了。在OECD中有数据可查的国家的平均社会支出从1980年占GDP的14%上升到2022年的21%(见图表)。

图表:经济学家

此外,传统统计数据低估了变化的规模。各国政府已经积累了令人难以置信的资产保管表外债务,以便在未来拨款。根据加州大学圣地亚哥分校詹姆斯·汉密尔顿的研究,我们估计美国的时间已承诺向不同群体提供补偿,四川是美国国内生产总值的六倍(见图表)。除了报告的公共债务外,山姆大叔还为人民的银行存款、医疗保健支出和抵押贷款提供担保。他还需要兑现当前对未来退休人员的承诺。在现代国家历史上,这代表着巨大的财政承诺。

2022年,富裕国家85岁以上的人口为3300人,占总人口的2.4%——与1970年的500人(占总人口的0.5%)相比,这是一个巨大的增长。各国政府未能提高退休年龄,这对他们来说没有帮助目前国家的平均退休年龄为64岁,不高于1970年代末。但要阻止苏格兰开支将是困难的(也是不明智的)。

由于老年人的福利往往是全民性的(例如,欧洲国家几乎没有私人养老金),因此更多的支票流向了富人。我们估计,在经合组织,广义上的福利支出中,有五分之一到三分之一流向了最富裕的 20% 的家庭。美国政府花费约 4000 亿美元(约占国防部预算的一半)用于向收入最高的五分之一人口提供转移支付。2019 年,收入最高的 1% 的家庭平均从山姆大叔那里获得了 16,000 美元的转移支付,包括社会保障和医疗保险等。

图表:经济学人

对劳动年龄人口的转移支付增长速度更快。1979 年,美国收入最低的五分之一的人获得的转移支付相当于其收入的三分之一。到 2010 年代末,这一数字约为 70%,之后新冠疫情将其推高至更高水平(见图表)。加拿大和芬兰也呈现出类似的模式,这两个国家也拥有良好的长期数据。支出往往遵循棘轮效应。例如,自 1970 年代以来,领取食品券的美国人比例翻了一番,达到八分之一。在经济衰退时期,领取食品券的人数像火箭一样上升;此后,领取食品券的人数就如羽毛般下降。

总体而言,各国政府在困难时期都变得更加慷慨。在疫情期间,他们向受影响的工人和公司以及许多基本照常运营的公司提供资金。在 2022 年的能源危机期间,许多政府都置之不理。即使是历史上较为吝啬的德国政府,也拨出了 4.4% 的GDP用于保护家庭和企业免受影响的措施。最近,一些政府失去了计划。在意大利,一项鼓励房主让自己的房屋更环保的项目已经失控,政府迄今已拨出价值超过 2000 亿欧元(占GDP的 10% )的支持。

北欧天堂

如果政府能够充分有效地为自己筹措资金,福利支出的增加不一定是个问题。教科书经济学认为,再分配的社会成本来自税收和福利支出可能产生的扭曲激励。这些不能仅通过再分配的规模来判断——制度的设计才是最重要的。事实上,斯堪的纳维亚国家长期以来一直维持着大政府和繁荣的市场经济,部分原因是通过高税率增值税(扭曲程度最低的税收之一)为再分配提供资金,并压低资本税,而资本税对增长尤其有害。

但近年来,政客们更愿意表现得好像额外支出可以在不增加任何税收的情况下实现。从 20 世纪 60 年代到 90 年代,税收占富裕国家 GDP 的比例稳步上升。自 21 世纪以来,这一比例几乎没有增长。国际货币基金组织 维护的税收改革数据库(上次更新时间为 2018 年)显示,虽然 20 世纪 70 年代和 80 年代的改革在增加收入和减少收入方面平均分配,但最近的改革则侧重于减税。

到 2022 年,富裕国家约 85% 的个人所得税税基改革导致税基缩小,而只有 15% 的改革使税基扩大。过去十年最大的改革是唐纳德·特朗普总统 2017 年的巨额减税。无论是特朗普还是民主党候选人卡玛拉·哈里斯都没有承诺在未来几年进行清醒的财政管理。就当今政府实施的增加收入的措施而言,它们往往会采取巧妙的变通形式。根据我们的计算,2022 年美国联邦、州和地方政府从罚款、费用、惩罚性税和和解中筹集了 800 亿美元——占 GDP 的比重几乎是 20世纪60 年代和 70 年代的三倍。

无法增加收入的政客面临两种选择。一种是出现巨额财政赤字:今年,富裕国家政府的总赤字将达到GDP的 4.4% ,即使全球经济状况良好。另一种是通过削减其他方面的开支来资助更慷慨的福利。对公共服务的需求大幅增长。然而,到 2022 年,中等富裕国家在公共服务上的支出占GDP的 24% ,与 1992 年相同。自 1990 年代末以来,公共部门就业占总就业的比例一直在下降。从国家提供的医疗保健到教育和公共安全,一切都受到了影响。

政府的另一个历史角色——现在正在减弱——是提供高效的官僚机构。很难量化衡量这一点,但研究人员已经尝试过了。智库伯格鲁恩研究所和加州大学洛杉矶分校提供的数据结合了税收等客观指标和腐败感知等主观指标,设计出一个跨国“政府能力”衡量标准。在七国集团的发达经济体中,这一指标正在下降。另一家智库V -Dem制作的“严格公正的公共管理指数”也是如此,该指数说明了政府官员尊重法律的程度。

政府能力下降的影响无处不在。有些影响很小。在美国,住宅项目从获得建设许可到开始动工的时间间隔自 1990 年代以来增加了一倍。建筑商在填写表格和勾选方框时面临漫长的等待时间。在英国,由于法官短缺,就业法庭面临巨大的拖延,从不公平解雇到种族歧视等各种案件的听证会现在都排到了 2026 年之前。五年前,澳大利亚护照办公室的网站称申请的处理时间为“三周”;两年前说“最多六周”;去年说“至少六周”。

政府似乎也不太愿意或没有能力完成大型项目。几乎无法想象金门大桥能在一年内建成——然而,在 20 世纪 30 年代,它确实建成了。此外,在整个 20 世纪,政府在科学和研发方面投入了大量资金和智力,希望将经济增长推向更高的水平。美国为设计和传播突破性技术而采取的 DARPA 等举措表明政府的雄心壮志。在 20 世纪 50 年代和 60 年代,包括德国和日本在内的政府修建了数百万套公共住房和数百万英里的公路和铁路。

图表:经济学人

现在政客们只想活一天过一天。短期修复的支出优先于困难的长期项目。拜登大谈他的产业政策,该政策旨在重振制造业就业,减少美国对中国的依赖。实际上,与该政策相关的财政支出微不足道。在其他富裕国家,公共投资大幅下降,而政府则削减了研发部门经合组织,政府现在占研发支出的不到 10% ,与战后常态相比发生了巨大变化(见图表)。政府不再是创新的温床。几乎所有最近的人工智能发展都来自私营部门。

谈到促进增长的改革,例如劳动法的调整,各国政府几乎完全失去了兴趣。哈佛大学经济学家阿尔贝托·阿莱西纳与国际货币基金组织乔治城大学的同事于 2020 年发表了一篇论文,对监管法规等结构性改革随时间的变化进行了衡量。在 20 世纪 80 年代和 90 年代,发达经济体的政客们实施了许多改革。然而,到了 2010 年代,他们却停滞不前。根据我们对宣言项目数据的分析,经合组织的政党宣言增长的关注程度大约只有 20 世纪 80 年代初的一半。

利维坦可能永远不会笨拙。为转移支付提供资金而出现巨额赤字最终会变得极其昂贵——正如希腊和意大利等国家在2010年代所发现的那样。在某些时候,厌烦了经济增长乏力和紧急服务的民众可能会要求政客做出一些艰难的选择。不过,笨拙的利维坦是可怕的。利益集团根深蒂固,熟悉的激励措施适用,短期内更容易生存。这个系统有自己的生命力。

评论

此博客中的热门博文

中国 AI 初创公司 DeepSeek 是如何与硅谷巨头竞争的

纽约时报: DeepSeek 的工程师说,他们的系统只需要约 2000 块美国芯片制造商英伟达生产的专用计算机芯片,而美国大公司的 AI 系统需要多达 1.6 万块芯片。 Marlena Sloss/Bloomberg 圣诞节的第二天,一家名为深度求索 (DeepSeek) 的中国小型初创公司发布了一个新的人工智能系统,其功能可与 OpenAI 和谷歌等公司的尖端聊天机器人相媲美。 能做到这点本已是一个里程碑。但这个名为 DeepSeek-V3 的大模型背后的团队描述了一个更大的进步。深度求索的工程师在介绍他们如何构建这个大模型的 研究论文 中写道,他们在训练该系统时只用了领先人工智能公司用的高度专业化计算机芯片的一小部分。 这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片(如硅谷公司英伟达生产的那些)进行限制。 但 DeepSeek 大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。 据美国人工智能公司一直使用的行业基准测试,DeepSeek 聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。 而且它的造价很低,挑战了只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统的普遍观念。中国工程师称,他们只花了约 600 万美元的原始计算能力就训练了新模型,不到科技巨头 Meta 训练其最新人工智能模型所耗资金的十分之一。 “有 600 万美元资金的公司在数量上远远多于有 1 亿美元或 10 亿美元资金的公司,” 风险投资公司 Page One Ventures 的投资人克里斯 · 尼科尔森说道,他主要投资人工智能技术。 自从 OpenAI 2022 年发布了 ChatGPT,引发人工智能热潮以来,许多专家和投资者曾得出结论认为,如果不投入数亿美元购买人工智能专用芯片的话,没有公司能与行业领军者竞争。 世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达 1.6 万个芯片,甚至更多。但 DeepSeek 的工程师却说,他们只用了约 2000 个英伟达生产的专用芯片。 中国进口芯片受到限制,迫使 DeepSe...

揭秘DeepSeek:一个更极致的中国技术理想主义故事

  做贡献者,而非搭便车者。 文 | 于丽丽 编辑 | 刘旌 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。 弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。 这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA( 一种新的多头潜在注意力机制 )架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。 在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。” 在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。 多位行业人士告诉我们, 这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。 一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。” 而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见: 美国更擅长从0-1的技...

付鹏11月24日在HSBC内部演讲速记

《2024年年终回顾和2025年展望——对冲风险VS软着陆》   上篇 正值年底,虽然刚才汇丰一直强调大家不录音不录像,但大概率你挡不住。我在这儿讲话会谨慎一些,非常小心谨慎,大概率会有人透露出去,放到YouTube上,基本上所有见我都说付总我在YouTube上看过你的视频,我说那都是盗版的,靠盗版发财的也不少。 今天和大家分享的内容基本上都是官方的,回顾会多一点,展望不多,因为这个月展望完了之后下个月怎么办?有些话对我来讲我倒觉得很简单,本质上原来我们是做Hedge Fund出身,所以我们的逻辑框架整体具有极强的延续性,不是说今年去讨论,或者说明年去讨论。 惯性思维从2016年开始,我一直在跟大家强调这个世界已经完全不一样了。当然经历过过去的几年时间,我相信在座各位应该对这番话的理解变得越发深刻。 2016年实际上是美国特朗普的第一次大选,我有一个特点,我的特征是如果我觉得什么地方有投资机会,我可能第一时间去一线调研,我不喜欢看YouTube,我也不喜欢在网上扒。当然你会说,现在ChatGPT很强大了,人工智能好像能帮你解决很多问题,但你们有没有想过,可能广泛流传或者广泛传播的很多信息是错的。这一点在2012年当时我从日本做完调研回来之后,我的感悟是最深的。 当然去日本有一个重要的人物,名字叫本森特,很快大家就会非常熟悉他的,目前来讲应该是特朗普政府提名的美国财长。本森特原来是索罗斯基金实际掌控人,因为索大爷已经年龄很大了,去年的时候才刚刚把基金的业务交给他儿子亚历山大,但在这之前,最主要的几场战役本质上来讲都是本森特在主导。 2012年当时我从北京去香港约朋友们吃饭的饭局上,当时斯索罗斯基金在香港办公室跟我说,本森特从这儿去了日本。我说OK。我经常说一句话“站在巨人的肩膀上看问题。” 当然你知道,网民们最可怕的地方是巴菲特“SB”、索罗斯“SB”,我最“牛逼”。你要记住,他们的所有行为一定有很大的变化,很多人可能都不知道,巴菲特第一次去是2011年,我们正在讲福岛核电站泄漏,核废水污染以后海鲜不能吃的时候,一个80多岁的老头顶着核辐射泄漏去日本吃海鲜了,当然他去日本干吗,这其实很关键。 之后我们跑到日本做完调研回来之后那几年,我陆陆续续跟很多人讲,日本正在发生变化,日本的利率结构都会随之变化的,当然包括日本的证券市场。今年日本股市终于走出这35年了,创下...

如何从中国走线(润到)美国

经济学人: 他们来美国的原因各不相同。有些人寻求经济机会。其他人则对统治感到失望。许多人在网上看到其他中国移民穿越哥伦比亚和巴拿马之间无法无天的丛林地带,寻求更好的生活。数以万计的中国公民前往南美,这是前往美国的危险旅程的第一步。这条路线非常受欢迎,以至于它获得了一个中文昵称:走线,即走线。 过去两年,中国移民一直是穿越美国南部边境增长最快的群体。2023 年,美国边境巡逻队遇到了 3.7 万多名中国移民,高于 2022 年的 3,813 人和 2021 年的 689 人。今年前八个月又有 2.1 万人入境。他们仍然只是 2023 年试图越境的 200 万移民中的一小部分。但由于美国和中国陷入了经济、意识形态和地缘战略竞争,中国移民已成为政治焦点。 唐纳德·特朗普说,来自中国的新移民大多是适龄参军的男性。“他们是想在我们国家组建一支小军队吗?”他问道。其他共和党政客称中国移民是潜在的间谍。卡马拉·哈里斯和民主党人没有那么危言耸听,但他们也担心边境问题。在总统竞选中,移民是首要关注的问题,而中国是一个方便的反面人物,因此几乎没有人努力去了解是什么推动了这种人口流动,以及这对每个国家意味着什么。 《经济学人》花了三个月时间在哥伦比亚、墨西哥和美国进行报道。我们采访了数十名移民,以及走私者、边防警卫和专家。一些人允许我们追踪他们的移民旅程。一些人经过数周的乘船、乘公共汽车、步行和乘飞机的旅行才抵达美国。其他人则在途中失去了一切。大多数人被更美好未来的承诺所吸引,并遵循了试图利用美国不完善的移民制度的策略。但他们的旅程也揭示了中国的情况,压制性统治和日益恶化的经济萎靡不振正在将人们推向远离中国的道路。 第一部分 内科克利 对于许多中国移民来说,美洲的第一站是厄瓜多尔,直到最近,厄瓜多尔才向他们提供免签证入境。但他们很快就搬到了哥伦比亚。在那里,我们遇到了黄女士,一位 40 多岁、身穿亮粉色连衣裙的女性。她已经打破了出生地——中国西南部贵州省的一个贫穷村庄——的保守规范。村里大多数妇女终生务农和养育孩子。然而,黄女士离开家乡去了大城市,养育了两个孩子,并与嗜赌成性的丈夫离婚。她来到了加勒比海边缘的海滨小镇内科克利,即将进入哥伦比亚和巴拿马之间危险的达连峡丛林。 她两个 20 多岁的妹妹也来了。她们之前都没有离开过中国。黄女士说,她们对未来的危险知之甚少,但梦想着到达美国。自疫...

抖音平台八种算法机制的底层逻辑,不要被算法操控,要了解算法的机制

抖音是算法机制最复杂的平台之一。平台内的每一条内容、每一个短视频,背后都是由算法支配的。同时,抖音算法还影响着我们短视频的制作和发布。这篇文章为大家总结了抖音平台的八种算法机制,助力大家做好运营工作。 抖音是算法机制最复杂的平台之一。平台内的每一条内容、每一个短视频,背后都是由算法支配的。同时,抖音算法还影响着我们短视频的制作和发布。 对于做抖音短视频的运营者来说,想要高效获取到流量,摸清抖音算法至关重要! 这篇文章为大家总结了抖音平台的八种算法机制,助力大家做好运营工作。 一、流量池算法机制 抖 音的流量池是一个庞大的内容分发网络 ,是通过一系列复杂的算法和机制,将不同的内容推荐给不同的用户群体。 具体来讲: ·   抖音系统会将创作者发布的视频,先投放在一个小范围数量的用户人群中; ·   根据短视频的点击量、播放量、完播率、互动率等数据进行评估; ·   根据短视频作品的表现数据,来决定系统是否会将短视频推荐给更大用户人群的流量池。 创作者发布的短视频都会享受到抖音官方提供的推荐流量,但流量推荐量的数据范围是不一定的,这就是流量池。 抖音流量池的推荐规则如下: 种子流量池 创作者上传完短视频,视频在经过审核之后会先进入到种子流量池中,此时的流量分发人数只有数百人。如果视频在种子流量池中有很好的完播率,那么接下来才会被推荐给更多人;如果各项数据未达到要求,则会减少推荐量。 多级流量池 抖音的流量池是分级的,每一级都有不同的用户规模和推荐要求。 种子流量池中的优质视频才会获得叠加推荐,此时会进入到更高一级的初级流量池中,能够获得好的完播率和互动量的视频会紧接着推荐到中级流量池。以此类推,再到高级流量池。 这种多级流量池的设计,让优质的短视频内容可以获得更多的曝光。 延后曝光 偶尔也会出现这样一种情况,视频发布后的几天或者几周内,数据效果都不是很好,但是某天就突然火了,这就是我们说的 “延后曝光”,是抖音系统考虑了时间效应后的展示效果。 可能是因为用户翻看之前的视频时,带动了视频的播放量,抖音重新将这条视频推荐到更大的流量池中,从而获得新的曝光。 对于创作者来说,想要突破抖音冷启动流量池,就需要密切关注下面几个指标: 二、标签算法机制 无论是创作者,还是用户,都会被抖音系统打上不同类型的标签。 · ...

疯狂的幻方:一家隐形AI巨头的大模型之路

暗涌Waves 文  | 于丽丽 在蜂拥而至的大模型团战中,幻方大概是最异类的一个。 这是一场注定是少数人的游戏,很多创业公司在大厂入局后开始调整方向甚至萌生退意,而这家量化基金却孤绝前行。 5月,幻方把下场做大模型的独立新组织,命名为“深度求索”,并强调将专注于做真正人类级别的人工智能。他们的目标,不只是复刻ChatGPT,还要去研究和揭秘通用人工智能(AGI)的更多未知之谜。 不仅如此,在这个被认为格外依赖稀缺人才的赛道,幻方还试图去集结一批有执念的人,并祭出了他们认为的最大武器:一群人的好奇心。 在量化领域,幻方是一家抵达过千亿规模的“顶级基金”,但它被这波AI新浪潮集中关注到,其实还颇具戏剧性。 当国内云厂商高性能GPU芯片缺货成为限制中国生成式AI诞生的最直接因素时,据《财经十一人》报道, 国内拥有超过1万枚GPU的企业不超过5家。而除几家头部大厂外,还包括一家名为幻方的量化基金公司。通常认为,1万枚英伟达A100芯片是做自训大模型的算力门槛。 其实,这家很少被置于人工智能视野打量的公司,早已是一家隐秘的AI巨头:2019年,幻方量化成立AI公司,其自研的深度学习训练平台“萤火一号”总投资近2亿元,搭载了1100块GPU;两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。 这意味着,单从算力看,幻方甚至比很多大厂都更早拿到了做ChatGPT的入场券。 只是大模型对算力、算法和数据都有强依赖,所以起步就需要5000万美金,训练一次需要上千万美金,非百亿美金公司其实很难持续跟进。各种艰难之下,幻方却很乐观,创始人梁文锋告诉我们:“关键是我们想做这件事,能做这件事,那我们就是最合适的人选之一。” 这种谜之乐观,首先来自幻方的独特成长路径。 量化投资是一个源自美国的舶来品,这使得几乎所有中国的头部量化基金创始班底,都或多或少有过美国或欧洲对冲基金的履历。唯独幻方是一个例外:它完全是本土班底起家,独自摸索着长大。 2021年,成立仅六年的幻方,抵达千亿规模,并被称为“量化四大天王”之一。 以局外人杀入的成长路径,让幻方始终像一个搅局者。多位行业人士向我们表示,幻方“无论研发体系、产品还是销售,都始终在用一种崭新的方式,切入到这个行业中来。” 一家头部量化基金创始人认为,这些年的幻方,始终“没有按照某种约定成俗的道路在走”,而是...

中国 AI 公司另辟蹊径快速追赶美国同行 - WSJ

尽管中国购买先进制程的芯片面临种种限制,但开发者们已经找到了变通途径。有迹象表明,中国初创企业追赶美国领先的 AI 模型的速度要比业内许多人预期的更快。 DeepSeek 是一家由中国最成功的对冲基金公司之一投资的初创公司,该公司在 11 月发布了最新大语言模型的预览版。该公司当时表示,该程序的能力优于 OpenAI 的推理模型 “o1”,后者于 9 月以预览版的形式发布。 近几周,其他中国公司也作出了类似的表态。由中国互联网巨头阿里巴巴 (Alibaba) 和腾讯 (Tencent) 支持的初创公司月之暗面 (Moonshot AI) 表示,该公司开发了一种专门研究数学的模型,其能力接近“o1”,与此同时,阿里巴巴表示,自己的一个实验性研究模型在数学方面优于 o1 模型的预览版。 这些公司尚未发表描述其模型的论文,而且由于目前还没有一个公认的 AI 模型能力测试标准,因此很难评估这些说法。尽管如此,一些美国专家表示,他们对此印象深刻。 “中国正在加速追赶,”OpenAI 前研究员、如今的 AI 创业者安德鲁 · 卡尔 (Andrew Carr) 说。他说,试图复制 OpenAI 推理模型的 DeepSeek 研究人员“在几个月内就搞定了,坦率地说,我的许多同事对此感到惊讶”。 其中一项用于比较的测试是美国数学邀请赛 (American Invitational Mathematics Examination, 简称 AIME),该竞赛是为最聪明的高中学生举办的数学挑战赛。 DeepSeek 表示,其模型在 AIME 测试中胜过了 OpenAI 的模型。《华尔街日报》(The Wall Street Journal)利用今年 AIME 的 15 道题进行的一项实验发现,OpenAI 的 “o1” 预览版模型得出答案的速度比 DeepSeek、月之暗面和阿里巴巴的实验模型更快。例如,一个假设的双人博弈问题需要用到策略来解字谜,OpenAI 的程序在 10 秒内给出了答案,而 DeepSeek 花了 2 分多钟。 在第一次尝试时就得到正确答案仍然非常了不起,因为文字题常常难倒 AI 程序。 自 2022 年以来,中国 AI 开发者面临美国对其获得全球最先进制程 AI 芯片的限制,包括来自芯片领导者 英伟达   (Nvidia) 的芯片。拜登 (Biden) 政府...

Revealing DeepSeek: A more extreme story of Chinese technological idealism

  文 | 于丽丽    Wen | Yu Lili 编辑 | 刘旌    Edit | Liu Jing 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 Of the 7 major model startups in China, DeepSeek is the least silent, but it can always be remembered in an unexpected way. 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 A year ago, this kind of quantitative private equity giant fantasies that did not mean to derive behind it was the only company outside the large factory that reserved 10,000 A100 chips. One year later, it came from it to trigger the source of China's big model price war. 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 In May, which was bombarded by AI, Deepseek became famous. The reason is that they released an open source model called DeepSeek V2, which provides an unprecedented cost-effectiveness: the reasoning cost of reasoning is reduced to only 1 yuan per millio...

特朗普就职演讲中英文全文

谢谢,谢谢大家,非常感谢你们。非常非常感谢。副总统万斯,众议院议长约翰逊,参议员图恩,美国首席大法官罗伯茨,以及美国最高法院的大法官们。 克林顿总统、布什总统、奥巴马总统、拜登总统、哈里斯副总统,以及我的各位同胞, 美国的黄金时代从现在开始 。 从今天起,我们的国家将再次繁荣,并在全世界受到尊重。我们将成为每个国家的羡慕对象,不再让自己受到剥削。 在特朗普政府的每一天,我都会把美国放在第一位 。 我们的主权将被夺回。我们的安全将得到恢复。正义的天平将重新平衡。司法部和我们政府的恶劣、暴力和不公正的武器化将结束。 我们的首要任务是创造一个骄傲、繁荣和自由的国家。美国将很快变得更伟大、更强大,并且比以往任何时候都更加卓越。 我自信和乐观地回到总统职位上,我们正处于一个令人兴奋的新国家成功时代的开始。一股变革的浪潮正在席卷整个国家,阳光洒遍全世界,美国有机会前所未有地抓住这一机遇。 但是首先,我们必须诚实面对我们面临的挑战。虽然挑战很多,但它们将被美国当前所见证的这一伟大势头摧毁。 今天我们聚集在一起时,我们的政府正面临一场信任危机。多年来,一个激进且腐败的体制从我们的公民手中攫取权力和财富,而我们社会的支柱却破碎不堪,似乎完全失修。 我们现在的政府连国内的简单危机都无法应对,同时还在海外接二连三地陷入灾难性事件。 它未能保护我们辉煌、守法的美国公民,却为危险的罪犯提供庇护和保护,这些罪犯许多来自监狱和精神机构,他们非法进入我们的国家。我们有一个政府,无限制地资助外国边界的防御,却拒绝保护美国的边界,或者,更重要的是,保护自己的人民。 我们的国家在紧急情况下已经无法提供基本服务,这一点最近由北卡罗来纳州的优秀人民证明了。他们受到如此糟糕的对待。而其他几个州在几个月前发生飓风后仍在遭受痛苦。 或者更近的是洛杉矶,我们正在目睹大火仍在无情地燃烧。从几周前开始,它们毫无防备地横扫房屋和社区,甚至影响到我们国家一些最富有和最有权势的人,其中一些人现在就坐在这里。他们已经无家可归了。这很有趣。 但是我们不能让这种情况发生。每个人都无能为力。这将会改变。我们的公共卫生系统在灾难时无法提供帮助,却在其上花费了比世界上任何国家都要多的钱。 我们的教育系统则教导我们的孩子为自己感到羞愧,在许多情况下,教他们仇恨我们的国家,尽管我们试图如此绝望地向他们提供爱。所有这一切将从今天开始改变,而且...

三联深度:逃出妙瓦底 缅甸诈骗园区

 原创 飞天小豚 三联生活周刊 2025年01月10日 18:06 北京 *本文为「三联生活周刊」原创内容 没有高薪,没有偷渡,更没有去缅甸、柬埔寨这些危险的国家,中国留学生李奥不明白,为什么自己只是在安全的国家想正常找一份工作,却不断跌入招聘陷阱,最终沦为人口贩卖的牺牲品。在经历过一场在缅东的死亡之旅后他才明白,海外华人招聘圈已经被博彩、诈骗等灰色产业渗透,而印象中的那些城市,已经不同以往。 记者|夏杰艺 实习记者|顾靓楠 陷阱 2022年6月5日,李奥站在东南亚一条混浊的泥水河前。河很窄,不过五六米,两岸是一样的黄褐色烂泥地和杂乱的野树林,河面上一条孤零零的小船。 很久之后他才知道,这条不起眼的小河是莫伊河,位于泰缅边境交界处,是知名的偷渡“天堂”。 这里荒无人烟,见不到警察和海关人员,和他同行的是一个肯尼亚女人和一个二三十岁的中国男子。三人的背后跟着四名大汉,他们不怎么说话,但其中一人手上拿着一把小臂长的砍刀,明晃晃的。 泰缅边境的莫伊河岸(摄于2022年) “They are human traffic.”旁边的肯尼亚女人意识到自己的命运,轻声说道。李奥也明白,他们三人已经沦为“猪仔”——人口贩卖的牺牲品。 李奥是浙江台州人,27岁,高二时被父母送到英国读书,随后进入英国利物浦大学学习,但因家中破产被迫辍学,没能获得高中和大学文凭。他的唯一优势是英语,所以工作后有一半时间都在中东、非洲等地的华人企业就职,从事翻译或行政工作。在李奥看来,海外华人企业的待遇更优厚:工资大多在每月一万五千元以上,还包食宿。 2022年初,他先是在肯尼亚的蒙巴萨为江门机械松林有限公司工作,后来又换到阿联酋阿布扎比,在中国通信服务(CCS)的分公司做项目经理,由于岗位期望与公司产生冲突,5月,他辞职来到迪拜,边旅行边求职。 李奥对本刊回忆,自己当时在迪拜当地的华人生活网站“迪拜全酋通”上浏览招聘信息,注意到了一家泰国曼谷的企业。该企业声称从事跨境电商业务,老板需要招聘一名助理兼翻译。该企业跟李奥约了一次英文电话面试,并要求他录制了一则自我介绍的英文短片,然后发放了入职邀请。在李奥看来,该企业和大部分他打过交道的海外华人企业类似——入职程序比较随意,薪资每月一万多元,包住宿和来程机票,但不愿意给劳动者办工签,而是以旅游签入境。“曼谷,在我心里还是一个比较安全、讲法治的地方,...