跳至主要内容

中国创新之路 | 外交事务

 

华盛顿不能再让硅谷自行其是了。

几十年来,许多美国人嘲笑中国是一个盲目模仿的国家,缺乏创造力,更不用说突破性创新了。人们认为,威权主义和中央计划天生就不利于新思想。许多美国人认为,快速的技术进步需要一种无所畏惧的“颠覆性”思维,而这种思维在一个自由民主的社会中最为常见。

然而,过去几年,这种说法发生了变化,对美国技术优势的任何自满情绪都消失了。商业专栏文章解释中国似乎缺乏创新能力,现在则变成了警告中国将在人工智能和 5G 等战略技术领域超越美国的专栏文章。长期以来,华盛顿的政策制定者一直满足于将技术留给硅谷,现在他们正在竞相寻找方法来增强美国的技术能力并制衡中国的进步。但制定有效的技术政策需要清楚地了解两国是如何走到今天这一步的,以及这对未来意味着什么。

传统上,对中国崛起的解释主要集中在窃取知识产权上。尽管知识产权确实发挥了一定作用,使中国制造商能够大量生产特定产品的仿制品,但将中国快速发展仅仅归结为知识产权盗窃,未免过于简单。事实上,这种误解误导了美国政策制定者,使他们相信,要保持美国的技术优势,只需切断中国获取新兴技术的渠道。中国技术腾飞的根源更为复杂,制定有效的美国政策应对措施需要对新兴技术有扎实的了解,并具有一定程度的投射同理心——了解雄心勃勃的中国官员如何看待创新以及可用于鼓励创新的各种工具。

国家干预

任何一项中国创新都是勤奋的技术人员创造性思维的产物。从微观层面看,这些创新过程在中国和其他地方大同小异。但要从宏观层面解释中国的技术崛起,就需要了解中国政府为鼓励发展世界上最具活力的创新生态系统之一而采取的措施。

从中国的角度来看,创新并不是一项只有特殊人才可以完成的微妙或神秘的事业,也绝对不是必须免受政府干预的事情。相反,创新被视为一个社会和经济过程,可以通过物质资源和官僚决心的正确组合来引导和加速。尽管中国的做法与硅谷根深蒂固的自由市场和言论自由的必要性假设相矛盾,但它取得的技术进步和商业成功比大多数美国专家认为的要多。在中国,这一过程涉及三个关键步骤。

近年来,对美国技术优势的任何自满情绪都已消失。

这一进程的第一步是在 2000 年至 2010 年间进行的,中国要创建一个大型的半保护市场。培育新兴的创新生态系统需要市场足够有利可图,以促进激烈的竞争,但也需要一定程度的保护,以防止硅谷的老牌巨头进入并碾压本地初创企业,使其无法起步。中国通过将数十年的飞速经济增长与防火墙的建立结合起来,实现了这种平衡,防火墙阻止了对 Facebook 和 Google 等领先的外国在线平台的访问。赢得中国庞大国内市场的前景吸引了来自国外的巨额资本投资,并促进了激烈的竞争,但防火墙也为本地初创企业提供了与外国竞争对手竞争的机会。

至关重要的是,防火墙从来都不是坚不可摧的。在过去二十年的大部分时间里,防火墙总是存在一些漏洞,使中国市场免受外国竞争的影响,但从未完全将其与新创意隔离开来。谷歌、Facebook 和 Twitter 在中国竞争多年后才被封锁。Airbnb、Uber、亚马逊和 LinkedIn 等政治敏感度较低的消费者平台从未被完全封锁;相反,它们被本土初创公司击败。防火墙的漏洞让中国企业家、工程师和科学家能够及时了解领先的技术趋势和产品,而不会让这些产品占据中国市场。同时,中国市场的规模让外国科技公司在与中国政府互动时保持最佳行为,希望有一天能让他们获得 10 亿新客户。

中美合作

这些关系对于该进程的第二步也是最具争议的一步至关重要。几十年来,中国一直与西方领先的公司、大学和实验室(尤其是美国的)保持着科研和商业联系。从美国大学的教授与中国同行合作开展公共人工智能研究,到中国风险投资家投资硅谷初创企业,不一而足。批评人士倾向于将这些联系视为盗窃知识产权的媒介,用五角大楼 2018 年的一份报告的话来说,这是中国间谍窃取“美国创新皇冠上的宝石”的敲门砖。工业和科学间谍活动一直是一个大问题,但这些跨太平洋联系的最大影响不是来自偷窃,而是来自学习。接触世界一流的创新流程为中国提供了智力素材——想法、最佳实践和运营模式——以点燃其新生的科技生态系统。 

从 2008 年左右开始,曾在谷歌工作过的中国工程师开始回国创办自己的初创公司,并将硅谷的一些文化带到了中国。中国大学的研究人员开始与国外同行进行更多合作,从而接触到新方法。中国科技公司研究美国和欧洲的竞争对手,吸收最新的技术趋势,并根据中国国情进行调整。这些互动大多是自下而上的,由两国希望相互合作和学习的技术人员推动。但中国政府也在维护这些关系方面发挥了重要作用。它推动加强学术合作,并向美国科技公司提供市场准入的诱饵,鼓励它们在中国开设研究中心。

市场条件和国际联系到位后,中国迈出了第三步,释放了大量资源:投资资本、物质基础设施、训练有素的工程师和官僚活力。从美国的角度来看,这种投资似乎是浪费,甚至适得其反,因为它违反了政府永远不应该挑选赢家的神圣原则。然而,在中国的实践中,事实证明,这是加速技术传播和商业化的有效方法。

例如,中国政府在 2017 年提出的人工智能计划设定了一个雄心勃勃的目标:到 2030 年让中国成为世界领先的人工智能中心。但它最大的影响是中国官僚机构和私营部门掀起了一波实验和活动。市长们在他们的城市建立了崭新的人工智能初创企业加速器。农业官员创建了智能施肥无人机试点项目。公立医院与大学合作创建医疗人工智能研究机构。全国各地的警察部门花费大量资金购买监控技术。 

美国大学对华裔科学家进行错误起诉,让科学界感到寒心。

单独来看,许多项目似乎浪费得可笑。偏远城镇的初创企业孵化器经常空置多年。但这些分散的政府努力推动了私营部门的人工智能热潮,刺激了更多的风险投资和初创企业的成立。2018 年,中国占全球人工智能初创企业融资总额的近一半,超过美国。这些资金让中国公司和科学家得以试验新产品、新功能和新方法,并推动了整个经济领域人工智能的采用。

通过建设和保护自己的市场,同时向全球创新生态系统学习,中国最终加速了自身关键技术的开发。这一成功并非完全是某个完美执行的总体规划的结果。相反,它是意识形态偏执、明智规划、大量辛勤工作和一点好运的产物。中国最初建造防火墙是为了保护其高度审查的信息环境,后来才偶然发现创新的好处。尽管中国的意图复杂,有时甚至自相矛盾,但最终结果几乎超出了任何人的预期。 

**美国反应过度**

过去四年来,华盛顿一直致力于切断中国与美国技术生态系统的联系。其中一些举措具有真正的战略价值,例如有针对性的控制措施阻止了中国制造尖端半导体。但其中许多努力都是战略失误,削弱了美国的创新,助长了中国的崛起。美国大学对中国出生的科学家进行错误的起诉,让外国出生的科学界感到寒心,并迫使一些最优秀、最聪明的人才出于恐惧回到中国。更根本的是,美国只需切断与中国的技术联系就能阻止中国崛起的时代已经基本过去了。如果美国在 2005 年切断与中国的技术联系,可能会减缓全球创新并阻碍美国自身的能力,但对中国的伤害可能更大。当时,中国还没有一个能够自我维持的国内技术生态系统,而独自建立一个生态系统将需要更长的时间。 

如今,中国已经拥有了技术成功的大部分原始要素,随意切断双边关系可能会适得其反。相反,美国应该采取有针对性的行动,在继续吸引和接触中国创新者的同时,维持中国对外国技术的依赖。为了保持这种依赖,最好的杠杆点是半导体,特别是只有少数美国盟友生产的高度专业化的制造设备。为了吸引中国人才,美国的大学对高端研究人员有着强大的吸引力,但美国迫切需要改革移民制度,以便这些人毕业后留在美国。

在加速自身科技生态系统方面,美国能从中国学到什么吗?两国政府体制截然不同,简单地复制中国模式是不可能的。特朗普政府试图封锁中国应用程序微信和 TikTok,但遭到法院阻挠。美国各地的市长不会突然按照联邦政府的命令开始创建自动驾驶无人机试点项目。但还有一个更深层次的教训需要吸取。如果美国希望保持对中国的优势,美国政府必须愿意尝试激励技术发展的新方法,即使有些努力会导致资金浪费或完全失败。如果每个失败的项目都成为党派的打击,那么创新政策就会陷入停滞。 

国会提议在国家科学基金会内设立一个“技术理事会”,这是一个新的部门,负责连接学术界、政府和工业界,以加速商业技术的部署,这为此类实验提供了一个良好的开端。技术理事会的资源和范围一直是国会激烈辩论的主题,并将在未来几个月众议院和参议院试图协调相互竞争的法案时做出决定。拟议中的理事会与中国促进技术发展的“全覆盖”方法相去甚远。但它的出现表明,美国政府开始认识到,它再也不能只资助基础研究,而把其余部分留给市场。

任何一项法案或创新政策都不足以确保美国保持其技术优势。如果说中国的发展轨迹能给美国领导人带来什么教训的话,那就是刺激技术创新可能是一个混乱、混乱且常常自相矛盾的过程。考虑到这场竞争的利害关系,美国不能让这种混乱导致瘫痪。

评论

此博客中的热门博文

中国 AI 初创公司 DeepSeek 是如何与硅谷巨头竞争的

纽约时报: DeepSeek 的工程师说,他们的系统只需要约 2000 块美国芯片制造商英伟达生产的专用计算机芯片,而美国大公司的 AI 系统需要多达 1.6 万块芯片。 Marlena Sloss/Bloomberg 圣诞节的第二天,一家名为深度求索 (DeepSeek) 的中国小型初创公司发布了一个新的人工智能系统,其功能可与 OpenAI 和谷歌等公司的尖端聊天机器人相媲美。 能做到这点本已是一个里程碑。但这个名为 DeepSeek-V3 的大模型背后的团队描述了一个更大的进步。深度求索的工程师在介绍他们如何构建这个大模型的 研究论文 中写道,他们在训练该系统时只用了领先人工智能公司用的高度专业化计算机芯片的一小部分。 这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片(如硅谷公司英伟达生产的那些)进行限制。 但 DeepSeek 大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。 据美国人工智能公司一直使用的行业基准测试,DeepSeek 聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。 而且它的造价很低,挑战了只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统的普遍观念。中国工程师称,他们只花了约 600 万美元的原始计算能力就训练了新模型,不到科技巨头 Meta 训练其最新人工智能模型所耗资金的十分之一。 “有 600 万美元资金的公司在数量上远远多于有 1 亿美元或 10 亿美元资金的公司,” 风险投资公司 Page One Ventures 的投资人克里斯 · 尼科尔森说道,他主要投资人工智能技术。 自从 OpenAI 2022 年发布了 ChatGPT,引发人工智能热潮以来,许多专家和投资者曾得出结论认为,如果不投入数亿美元购买人工智能专用芯片的话,没有公司能与行业领军者竞争。 世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达 1.6 万个芯片,甚至更多。但 DeepSeek 的工程师却说,他们只用了约 2000 个英伟达生产的专用芯片。 中国进口芯片受到限制,迫使 DeepSe...

揭秘DeepSeek:一个更极致的中国技术理想主义故事

  做贡献者,而非搭便车者。 文 | 于丽丽 编辑 | 刘旌 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。 弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。 这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA( 一种新的多头潜在注意力机制 )架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。 在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。” 在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。 多位行业人士告诉我们, 这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。 一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。” 而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见: 美国更擅长从0-1的技...

付鹏11月24日在HSBC内部演讲速记

《2024年年终回顾和2025年展望——对冲风险VS软着陆》   上篇 正值年底,虽然刚才汇丰一直强调大家不录音不录像,但大概率你挡不住。我在这儿讲话会谨慎一些,非常小心谨慎,大概率会有人透露出去,放到YouTube上,基本上所有见我都说付总我在YouTube上看过你的视频,我说那都是盗版的,靠盗版发财的也不少。 今天和大家分享的内容基本上都是官方的,回顾会多一点,展望不多,因为这个月展望完了之后下个月怎么办?有些话对我来讲我倒觉得很简单,本质上原来我们是做Hedge Fund出身,所以我们的逻辑框架整体具有极强的延续性,不是说今年去讨论,或者说明年去讨论。 惯性思维从2016年开始,我一直在跟大家强调这个世界已经完全不一样了。当然经历过过去的几年时间,我相信在座各位应该对这番话的理解变得越发深刻。 2016年实际上是美国特朗普的第一次大选,我有一个特点,我的特征是如果我觉得什么地方有投资机会,我可能第一时间去一线调研,我不喜欢看YouTube,我也不喜欢在网上扒。当然你会说,现在ChatGPT很强大了,人工智能好像能帮你解决很多问题,但你们有没有想过,可能广泛流传或者广泛传播的很多信息是错的。这一点在2012年当时我从日本做完调研回来之后,我的感悟是最深的。 当然去日本有一个重要的人物,名字叫本森特,很快大家就会非常熟悉他的,目前来讲应该是特朗普政府提名的美国财长。本森特原来是索罗斯基金实际掌控人,因为索大爷已经年龄很大了,去年的时候才刚刚把基金的业务交给他儿子亚历山大,但在这之前,最主要的几场战役本质上来讲都是本森特在主导。 2012年当时我从北京去香港约朋友们吃饭的饭局上,当时斯索罗斯基金在香港办公室跟我说,本森特从这儿去了日本。我说OK。我经常说一句话“站在巨人的肩膀上看问题。” 当然你知道,网民们最可怕的地方是巴菲特“SB”、索罗斯“SB”,我最“牛逼”。你要记住,他们的所有行为一定有很大的变化,很多人可能都不知道,巴菲特第一次去是2011年,我们正在讲福岛核电站泄漏,核废水污染以后海鲜不能吃的时候,一个80多岁的老头顶着核辐射泄漏去日本吃海鲜了,当然他去日本干吗,这其实很关键。 之后我们跑到日本做完调研回来之后那几年,我陆陆续续跟很多人讲,日本正在发生变化,日本的利率结构都会随之变化的,当然包括日本的证券市场。今年日本股市终于走出这35年了,创下...

如何从中国走线(润到)美国

经济学人: 他们来美国的原因各不相同。有些人寻求经济机会。其他人则对统治感到失望。许多人在网上看到其他中国移民穿越哥伦比亚和巴拿马之间无法无天的丛林地带,寻求更好的生活。数以万计的中国公民前往南美,这是前往美国的危险旅程的第一步。这条路线非常受欢迎,以至于它获得了一个中文昵称:走线,即走线。 过去两年,中国移民一直是穿越美国南部边境增长最快的群体。2023 年,美国边境巡逻队遇到了 3.7 万多名中国移民,高于 2022 年的 3,813 人和 2021 年的 689 人。今年前八个月又有 2.1 万人入境。他们仍然只是 2023 年试图越境的 200 万移民中的一小部分。但由于美国和中国陷入了经济、意识形态和地缘战略竞争,中国移民已成为政治焦点。 唐纳德·特朗普说,来自中国的新移民大多是适龄参军的男性。“他们是想在我们国家组建一支小军队吗?”他问道。其他共和党政客称中国移民是潜在的间谍。卡马拉·哈里斯和民主党人没有那么危言耸听,但他们也担心边境问题。在总统竞选中,移民是首要关注的问题,而中国是一个方便的反面人物,因此几乎没有人努力去了解是什么推动了这种人口流动,以及这对每个国家意味着什么。 《经济学人》花了三个月时间在哥伦比亚、墨西哥和美国进行报道。我们采访了数十名移民,以及走私者、边防警卫和专家。一些人允许我们追踪他们的移民旅程。一些人经过数周的乘船、乘公共汽车、步行和乘飞机的旅行才抵达美国。其他人则在途中失去了一切。大多数人被更美好未来的承诺所吸引,并遵循了试图利用美国不完善的移民制度的策略。但他们的旅程也揭示了中国的情况,压制性统治和日益恶化的经济萎靡不振正在将人们推向远离中国的道路。 第一部分 内科克利 对于许多中国移民来说,美洲的第一站是厄瓜多尔,直到最近,厄瓜多尔才向他们提供免签证入境。但他们很快就搬到了哥伦比亚。在那里,我们遇到了黄女士,一位 40 多岁、身穿亮粉色连衣裙的女性。她已经打破了出生地——中国西南部贵州省的一个贫穷村庄——的保守规范。村里大多数妇女终生务农和养育孩子。然而,黄女士离开家乡去了大城市,养育了两个孩子,并与嗜赌成性的丈夫离婚。她来到了加勒比海边缘的海滨小镇内科克利,即将进入哥伦比亚和巴拿马之间危险的达连峡丛林。 她两个 20 多岁的妹妹也来了。她们之前都没有离开过中国。黄女士说,她们对未来的危险知之甚少,但梦想着到达美国。自疫...

中国 AI 公司另辟蹊径快速追赶美国同行 - WSJ

尽管中国购买先进制程的芯片面临种种限制,但开发者们已经找到了变通途径。有迹象表明,中国初创企业追赶美国领先的 AI 模型的速度要比业内许多人预期的更快。 DeepSeek 是一家由中国最成功的对冲基金公司之一投资的初创公司,该公司在 11 月发布了最新大语言模型的预览版。该公司当时表示,该程序的能力优于 OpenAI 的推理模型 “o1”,后者于 9 月以预览版的形式发布。 近几周,其他中国公司也作出了类似的表态。由中国互联网巨头阿里巴巴 (Alibaba) 和腾讯 (Tencent) 支持的初创公司月之暗面 (Moonshot AI) 表示,该公司开发了一种专门研究数学的模型,其能力接近“o1”,与此同时,阿里巴巴表示,自己的一个实验性研究模型在数学方面优于 o1 模型的预览版。 这些公司尚未发表描述其模型的论文,而且由于目前还没有一个公认的 AI 模型能力测试标准,因此很难评估这些说法。尽管如此,一些美国专家表示,他们对此印象深刻。 “中国正在加速追赶,”OpenAI 前研究员、如今的 AI 创业者安德鲁 · 卡尔 (Andrew Carr) 说。他说,试图复制 OpenAI 推理模型的 DeepSeek 研究人员“在几个月内就搞定了,坦率地说,我的许多同事对此感到惊讶”。 其中一项用于比较的测试是美国数学邀请赛 (American Invitational Mathematics Examination, 简称 AIME),该竞赛是为最聪明的高中学生举办的数学挑战赛。 DeepSeek 表示,其模型在 AIME 测试中胜过了 OpenAI 的模型。《华尔街日报》(The Wall Street Journal)利用今年 AIME 的 15 道题进行的一项实验发现,OpenAI 的 “o1” 预览版模型得出答案的速度比 DeepSeek、月之暗面和阿里巴巴的实验模型更快。例如,一个假设的双人博弈问题需要用到策略来解字谜,OpenAI 的程序在 10 秒内给出了答案,而 DeepSeek 花了 2 分多钟。 在第一次尝试时就得到正确答案仍然非常了不起,因为文字题常常难倒 AI 程序。 自 2022 年以来,中国 AI 开发者面临美国对其获得全球最先进制程 AI 芯片的限制,包括来自芯片领导者 英伟达   (Nvidia) 的芯片。拜登 (Biden) 政府...

三联深度:逃出妙瓦底 缅甸诈骗园区

 原创 飞天小豚 三联生活周刊 2025年01月10日 18:06 北京 *本文为「三联生活周刊」原创内容 没有高薪,没有偷渡,更没有去缅甸、柬埔寨这些危险的国家,中国留学生李奥不明白,为什么自己只是在安全的国家想正常找一份工作,却不断跌入招聘陷阱,最终沦为人口贩卖的牺牲品。在经历过一场在缅东的死亡之旅后他才明白,海外华人招聘圈已经被博彩、诈骗等灰色产业渗透,而印象中的那些城市,已经不同以往。 记者|夏杰艺 实习记者|顾靓楠 陷阱 2022年6月5日,李奥站在东南亚一条混浊的泥水河前。河很窄,不过五六米,两岸是一样的黄褐色烂泥地和杂乱的野树林,河面上一条孤零零的小船。 很久之后他才知道,这条不起眼的小河是莫伊河,位于泰缅边境交界处,是知名的偷渡“天堂”。 这里荒无人烟,见不到警察和海关人员,和他同行的是一个肯尼亚女人和一个二三十岁的中国男子。三人的背后跟着四名大汉,他们不怎么说话,但其中一人手上拿着一把小臂长的砍刀,明晃晃的。 泰缅边境的莫伊河岸(摄于2022年) “They are human traffic.”旁边的肯尼亚女人意识到自己的命运,轻声说道。李奥也明白,他们三人已经沦为“猪仔”——人口贩卖的牺牲品。 李奥是浙江台州人,27岁,高二时被父母送到英国读书,随后进入英国利物浦大学学习,但因家中破产被迫辍学,没能获得高中和大学文凭。他的唯一优势是英语,所以工作后有一半时间都在中东、非洲等地的华人企业就职,从事翻译或行政工作。在李奥看来,海外华人企业的待遇更优厚:工资大多在每月一万五千元以上,还包食宿。 2022年初,他先是在肯尼亚的蒙巴萨为江门机械松林有限公司工作,后来又换到阿联酋阿布扎比,在中国通信服务(CCS)的分公司做项目经理,由于岗位期望与公司产生冲突,5月,他辞职来到迪拜,边旅行边求职。 李奥对本刊回忆,自己当时在迪拜当地的华人生活网站“迪拜全酋通”上浏览招聘信息,注意到了一家泰国曼谷的企业。该企业声称从事跨境电商业务,老板需要招聘一名助理兼翻译。该企业跟李奥约了一次英文电话面试,并要求他录制了一则自我介绍的英文短片,然后发放了入职邀请。在李奥看来,该企业和大部分他打过交道的海外华人企业类似——入职程序比较随意,薪资每月一万多元,包住宿和来程机票,但不愿意给劳动者办工签,而是以旅游签入境。“曼谷,在我心里还是一个比较安全、讲法治的地方,...

Revealing DeepSeek: A more extreme story of Chinese technological idealism

  文 | 于丽丽    Wen | Yu Lili 编辑 | 刘旌    Edit | Liu Jing 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 Of the 7 major model startups in China, DeepSeek is the least silent, but it can always be remembered in an unexpected way. 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 A year ago, this kind of quantitative private equity giant fantasies that did not mean to derive behind it was the only company outside the large factory that reserved 10,000 A100 chips. One year later, it came from it to trigger the source of China's big model price war. 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 In May, which was bombarded by AI, Deepseek became famous. The reason is that they released an open source model called DeepSeek V2, which provides an unprecedented cost-effectiveness: the reasoning cost of reasoning is reduced to only 1 yuan per millio...

特朗普就职演讲中英文全文

谢谢,谢谢大家,非常感谢你们。非常非常感谢。副总统万斯,众议院议长约翰逊,参议员图恩,美国首席大法官罗伯茨,以及美国最高法院的大法官们。 克林顿总统、布什总统、奥巴马总统、拜登总统、哈里斯副总统,以及我的各位同胞, 美国的黄金时代从现在开始 。 从今天起,我们的国家将再次繁荣,并在全世界受到尊重。我们将成为每个国家的羡慕对象,不再让自己受到剥削。 在特朗普政府的每一天,我都会把美国放在第一位 。 我们的主权将被夺回。我们的安全将得到恢复。正义的天平将重新平衡。司法部和我们政府的恶劣、暴力和不公正的武器化将结束。 我们的首要任务是创造一个骄傲、繁荣和自由的国家。美国将很快变得更伟大、更强大,并且比以往任何时候都更加卓越。 我自信和乐观地回到总统职位上,我们正处于一个令人兴奋的新国家成功时代的开始。一股变革的浪潮正在席卷整个国家,阳光洒遍全世界,美国有机会前所未有地抓住这一机遇。 但是首先,我们必须诚实面对我们面临的挑战。虽然挑战很多,但它们将被美国当前所见证的这一伟大势头摧毁。 今天我们聚集在一起时,我们的政府正面临一场信任危机。多年来,一个激进且腐败的体制从我们的公民手中攫取权力和财富,而我们社会的支柱却破碎不堪,似乎完全失修。 我们现在的政府连国内的简单危机都无法应对,同时还在海外接二连三地陷入灾难性事件。 它未能保护我们辉煌、守法的美国公民,却为危险的罪犯提供庇护和保护,这些罪犯许多来自监狱和精神机构,他们非法进入我们的国家。我们有一个政府,无限制地资助外国边界的防御,却拒绝保护美国的边界,或者,更重要的是,保护自己的人民。 我们的国家在紧急情况下已经无法提供基本服务,这一点最近由北卡罗来纳州的优秀人民证明了。他们受到如此糟糕的对待。而其他几个州在几个月前发生飓风后仍在遭受痛苦。 或者更近的是洛杉矶,我们正在目睹大火仍在无情地燃烧。从几周前开始,它们毫无防备地横扫房屋和社区,甚至影响到我们国家一些最富有和最有权势的人,其中一些人现在就坐在这里。他们已经无家可归了。这很有趣。 但是我们不能让这种情况发生。每个人都无能为力。这将会改变。我们的公共卫生系统在灾难时无法提供帮助,却在其上花费了比世界上任何国家都要多的钱。 我们的教育系统则教导我们的孩子为自己感到羞愧,在许多情况下,教他们仇恨我们的国家,尽管我们试图如此绝望地向他们提供爱。所有这一切将从今天开始改变,而且...

疯狂的幻方:一家隐形AI巨头的大模型之路

暗涌Waves 文  | 于丽丽 在蜂拥而至的大模型团战中,幻方大概是最异类的一个。 这是一场注定是少数人的游戏,很多创业公司在大厂入局后开始调整方向甚至萌生退意,而这家量化基金却孤绝前行。 5月,幻方把下场做大模型的独立新组织,命名为“深度求索”,并强调将专注于做真正人类级别的人工智能。他们的目标,不只是复刻ChatGPT,还要去研究和揭秘通用人工智能(AGI)的更多未知之谜。 不仅如此,在这个被认为格外依赖稀缺人才的赛道,幻方还试图去集结一批有执念的人,并祭出了他们认为的最大武器:一群人的好奇心。 在量化领域,幻方是一家抵达过千亿规模的“顶级基金”,但它被这波AI新浪潮集中关注到,其实还颇具戏剧性。 当国内云厂商高性能GPU芯片缺货成为限制中国生成式AI诞生的最直接因素时,据《财经十一人》报道, 国内拥有超过1万枚GPU的企业不超过5家。而除几家头部大厂外,还包括一家名为幻方的量化基金公司。通常认为,1万枚英伟达A100芯片是做自训大模型的算力门槛。 其实,这家很少被置于人工智能视野打量的公司,早已是一家隐秘的AI巨头:2019年,幻方量化成立AI公司,其自研的深度学习训练平台“萤火一号”总投资近2亿元,搭载了1100块GPU;两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。 这意味着,单从算力看,幻方甚至比很多大厂都更早拿到了做ChatGPT的入场券。 只是大模型对算力、算法和数据都有强依赖,所以起步就需要5000万美金,训练一次需要上千万美金,非百亿美金公司其实很难持续跟进。各种艰难之下,幻方却很乐观,创始人梁文锋告诉我们:“关键是我们想做这件事,能做这件事,那我们就是最合适的人选之一。” 这种谜之乐观,首先来自幻方的独特成长路径。 量化投资是一个源自美国的舶来品,这使得几乎所有中国的头部量化基金创始班底,都或多或少有过美国或欧洲对冲基金的履历。唯独幻方是一个例外:它完全是本土班底起家,独自摸索着长大。 2021年,成立仅六年的幻方,抵达千亿规模,并被称为“量化四大天王”之一。 以局外人杀入的成长路径,让幻方始终像一个搅局者。多位行业人士向我们表示,幻方“无论研发体系、产品还是销售,都始终在用一种崭新的方式,切入到这个行业中来。” 一家头部量化基金创始人认为,这些年的幻方,始终“没有按照某种约定成俗的道路在走”,而是...

2025年首个交易日三大指数集体收跌,沪指跌2.66%,深成指跌3.14%,创业板指跌3.79%。全市场成交额1.4万亿元,全市场超4300只个股下跌。

2025年首个交易日三大指数集体收跌,沪指跌2.66%,深成指跌3.14%,创业板指跌3.79%。全市场成交额14095亿元,较上日放量509亿元。全市场超4300只个股下跌。 此前,中国股市去年 录得 2020 年以来的首次年度上涨。投资者指出,谨慎情绪背后有一系列因素,包括财新制造业调查结果低于预期。2024 年最后一个交易日,沪深 300 指数大幅下跌,也导致该指数跌破备受关注的技术门槛,可能导致一些基金进一步抛售。 与此同时,中国工商银行、中国农业银行等几只大型金融股正在进行除息交易,加剧了基准指数的损失。 abrdn Plc 投资总监Xin-Yao Ng 表示:“当我们将资金投入 2025 年第一季度时,中国经济的下行风险似乎远大于上行风险。” 他表示,关税、宏观数据疲软以及政策刺激措施可能在 3 月份两会(即中国一年一度的立法会议)召开之前停滞不前等因素都存在不确定性。 继 9 月底刺激措施推动的反弹之后,中国股市基本处于区间波动,投资者等待出台更大规模的刺激措施来推动市场走高。继 12 月中央经济工作会议之后,中国 表示 将在 2025 年增加公共借贷和支出,并将政策重点转向消费,以努力修复经济的薄弱环节,因为即将实施的美国关税威胁到出口。 周四香港股市休市后交易量显著,恒生指数成交量比过去 30 个交易日的平均成交量高出 60%。与此同时,上海和深圳股市的成交量最近几天一直低于 1.5 万亿元人民币(2060 亿美元),这表明交易员选择保持观望,直到催化剂变得明朗。 福建同恒投资的基金经理杨廷武表示,“今天的下跌可能是由于量化基金在12月31日下跌(当时基金调整了年终仓位)后,在岸指数跌破60日移动均线后,被迫抛售所致。”