跳至主要内容

deepseek:中国的人工智能产业几乎赶上了美国

经济学人:

9月,美国公司 Open AI发布了世界上第一个“推理模型”,这是一种先进的人工智能。该模型名为 o1,它使用“思维链”来解答科学和数学难题,将问题分解为组成步骤,并在后台测试各种方法,然后向用户呈现结论。它的发布引发了一场效仿此方法的竞赛。谷歌于 12 月推出了一种名为“双子闪电思维”的推理模型。几天后, Open AI推出了 o3,这是 o1 的更新版本。

图表:经济学人

但事实上,拥有众多资源的谷歌并不是第一家模仿 Open AI 的公司。在 o1 推出后不到三个月,中国电子商务巨头阿里巴巴就发布了新版 Qwen 聊天机器人Q w Q,具有相同的“推理”能力。该公司在一篇华丽的博客文章中问道:“思考、质疑和理解意味着什么?”并附上了该模型免费版本的链接。另一家中国公司 DeepSeek 在那之前一周发布了一款名为R 1 的推理模型的“预览版”。尽管美国政府竭力遏制中国人工智能产业的发展,但两家中国公司已在短短几周内将美国同行的技术领先优势缩小到最小。

中国公司不仅在推理模型方面处于领先地位:去年 12 月,DeepSeek 发布了新的大型语言模型 ( LLM ),这是一种分析和生成文本的人工智能。v3 大小接近 700 GB,大到无法在专业硬件上运行,并且有 6850 亿个参数,这些单独的规则组合起来构成了模型的神经网络。这使得它比以前免费下载的任何模型都要大。Facebook 母公司 Meta 的旗舰 LLM Llama 3.17 月发布,只有 4050 亿个参数。

DeepSeek 的LLM不仅比许多西方同行规模更大,而且更优秀,只有谷歌和 Open AI 的专有模型可以与之匹敌。人工智能编码平台Aider 的创始人 Paul Gauthier在他的编码基准测试中运行了新的 DeepSeek 模型,发现除了 o1 本身之外,它胜过所有竞争对手。众包聊天机器人排名L msys 将其排在第七位,高于任何其他开源模型,也是除谷歌或 Open AI以外的公司制作的最高排名(见图表)。

龙之崛起

如今,中国人工智能的质量已与美国竞争对手非常接近,Open AI的老板山姆·奥特曼 (Sam Altman) 不得不解释差距之小。DeepSeek 发布 v3 后不久,他不耐烦地发推文说:“复制你知道行得通的东西(相对)容易。当你不知道它是否会行得通时,去做一些新奇、冒险且困难的事情就极其困难了。”

中国的人工智能行业最初看起来是二流的。这可能部分是因为它不得不应对美国的制裁。2022 年,美国禁止向中国出口先进芯片。领先的芯片制造商英伟达不得不为中国市场设计特别降级的产品。美国还试图阻止中国发展在国内生产顶级芯片的能力,禁止出口必要的设备,并威胁对可能有帮助的非美国公司进行处罚。

另一个障碍是本土的。中国公司迟迟没有开始LLM课程,部分原因是出于监管方面的担忧。他们担心审查者会对可能“产生幻觉”并提供不正确信息或更糟的是发表政治危险言论的模型做出反应。搜索巨头百度多年来一直在内部试验LLM课程,并创建了一个名为“ ERNIE ”的课程,但一直犹豫是否要向公众发布。即使 Chat GPT的成功促使它重新考虑,它最初也只允许通过邀请访问ERNIE机器人。

最终,中国当局出台了促进人工智能产业发展的法规。尽管他们呼吁模型制作者强调内容合理,并坚持“社会主义价值观”,但他们也承诺“鼓励生成式人工智能的创新发展”。新闻网站 TechTechChina 的编辑 Vivian Toh 表示,中国寻求全球竞争。阿里巴巴是首批适应新的宽松环境的公司之一,推出了自己的法学硕士学位,最初名为“统一钱文”,后来简称为“Qwen”。

在一年左右的时间里,阿里巴巴推出的产品并没有什么让人兴奋的地方:一个基于 Meta 开源 Llama LLM的相当平淡无奇的“分支”。但在 2024 年,随着阿里巴巴连续发布 Qwen 的迭代,质量开始提高。一年前,当阿里巴巴发布了一个能够分析图像和文本的 Qwen 版本时,西方人工智能实验室 Anthropic 的杰克·克拉克 (Jack Clark) 说:“这些模型似乎可以与西方领先实验室开发的非常强大的模型相媲美。”

包括腾讯和华为在内的中国其他互联网巨头也在构建自己的模型。但 DeepSeek 的起源不同。阿里巴巴发布第一个 Qwen 模型时,它甚至还不存在。它源自 High-Flyer,这是一家 2015 年成立的对冲基金,旨在利用人工智能在股票交易中获得优势。进行基础研究帮助 High-Flyer 成为该国最大的量化基金之一。

但 High-Flyer 创始人梁文锋表示,其动机并非纯粹出于商业目的。他观察到,Open AI的首批支持者并不寻求回报;他们的动机是“追求使命”。2023 年 Qwen 推出的同一个月,High-Flyer 宣布也将加入创造人类级人工智能的竞赛,并将其人工智能研究部门拆分为 DeepSeek。

和 Open AI之前一样,DeepSeek 承诺开发人工智能是为了公众利益。梁先生表示,该公司将公开其大部分训练结果,以防止该技术被少数个人或公司“垄断”。与被迫寻求私人资金来支付不断膨胀的训练成本的 Open AI不同,DeepSeek 一直可以使用 High-Flyer 庞大的计算能力储备。

DeepSeek 庞大的llm不仅因为规模而引人注目,还因为其训练效率而引人注目,即模型从数据中推断出其参数。剑桥大学的 Nic Lane 表示,这一成功并非源于单一的重大创新,而是一系列微小的改进。例如,训练过程通常使用四舍五入来简化计算,但在必要时保持数字精确。服务器群经过重新配置,使各个芯片能够更有效地相互通信。在模型训练完成后,它会根据推理系统 DeepSeek R 1 的输出进行微调,学习如何以更低的成本模仿其质量。

得益于这些创新和其他创新,计算出 v3 的数十亿个参数仅花费了不到 300 万个芯片小时,估计成本不到 600 万美元——约为 Llama 3.1 所需计算能力和费用的十分之一。v3 的训练只需要 2,000 个芯片,而 Llama 3.1 使用了 16,000 个芯片。而且由于美国的制裁,v3 使用的芯片甚至不是最强大的。西方公司似乎在芯片方面越来越挥霍:Meta 计划使用 350,000 个芯片建立一个服务器场。特斯拉前人工智能主管 Andrej Karpathy 说,就像 Ginger Rogers 穿着高跟鞋倒着跳舞一样,DeepSeek让“以极低的预算”训练前沿模型“看起来很容易”。

该模型不仅训练成本低廉,运行成本也更低。DeepSeek 比同行更有效地将任务拆分到多个芯片上,并在前一个步骤完成之前开始下一步。这使得它能够让芯片以满负荷工作,几乎没有冗余。因此,今年 2 月,当 DeepSeek 开始让其他公司创建使用 v3 的服务时,其收费将不到 Anthropic 使用其法学硕士Claude 收费的十分之一。“如果这些模型确实具有同等质量,那么这将是正在进行的法学硕士价格战中一个戏剧性的转折,”人工智能专家 Simon Willison 说。

DeepSeek 对效率的追求并未止步于此。本周,在发布完整版R 1 的同时,该公司还发布了一系列更小、更便宜、更快的“精简版”变体,这些变体几乎与大型版本一样强大。这模仿了阿里巴巴和 Meta 的类似版本,再次证明了它可以与业内巨头相媲美。

龙之道

阿里巴巴和 DeepSeek 还以另一种方式挑战最先进的西方实验室。与 Open AI和谷歌不同,中国实验室跟随 Meta 的脚步,在开源许可下提供他们的系统。如果你想下载 Qwen AI并在其基础上构建自己的程序,你可以——不需要特定的许可。这种宽容与非凡的开放性相匹配:这两家公司每当发布新模型时都会发表论文,详细介绍用于提高其性能的技术。

当阿里巴巴发布Q w Q(代表“Questions with Qwen”)时,它成为世界上第一家在开放许可下发布此类模型的公司,任何人都可以下载完整的 20 GB 文件并在自己的系统上运行它,或者将其拆开以查看其工作原理。这是一种与 Open AI截然不同的方法,后者隐藏了 o1 的内部工作原理。

概括而言,这两种模型都采用了所谓的“测试时计算”:它们不是在模型训练期间集中使用计算能力,而是在回答查询时消耗比前几代LLM更多的资源。这是心理学家丹尼尔·卡尼曼 (Daniel Kahneman) 所说的“第二类”思维的数字版本:比快速而本能的“第一类”思维更慢、更慎重、更具分析性。它在数学和编程等领域取得了令人鼓舞的成果。

如果有人问你一个简单的事实问题——比如说,法国首都在哪里——你可能会用脑子里想到的第一个词来回答,而且很可能是正确的。典型的聊天机器人的工作方式大致相同:如果它的语言统计表示给出了压倒性受欢迎的答案,它就会相应地完成句子。

但如果你被问到更复杂的问题,你往往会以更结构化的方式思考。当被问到法国人口第五多的城市时,你可能会先列出一长串法国大城市名单;然后尝试按人口对它们进行排序,最后才给出答案。

o1 及其模仿者的诀窍是引导法学硕士 (LLM)进行相同形式的结构化思考:系统不会脱口而出脑海中最合理的答案,而是将问题分解并逐步找到答案。

但 o1 会将自己的想法保留给自己,只向用户透露其流程摘要和最终结论。Open AI为这一选择提供了一些理由。例如,有时模型会考虑是否使用攻击性词语或透露危险信息,但最终决定不这样做。如果其全部推理被公开,那么敏感材料也会被公开。但模型的谨慎也使其推理的精确机制对潜在的模仿者隐藏起来。

阿里巴巴没有这样的顾虑。如果让Q w Q解决一道棘手的数学题,它会愉快地详细描述它的每一步,有时会在尝试各种方法解决这项任务时自言自语数千字。“所以我需要找到 2019 8 + 1 的最小奇数素因数。嗯,这似乎很大,但我想我可以一步一步地分解它,”模型开始说道,生成了 2,000 字的分析,然后正确地得出结论,答案是 97。

阿里巴巴的开放并非巧合,Poolside 联合创始人 Eiso Kant 表示,Poolside 是一家总部位于葡萄牙的公司,为程序员开发AI工具。他指出,中国实验室正在与其他行业争夺人才。“如果你是一名考虑出国的研究人员,西方实验室有什么不能给你的?我们再也不能公开我们的东西了。由于竞争的性质,我们将一切都锁起来。”Kant 先生说,即使中国公司的工程师不是第一个发现某项技术的人,但他们往往是第一个发表该技术的人。“如果你想看到任何秘密技术的出现,请关注中国开源研究人员。他们发表了所有内容,并且做得非常出色。”Lane 先生指出,v3 发布时发表的论文列出了 139 位作者的名字。这样的赞誉可能比在美国实验室默默无闻地工作更有吸引力。

美国政府决心阻止先进技术流入中国,这也让在美中国研究人员的日子不好过。问题不仅在于旨在保密最新创新成果的新法律带来的行政负担。而且,人们常常弥漫着一种模糊的怀疑气氛。甚至在社交场合,间谍指控也层出不穷。

大佬

在中国工作也有缺点。例如,向 DeepSeek v3 询问台湾的问题时,模型会愉快地开始解释台湾是东亚的一个岛屿,“正式名称为中华民国”。但在它写了几句类似的话后,它就停下来,删除了最初的答案,而是简短地建议说:“我们聊点别的吧。”

中国实验室比政府更透明,部分原因是他们希望创建一个以人工智能为中心的企业生态系统。这具有一定的商业价值,因为基于开源模型构建的公司最终可能会被说服从其创造者那里购买产品或服务。这也给中国带来了战略利益,因为它在与美国的人工智能冲突中创造了盟友。

中国公司自然更愿意以中国模型为基础,因为这样他们就不必担心新的禁令或限制会切断他们与底层平台的联系。他们还知道,他们不太可能违反西方模型不会考虑的中国审查要求。上海的科技投资者 Francis Young 指出,对于像苹果和三星这样渴望将人工智能工具融入其在中国销售的设备中的公司来说,本地合作伙伴是必不可少的。甚至一些海外公司也有使用中国模型的具体原因:Qwen 刻意融入了乌尔都语和孟加拉语等“资源匮乏”语言的流利性,而美国模型则主要使用英语数据进行训练。此外,中国模型的较低运行成本也具有巨大的吸引力。

这并不一定意味着中国模式将席卷全球。美国人工智能仍然具有中国竞争对手无法比拟的能力。谷歌的一项研究计划将用户的网络浏览器交给其 Gemini 聊天机器人,提高了人工智能“代理”与网络交互的前景。Anthropic 和 Open AI的聊天机器人不仅会帮助您编写代码,还会为您运行代码。Claude 将构建和托管整个应用程序。逐步推理并不是解决复杂问题的唯一方法。向传统版本的 Chat GPT询问上述数学问题,它会编写一个简单的程序来找到答案。

奥尔特曼表示,还有更多创新正在酝酿中,他预计很快将宣布,Open AI已经打造出“博士超级智能体”,它们在一系列智力任务上的能力堪比人类专家。紧随美国人工智能之后的竞争可能会促使它取得更大的成就。

评论

此博客中的热门博文

中国 AI 初创公司 DeepSeek 是如何与硅谷巨头竞争的

纽约时报: DeepSeek 的工程师说,他们的系统只需要约 2000 块美国芯片制造商英伟达生产的专用计算机芯片,而美国大公司的 AI 系统需要多达 1.6 万块芯片。 Marlena Sloss/Bloomberg 圣诞节的第二天,一家名为深度求索 (DeepSeek) 的中国小型初创公司发布了一个新的人工智能系统,其功能可与 OpenAI 和谷歌等公司的尖端聊天机器人相媲美。 能做到这点本已是一个里程碑。但这个名为 DeepSeek-V3 的大模型背后的团队描述了一个更大的进步。深度求索的工程师在介绍他们如何构建这个大模型的 研究论文 中写道,他们在训练该系统时只用了领先人工智能公司用的高度专业化计算机芯片的一小部分。 这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片(如硅谷公司英伟达生产的那些)进行限制。 但 DeepSeek 大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。 据美国人工智能公司一直使用的行业基准测试,DeepSeek 聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。 而且它的造价很低,挑战了只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统的普遍观念。中国工程师称,他们只花了约 600 万美元的原始计算能力就训练了新模型,不到科技巨头 Meta 训练其最新人工智能模型所耗资金的十分之一。 “有 600 万美元资金的公司在数量上远远多于有 1 亿美元或 10 亿美元资金的公司,” 风险投资公司 Page One Ventures 的投资人克里斯 · 尼科尔森说道,他主要投资人工智能技术。 自从 OpenAI 2022 年发布了 ChatGPT,引发人工智能热潮以来,许多专家和投资者曾得出结论认为,如果不投入数亿美元购买人工智能专用芯片的话,没有公司能与行业领军者竞争。 世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达 1.6 万个芯片,甚至更多。但 DeepSeek 的工程师却说,他们只用了约 2000 个英伟达生产的专用芯片。 中国进口芯片受到限制,迫使 DeepSe...

揭秘DeepSeek:一个更极致的中国技术理想主义故事

  做贡献者,而非搭便车者。 文 | 于丽丽 编辑 | 刘旌 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。 弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。 这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA( 一种新的多头潜在注意力机制 )架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。 在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。” 在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。 多位行业人士告诉我们, 这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。 一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。” 而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见: 美国更擅长从0-1的技...

付鹏11月24日在HSBC内部演讲速记

《2024年年终回顾和2025年展望——对冲风险VS软着陆》   上篇 正值年底,虽然刚才汇丰一直强调大家不录音不录像,但大概率你挡不住。我在这儿讲话会谨慎一些,非常小心谨慎,大概率会有人透露出去,放到YouTube上,基本上所有见我都说付总我在YouTube上看过你的视频,我说那都是盗版的,靠盗版发财的也不少。 今天和大家分享的内容基本上都是官方的,回顾会多一点,展望不多,因为这个月展望完了之后下个月怎么办?有些话对我来讲我倒觉得很简单,本质上原来我们是做Hedge Fund出身,所以我们的逻辑框架整体具有极强的延续性,不是说今年去讨论,或者说明年去讨论。 惯性思维从2016年开始,我一直在跟大家强调这个世界已经完全不一样了。当然经历过过去的几年时间,我相信在座各位应该对这番话的理解变得越发深刻。 2016年实际上是美国特朗普的第一次大选,我有一个特点,我的特征是如果我觉得什么地方有投资机会,我可能第一时间去一线调研,我不喜欢看YouTube,我也不喜欢在网上扒。当然你会说,现在ChatGPT很强大了,人工智能好像能帮你解决很多问题,但你们有没有想过,可能广泛流传或者广泛传播的很多信息是错的。这一点在2012年当时我从日本做完调研回来之后,我的感悟是最深的。 当然去日本有一个重要的人物,名字叫本森特,很快大家就会非常熟悉他的,目前来讲应该是特朗普政府提名的美国财长。本森特原来是索罗斯基金实际掌控人,因为索大爷已经年龄很大了,去年的时候才刚刚把基金的业务交给他儿子亚历山大,但在这之前,最主要的几场战役本质上来讲都是本森特在主导。 2012年当时我从北京去香港约朋友们吃饭的饭局上,当时斯索罗斯基金在香港办公室跟我说,本森特从这儿去了日本。我说OK。我经常说一句话“站在巨人的肩膀上看问题。” 当然你知道,网民们最可怕的地方是巴菲特“SB”、索罗斯“SB”,我最“牛逼”。你要记住,他们的所有行为一定有很大的变化,很多人可能都不知道,巴菲特第一次去是2011年,我们正在讲福岛核电站泄漏,核废水污染以后海鲜不能吃的时候,一个80多岁的老头顶着核辐射泄漏去日本吃海鲜了,当然他去日本干吗,这其实很关键。 之后我们跑到日本做完调研回来之后那几年,我陆陆续续跟很多人讲,日本正在发生变化,日本的利率结构都会随之变化的,当然包括日本的证券市场。今年日本股市终于走出这35年了,创下...

如何从中国走线(润到)美国

经济学人: 他们来美国的原因各不相同。有些人寻求经济机会。其他人则对统治感到失望。许多人在网上看到其他中国移民穿越哥伦比亚和巴拿马之间无法无天的丛林地带,寻求更好的生活。数以万计的中国公民前往南美,这是前往美国的危险旅程的第一步。这条路线非常受欢迎,以至于它获得了一个中文昵称:走线,即走线。 过去两年,中国移民一直是穿越美国南部边境增长最快的群体。2023 年,美国边境巡逻队遇到了 3.7 万多名中国移民,高于 2022 年的 3,813 人和 2021 年的 689 人。今年前八个月又有 2.1 万人入境。他们仍然只是 2023 年试图越境的 200 万移民中的一小部分。但由于美国和中国陷入了经济、意识形态和地缘战略竞争,中国移民已成为政治焦点。 唐纳德·特朗普说,来自中国的新移民大多是适龄参军的男性。“他们是想在我们国家组建一支小军队吗?”他问道。其他共和党政客称中国移民是潜在的间谍。卡马拉·哈里斯和民主党人没有那么危言耸听,但他们也担心边境问题。在总统竞选中,移民是首要关注的问题,而中国是一个方便的反面人物,因此几乎没有人努力去了解是什么推动了这种人口流动,以及这对每个国家意味着什么。 《经济学人》花了三个月时间在哥伦比亚、墨西哥和美国进行报道。我们采访了数十名移民,以及走私者、边防警卫和专家。一些人允许我们追踪他们的移民旅程。一些人经过数周的乘船、乘公共汽车、步行和乘飞机的旅行才抵达美国。其他人则在途中失去了一切。大多数人被更美好未来的承诺所吸引,并遵循了试图利用美国不完善的移民制度的策略。但他们的旅程也揭示了中国的情况,压制性统治和日益恶化的经济萎靡不振正在将人们推向远离中国的道路。 第一部分 内科克利 对于许多中国移民来说,美洲的第一站是厄瓜多尔,直到最近,厄瓜多尔才向他们提供免签证入境。但他们很快就搬到了哥伦比亚。在那里,我们遇到了黄女士,一位 40 多岁、身穿亮粉色连衣裙的女性。她已经打破了出生地——中国西南部贵州省的一个贫穷村庄——的保守规范。村里大多数妇女终生务农和养育孩子。然而,黄女士离开家乡去了大城市,养育了两个孩子,并与嗜赌成性的丈夫离婚。她来到了加勒比海边缘的海滨小镇内科克利,即将进入哥伦比亚和巴拿马之间危险的达连峡丛林。 她两个 20 多岁的妹妹也来了。她们之前都没有离开过中国。黄女士说,她们对未来的危险知之甚少,但梦想着到达美国。自疫...

三联深度:逃出妙瓦底 缅甸诈骗园区

 原创 飞天小豚 三联生活周刊 2025年01月10日 18:06 北京 *本文为「三联生活周刊」原创内容 没有高薪,没有偷渡,更没有去缅甸、柬埔寨这些危险的国家,中国留学生李奥不明白,为什么自己只是在安全的国家想正常找一份工作,却不断跌入招聘陷阱,最终沦为人口贩卖的牺牲品。在经历过一场在缅东的死亡之旅后他才明白,海外华人招聘圈已经被博彩、诈骗等灰色产业渗透,而印象中的那些城市,已经不同以往。 记者|夏杰艺 实习记者|顾靓楠 陷阱 2022年6月5日,李奥站在东南亚一条混浊的泥水河前。河很窄,不过五六米,两岸是一样的黄褐色烂泥地和杂乱的野树林,河面上一条孤零零的小船。 很久之后他才知道,这条不起眼的小河是莫伊河,位于泰缅边境交界处,是知名的偷渡“天堂”。 这里荒无人烟,见不到警察和海关人员,和他同行的是一个肯尼亚女人和一个二三十岁的中国男子。三人的背后跟着四名大汉,他们不怎么说话,但其中一人手上拿着一把小臂长的砍刀,明晃晃的。 泰缅边境的莫伊河岸(摄于2022年) “They are human traffic.”旁边的肯尼亚女人意识到自己的命运,轻声说道。李奥也明白,他们三人已经沦为“猪仔”——人口贩卖的牺牲品。 李奥是浙江台州人,27岁,高二时被父母送到英国读书,随后进入英国利物浦大学学习,但因家中破产被迫辍学,没能获得高中和大学文凭。他的唯一优势是英语,所以工作后有一半时间都在中东、非洲等地的华人企业就职,从事翻译或行政工作。在李奥看来,海外华人企业的待遇更优厚:工资大多在每月一万五千元以上,还包食宿。 2022年初,他先是在肯尼亚的蒙巴萨为江门机械松林有限公司工作,后来又换到阿联酋阿布扎比,在中国通信服务(CCS)的分公司做项目经理,由于岗位期望与公司产生冲突,5月,他辞职来到迪拜,边旅行边求职。 李奥对本刊回忆,自己当时在迪拜当地的华人生活网站“迪拜全酋通”上浏览招聘信息,注意到了一家泰国曼谷的企业。该企业声称从事跨境电商业务,老板需要招聘一名助理兼翻译。该企业跟李奥约了一次英文电话面试,并要求他录制了一则自我介绍的英文短片,然后发放了入职邀请。在李奥看来,该企业和大部分他打过交道的海外华人企业类似——入职程序比较随意,薪资每月一万多元,包住宿和来程机票,但不愿意给劳动者办工签,而是以旅游签入境。“曼谷,在我心里还是一个比较安全、讲法治的地方,...

2025年首个交易日三大指数集体收跌,沪指跌2.66%,深成指跌3.14%,创业板指跌3.79%。全市场成交额1.4万亿元,全市场超4300只个股下跌。

2025年首个交易日三大指数集体收跌,沪指跌2.66%,深成指跌3.14%,创业板指跌3.79%。全市场成交额14095亿元,较上日放量509亿元。全市场超4300只个股下跌。 此前,中国股市去年 录得 2020 年以来的首次年度上涨。投资者指出,谨慎情绪背后有一系列因素,包括财新制造业调查结果低于预期。2024 年最后一个交易日,沪深 300 指数大幅下跌,也导致该指数跌破备受关注的技术门槛,可能导致一些基金进一步抛售。 与此同时,中国工商银行、中国农业银行等几只大型金融股正在进行除息交易,加剧了基准指数的损失。 abrdn Plc 投资总监Xin-Yao Ng 表示:“当我们将资金投入 2025 年第一季度时,中国经济的下行风险似乎远大于上行风险。” 他表示,关税、宏观数据疲软以及政策刺激措施可能在 3 月份两会(即中国一年一度的立法会议)召开之前停滞不前等因素都存在不确定性。 继 9 月底刺激措施推动的反弹之后,中国股市基本处于区间波动,投资者等待出台更大规模的刺激措施来推动市场走高。继 12 月中央经济工作会议之后,中国 表示 将在 2025 年增加公共借贷和支出,并将政策重点转向消费,以努力修复经济的薄弱环节,因为即将实施的美国关税威胁到出口。 周四香港股市休市后交易量显著,恒生指数成交量比过去 30 个交易日的平均成交量高出 60%。与此同时,上海和深圳股市的成交量最近几天一直低于 1.5 万亿元人民币(2060 亿美元),这表明交易员选择保持观望,直到催化剂变得明朗。 福建同恒投资的基金经理杨廷武表示,“今天的下跌可能是由于量化基金在12月31日下跌(当时基金调整了年终仓位)后,在岸指数跌破60日移动均线后,被迫抛售所致。”

Revealing DeepSeek: A more extreme story of Chinese technological idealism

  文 | 于丽丽    Wen | Yu Lili 编辑 | 刘旌    Edit | Liu Jing 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 Of the 7 major model startups in China, DeepSeek is the least silent, but it can always be remembered in an unexpected way. 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 A year ago, this kind of quantitative private equity giant fantasies that did not mean to derive behind it was the only company outside the large factory that reserved 10,000 A100 chips. One year later, it came from it to trigger the source of China's big model price war. 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 In May, which was bombarded by AI, Deepseek became famous. The reason is that they released an open source model called DeepSeek V2, which provides an unprecedented cost-effectiveness: the reasoning cost of reasoning is reduced to only 1 yuan per millio...

特朗普就职演讲中英文全文

谢谢,谢谢大家,非常感谢你们。非常非常感谢。副总统万斯,众议院议长约翰逊,参议员图恩,美国首席大法官罗伯茨,以及美国最高法院的大法官们。 克林顿总统、布什总统、奥巴马总统、拜登总统、哈里斯副总统,以及我的各位同胞, 美国的黄金时代从现在开始 。 从今天起,我们的国家将再次繁荣,并在全世界受到尊重。我们将成为每个国家的羡慕对象,不再让自己受到剥削。 在特朗普政府的每一天,我都会把美国放在第一位 。 我们的主权将被夺回。我们的安全将得到恢复。正义的天平将重新平衡。司法部和我们政府的恶劣、暴力和不公正的武器化将结束。 我们的首要任务是创造一个骄傲、繁荣和自由的国家。美国将很快变得更伟大、更强大,并且比以往任何时候都更加卓越。 我自信和乐观地回到总统职位上,我们正处于一个令人兴奋的新国家成功时代的开始。一股变革的浪潮正在席卷整个国家,阳光洒遍全世界,美国有机会前所未有地抓住这一机遇。 但是首先,我们必须诚实面对我们面临的挑战。虽然挑战很多,但它们将被美国当前所见证的这一伟大势头摧毁。 今天我们聚集在一起时,我们的政府正面临一场信任危机。多年来,一个激进且腐败的体制从我们的公民手中攫取权力和财富,而我们社会的支柱却破碎不堪,似乎完全失修。 我们现在的政府连国内的简单危机都无法应对,同时还在海外接二连三地陷入灾难性事件。 它未能保护我们辉煌、守法的美国公民,却为危险的罪犯提供庇护和保护,这些罪犯许多来自监狱和精神机构,他们非法进入我们的国家。我们有一个政府,无限制地资助外国边界的防御,却拒绝保护美国的边界,或者,更重要的是,保护自己的人民。 我们的国家在紧急情况下已经无法提供基本服务,这一点最近由北卡罗来纳州的优秀人民证明了。他们受到如此糟糕的对待。而其他几个州在几个月前发生飓风后仍在遭受痛苦。 或者更近的是洛杉矶,我们正在目睹大火仍在无情地燃烧。从几周前开始,它们毫无防备地横扫房屋和社区,甚至影响到我们国家一些最富有和最有权势的人,其中一些人现在就坐在这里。他们已经无家可归了。这很有趣。 但是我们不能让这种情况发生。每个人都无能为力。这将会改变。我们的公共卫生系统在灾难时无法提供帮助,却在其上花费了比世界上任何国家都要多的钱。 我们的教育系统则教导我们的孩子为自己感到羞愧,在许多情况下,教他们仇恨我们的国家,尽管我们试图如此绝望地向他们提供爱。所有这一切将从今天开始改变,而且...

2024年12月9日中共中央政治局会议新华社通稿

中共中央政治局12月9日召开会议,分析研究2025年经济工作;听取中央纪委国家监委工作汇报,研究部署2025年党风廉政建设和反腐败工作。中共中央总书记习近平主持会议。 会议认为,今年是实现“十四五”规划目标任务的关键一年,以习近平同志为核心的党中央团结带领全党全国各族人民,沉着应变、综合施策,经济运行总体平稳、稳中有进,我国经济实力、科技实力、综合国力持续增强。新质生产力稳步发展,改革开放持续深化,重点领域风险化解有序有效,民生保障扎实有力,全年经济社会发展主要目标任务将顺利完成。 会议强调,做好明年经济工作,要以习近平新时代中国特色社会主义思想为指导,全面贯彻落实党的二十大和二十届二中、三中全会精神,坚持稳中求进工作总基调,完整准确全面贯彻新发展理念,加快构建新发展格局,扎实推动高质量发展, 进一步全面深化改革,扩大高水平对外开放,建设现代化产业体系,更好统筹发展和安全,实施更加积极有为的宏观政策,扩大国内需求,推动科技创新和产业创新融合发展,稳住楼市股市,防范化解重点领域风险和外部冲击,稳定预期、激发活力,推动经济持续回升向好,不断提高人民生活水平,保持社会和谐稳定,高质量完成“十四五”规划目标任务,为实现“十五五”良好开局打牢基础。 会议指出, 明年要坚持稳中求进、以进促稳,守正创新、先立后破,系统集成、协同配合,实施更加积极的财政政策和适度宽松的货币政策,充实完善政策工具箱,加强超常规逆周期调节,打好政策“组合拳”,提高宏观调控的前瞻性、针对性、有效性。要大力提振消费、提高投资效益,全方位扩大国内需求。要以科技创新引领新质生产力发展,建设现代化产业体系。要发挥经济体制改革牵引作用,推动标志性改革举措落地见效。要扩大高水平对外开放,稳外贸、稳外资。要有效防范化解重点领域风险,牢牢守住不发生系统性风险底线。要持续巩固拓展脱贫攻坚成果,统筹推进新型城镇化和乡村全面振兴,促进城乡融合发展。要加大区域战略实施力度,增强区域发展活力。要协同推进降碳减污扩绿增长,加快经济社会发展全面绿色转型。要加大保障和改善民生力度,增强人民群众获得感幸福感安全感。 会议强调, 要加强党对经济工作的领导,确保党中央各项决策部署落到实处。要充分调动各方面积极性,调动干部干事创业的内生动力。要坚持求真务实,统筹发展和安全,增强协同联动,加强预期管理,提高政策整体效能。要做好民生保障和安全稳定...

市场对中国通货紧缩螺旋发出警报

彭博社: 中国11万亿美元政府债券 市场 的投资者对这个世界第二大经济体从未如此悲观,一些投资者现在大举押注中国将出现与上世纪90年代日本类似的通货紧缩螺旋。 尽管中国 政府 宣布了一系列经济刺激措施,但 中国 10 年期主权债券收益率近几周 跌至历史最低水平,与美国同类债券收益率差距达到前所未有的 300 个基点。 此次暴跌导致中国债券收益率远低于2008年全球金融危机和新冠疫情期间的水平,凸显出人们日益担心政策制定者无法阻止中国陷入可能持续数十年的经济低迷。 如果债券市场预测正确,其影响将是深远的。长期通货紧缩将阻碍世界最大的经济增长引擎之一,给这个人口第二大国家的社会稳定带来新的压力,并加剧资本外流,去年年底,资本外流导致中国金融市场出现创纪录的外逃现象。 投资者对日本化 风险的重视程度可见一斑 。中国 10 家最大的券商均对邻国日本的失落几十年进行了研究。 以比较两国经济而闻名的经济学家 顾朝林表示,中国企业和智库曾与他联系,请他分享自己的观点。 高盛集团 本周表示,日本的案例为中国股市投资者提供了“宝贵的策略”,他们正因近十年来最糟糕的开局而感到不安。 虽然还不能确定中国是否会重现泡沫破灭后的日本,但 相似之处 却不容忽视。两国都遭遇了房地产崩盘、私人投资疲软、消费不振、债务负担过重以及人口迅速老龄化。即便是那些将中国经济管控得更紧作为乐观理由的投资者也担心,官员们没有采取更有力的行动。日本的一个明显教训是:当局越是拖延消除投资者、消费者和企业的悲观情绪,恢复经济增长就越困难。 “如果不加以纠正,这种恶性循环将会越来越严重,”  abrdn Plc 驻新加坡的投资总监 Xin-Yao Ng表示 ,该公司管理着全球 4940 亿美元的资产。“日本的教训有心理因素,这种情况持续的时间越长,企业和消费者信心就会越弱。” 进入 2025 年,中国市场已处于危险之中。随着基准 10 年期国 债收益率 首次跌破 1.6%,专家们 提出了 收益率接近于零的曾经不可想象的前景。今年前四个交易日,沪深 300 指数 下跌了 3.5%,而离岸人民币交易价格接近历史低点——促使当局本周抑制跌势。 中国债券收益率下跌 其 30 年期主权债券收益率已跌至日本 资料来源:彭博社 野村综合研究所 首席经济学家辜朝晖表示:“债券市场已经在告诉中国人:‘你们正陷入资产负债表衰退’。...