跳至主要内容

彭博社:DeepSeek 挑战每个人对 AI 成本的假设

 

上周,当各大人工智能公司的负责人齐聚瑞士阿尔卑斯山时,所有人的目光都投向了东方。在达沃斯世界经济论坛的小组讨论和私下谈话中,科技高管们强调,美国及其盟友需要建立更多的数据中心,并在监管方面取得适当的平衡,以便在人工智能发展方面领先于中国。

Alphabet Inc. 总裁兼首席投资官露丝·波拉特 (Ruth Porat) 在活动上对彭博新闻社表示: “我们的模型可能领先一年多。”但她补充说,“美国保持优势并非定局”。

即便如此,这种预测也可能过于乐观。同一周,一家鲜为人知的中国人工智能初创公司 DeepSeek 发布了一款名为 R1 的新型开源人工智能模型,该模型可以模仿人类的推理方式。该公司表示,R1 在一系列行业基准测试中,包括数学任务和常识,都与美国领先的开发商相媲美,甚至超越了它们——而且成本只是后者的一小部分。到周末,DeepSeek 在备受关注的人工智能系统排行榜 Chatbot Arena 上的排名已经攀升,科技界的知名人士马克·安德森 (Marc Andreessen) 称该产品为“人工智能的斯普特尼克时刻”。

现在,R1 推出的余波迅速传遍美国,科技行业试图了解 DeepSeek 是如何实现这一壮举的,以及这家新贵是否像其声称的那样便宜。已经有人在怀疑这家中国新贵在西方技术的基础上开发了聊天机器人,从而避开了开发大型语言模型的巨额成本。

在旧金山,人工智能高管和员工正在紧急分析 DeepSeek 的技术。据知情人士透露,OpenAI 的一些员工正在试图弄清楚 DeepSeek 究竟是如何发布这样一个模型的。由于涉及私人事务,这些知情人士要求匿名。另一位知情人士表示,公司内部有一种感​​觉,即 OpenAI 需要非常认真地对待中国公司的发展,因为这为他们创新和改进现有模型提供了机会。一位知情人士表示,OpenAI 首席执行官 Sam Altman 最近告诉员工,此次发布标志着这家初创公司的重大格局转变。

“DeepSeek 的 R1 是一款令人印象深刻的模型,”Altman在 X 上首次公开回应。“我们显然会提供更好的模型,而且有新的竞争对手真是令人振奋!”

据知情人士透露,同样专注于开源 AI 模型的 Meta Platforms Inc. 已成立了一个内部团队,专注于分析 DeepSeek,以更好地了解其构建方式和功能。知情人士称,该公司已组建了类似的工作组来评估其他主要竞争对手,例如 OpenAI 的 GPT-4 模型和谷歌的 Gemini。

几乎在一夜之间,DeepSeek 就颠覆了硅谷内部关于开发人工智能的经济性、开发该技术的最佳技术方法以及美国领先于中国竞争对手的程度的许多假设。自 ChatGPT 引发全球人工智能热潮以来的两年多时间里,业界一直认为,人工智能的发展之路很大程度上取决于投入巨资从 Nvidia Corp. 等公司购买更先进的芯片,以及用于容纳这些芯片的越来越庞大的数据中心。

科技界已在人工智能基础设施上投入数十亿美元

数据中心建设热潮导致费用激增

资料来源:彭博社

注:华尔街对 2024 年、2025 年的预测

美国总统唐纳德·特朗普对这一进展表示欢迎,称其“很好,因为你不必花那么多钱。”行业领导者英伟达在 DeepSeek 首次亮相后股价遭受重创,该公司也在周一的一份声明中称赞这是一项“卓越的人工智能进步”。

特朗普补充道:“中国公司发布DeepSeek AI应该给我们的行业敲响警钟,我们需要全神贯注于竞争才能取胜。”


这给市场带来了惊人的影响。周一,对 DeepSeek 壮举的炒作导致美国和欧洲科技股暴跌近 1 万亿美元,因为投资者对一些美国最大公司的支出计划提出了质疑。仅 AI 芯片制造商英伟达的股价暴跌就使市值蒸发了约 5890 亿美元,创下了美国股市历史上最大的跌幅。与此同时,在华盛顿特区,鉴于拜登政府的芯片出口限制不够,

立法者们正在想方设法击退中国在这项被一些人视为对其军事和经济至关重要的技术上的进步。唐纳德·特朗普总统的加密和 AI 沙皇戴维·萨克斯表示, DeepSeek 表明全球 AI 竞赛将非常激烈——同时指责拜登政府的监管“阻碍了”AI 发展。

让问题更加复杂的是,就在几天前,特朗普刚刚支持 OpenAI、软银集团和甲骨文公司成立一家1000 亿美元的合资企业,通过投资数据中心和其他物理基础设施来提高美国的竞争力。现在,人们对巨额人工智能预算的合理性提出了新的质疑。

“这是一种范式转变,”Databricks Inc. 首席执行官 Ali Ghodsi 表示。“这些能够推理的模型生产起来要便宜得多,你将看到它变得民主化。你会看到来自世界意想不到的角落的创新。”

DeepSeek 的崛起

对于梁文锋来说,DeepSeek 最初是一个副业。现年 40 岁的梁文锋于 2023 年创建了 DeepSeek,作为其对冲基金浙江海飞资产管理公司 AI 部门的一个分支。

梁小平能够利用一些本地人才和至关重要的芯片。在美国实施出口限制之前,他已经开始储存大约 10,000 块 Nvidia A100 GPU(一种用于训练 AI 系统的关键技术的旧版本)。他表示,他的大多数顶尖研究人员都是中国顶尖大学的应届毕业生,他强调中国需要发展自己的国内生态系统。

DeepSeek 迅速发布了多个开源 AI 模型,第一个是 2023 年底的 DeepSeek LLM。两个更先进的模型 V2 和 V3 分别于 2024 年中旬和末问世。然而,真正引起共鸣的是 1 月中旬发布的 DeepSeek R1 模型。

与 OpenAI、谷歌和 Anthropic 的一些最新模型一样,R1 旨在模仿人类思考问题的方式,即在回答用户问题之前花时间计算答案。然而,DeepSeek 的版本在效率上有所不同。其背后的团队提出了一些简单但关键的创新,例如找到方法让他们能够使用的计算机芯片发挥更大的作用。另一项突破是:大量依赖一种称为强化学习的技术,该技术奖励系统回答正确的问题,惩罚回答错误的系统。

DeepSeek 的应用在美国用户中很受欢迎,部分原因在于它是一款和蔼可亲、听起来有点尴尬的聊天机器人,它会在深入研究结果之前详细展示它计划如何回答用户的问题。这种方法比 OpenAI 最新的推理模型要详细得多。与 OpenAI 不同,DeepSeek 目前提供免费服务,OpenAI每月收费高达 200 美元,可无限制使用其最先进的推理模型等功能。但 DeepSeek 也会审查在中国敏感的话题。例如,询问中国文化大革命可能会引发这样的反应:“抱歉,这超出了我目前的范围。我们谈点别的吧。”

Ghodsi 表示,在 R1 发布后一小时内,他就收到了 DataBricks 客户的第一个请求,询问如何使用它。从那时起,需求就愈演愈烈。他表示,具体来说,公司想知道如何在 Databricks 现有的 AI 模型之上添加 DeepSeek 的推理能力——DeepSeek 的努力表明,这是可以以低成本完成的。

Ghodsi 表示:“我们对此的关注速度和兴趣程度都是前所未有的。”

软件公司 OpenReplay 的首席执行官 Mehdi Osman 表示,他的公司传统上使用 OpenAI、Anthropic 和 Mistral 的服务,而 DeepSeek 的推理能力似乎与 OpenAI 不相上下。“如果 OpenAI 不降低价格,我认为未来几个月许多开发人员将转向 DeepSeek,”Osman 说。

OpenAI 拒绝发表评论。DeepSeek 也没有回应置评请求。

谷歌 DeepMind 首席执行官 Demis Hassabis 上周在达沃斯接受彭博新闻社采访时表示:“这有点出乎意料。毫无疑问,这是一个令人印象深刻的系统。”但与业内其他人一样,Hassabis 对 DeepSeek 模型的工作原理表示不确定,包括它在多大程度上依赖其他西方模型。

与此同时,知情人士透露,奥尔特曼告诉 OpenAI 员工,他的初创公司正在试图了解 DeepSeek 的表现是否以及在多大程度上是提炼 OpenAI 模型的结果——即使用该公司人工智能的输出来训练不同的模型以获得类似的能力——或者代表了一项独立的研究突破。

“即使这(提炼 OpenAI 模型)为他们节省了一点时间和金钱(我并不是说他们确实节省了),但这篇论文中显然包含了大量真正的技术工作,人们可以自己查阅并判断,”最近离开 OpenAI 的独立人工智能政策研究员 Miles Brundage 说道。

一些美国科技创始人和风险投资家也对 DeepSeek 技术的实际价格表示怀疑。包括 Brundage 在内的许多人都质疑 DeepSeek 560 万美元的培训预算是否包括了之前研究实验的成本以及投资图形处理单元的固定成本,例如建设数据中心。

梁则表示,成本和融资并不是他的主要担忧。梁在接受中国媒体36氪采访时表示,进一步发展的瓶颈是美国对获取最佳芯片的限制。

“更多的投资并不一定会带来更多的创新,”梁说。“否则,大公司将接管所有创新。”

新的竞争格局

在 DeepSeek 热潮兴起前的几周里,梁所暗示的一些大公司甚至进一步展示了它们的财力。

亚马逊预计 2024 年资本支出约为 750 亿美元,今年的支出将有所增加,主要用于支持人工智能的芯片和数据中心等技术基础设施。Meta 表示,它将在 2025 年向人工智能相关项目投资高达 650 亿美元。微软表示,本财年将在人工智能数据中心上投入 800 亿美元。

大型云计算公司的大部分支出都用于 Nvidia 图形处理单元。法国巴黎银行 Exane 分析师 Stefan Slowinski 在周一的一份研究报告中写道,亚马逊、谷歌和微软也在开发专为人工智能设计的定制芯片,如果开发人员能够在专业性较低的硬件上构建和运行模型,那么从长远来看,这项工作的用处可能会减少。

云计算巨头们已经开始努力应对投资者对其巨额人工智能投资回报的质疑。微软就一直难以将其融入大部分产品线的 Copilot 聊天机器人变现。与此同时,亚马逊在开发自己的大型语言模型方面落后于其主要竞争对手,尽管它已将聊天机器人和其他人工智能工具注入其零售和云计算业务。

不过,这两家公司的巨额投资可能会在未来获得回报。亚马逊认为,随着其他公司在亚马逊网络服务的服务器上训练和运行人工智能程序,其作为最大租用计算能力提供商的地位将帮助其繁荣发展。伯恩斯坦法国兴业银行集团分析师马克·莫德勒表示,微软更专注于建设运行人工智能模型的数据中心,而不是训练它们,他预计微软的支出最早明年就会放缓。“我们认为他们主要在建设推理能力,而不是训练,”他说。“如果这是正确的,我认为 DeepSeek 对微软来说不是问题。”

最大的问题是,美国大型科技公司是否会采用 DeepSeek 的方法。一些人工智能开发人员表示,这家中国新贵公司的成功可能会加速人工智能向更便宜、更有利可图的方向发展——这将开启一种自然进程,这种进程推动了从芯片到智能手机等几乎所有重大技术的发展。

人工智能初创公司 Cohere 的首席执行官艾丹·戈麦斯 (Aidan Gomez) 表示:“法学硕士的未来属于那些专注于更高效技术而不是更多计算的人。我们长期以来一直相信这一点,但它终于在整个行业引起了轰动。”

评论

此博客中的热门博文

中国 AI 初创公司 DeepSeek 是如何与硅谷巨头竞争的

纽约时报: DeepSeek 的工程师说,他们的系统只需要约 2000 块美国芯片制造商英伟达生产的专用计算机芯片,而美国大公司的 AI 系统需要多达 1.6 万块芯片。 Marlena Sloss/Bloomberg 圣诞节的第二天,一家名为深度求索 (DeepSeek) 的中国小型初创公司发布了一个新的人工智能系统,其功能可与 OpenAI 和谷歌等公司的尖端聊天机器人相媲美。 能做到这点本已是一个里程碑。但这个名为 DeepSeek-V3 的大模型背后的团队描述了一个更大的进步。深度求索的工程师在介绍他们如何构建这个大模型的 研究论文 中写道,他们在训练该系统时只用了领先人工智能公司用的高度专业化计算机芯片的一小部分。 这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片(如硅谷公司英伟达生产的那些)进行限制。 但 DeepSeek 大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。 据美国人工智能公司一直使用的行业基准测试,DeepSeek 聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。 而且它的造价很低,挑战了只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统的普遍观念。中国工程师称,他们只花了约 600 万美元的原始计算能力就训练了新模型,不到科技巨头 Meta 训练其最新人工智能模型所耗资金的十分之一。 “有 600 万美元资金的公司在数量上远远多于有 1 亿美元或 10 亿美元资金的公司,” 风险投资公司 Page One Ventures 的投资人克里斯 · 尼科尔森说道,他主要投资人工智能技术。 自从 OpenAI 2022 年发布了 ChatGPT,引发人工智能热潮以来,许多专家和投资者曾得出结论认为,如果不投入数亿美元购买人工智能专用芯片的话,没有公司能与行业领军者竞争。 世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达 1.6 万个芯片,甚至更多。但 DeepSeek 的工程师却说,他们只用了约 2000 个英伟达生产的专用芯片。 中国进口芯片受到限制,迫使 DeepSe...

揭秘DeepSeek:一个更极致的中国技术理想主义故事

  做贡献者,而非搭便车者。 文 | 于丽丽 编辑 | 刘旌 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。 弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。 这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA( 一种新的多头潜在注意力机制 )架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。 在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。” 在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。 多位行业人士告诉我们, 这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。 一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。” 而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见: 美国更擅长从0-1的技...

付鹏11月24日在HSBC内部演讲速记

《2024年年终回顾和2025年展望——对冲风险VS软着陆》   上篇 正值年底,虽然刚才汇丰一直强调大家不录音不录像,但大概率你挡不住。我在这儿讲话会谨慎一些,非常小心谨慎,大概率会有人透露出去,放到YouTube上,基本上所有见我都说付总我在YouTube上看过你的视频,我说那都是盗版的,靠盗版发财的也不少。 今天和大家分享的内容基本上都是官方的,回顾会多一点,展望不多,因为这个月展望完了之后下个月怎么办?有些话对我来讲我倒觉得很简单,本质上原来我们是做Hedge Fund出身,所以我们的逻辑框架整体具有极强的延续性,不是说今年去讨论,或者说明年去讨论。 惯性思维从2016年开始,我一直在跟大家强调这个世界已经完全不一样了。当然经历过过去的几年时间,我相信在座各位应该对这番话的理解变得越发深刻。 2016年实际上是美国特朗普的第一次大选,我有一个特点,我的特征是如果我觉得什么地方有投资机会,我可能第一时间去一线调研,我不喜欢看YouTube,我也不喜欢在网上扒。当然你会说,现在ChatGPT很强大了,人工智能好像能帮你解决很多问题,但你们有没有想过,可能广泛流传或者广泛传播的很多信息是错的。这一点在2012年当时我从日本做完调研回来之后,我的感悟是最深的。 当然去日本有一个重要的人物,名字叫本森特,很快大家就会非常熟悉他的,目前来讲应该是特朗普政府提名的美国财长。本森特原来是索罗斯基金实际掌控人,因为索大爷已经年龄很大了,去年的时候才刚刚把基金的业务交给他儿子亚历山大,但在这之前,最主要的几场战役本质上来讲都是本森特在主导。 2012年当时我从北京去香港约朋友们吃饭的饭局上,当时斯索罗斯基金在香港办公室跟我说,本森特从这儿去了日本。我说OK。我经常说一句话“站在巨人的肩膀上看问题。” 当然你知道,网民们最可怕的地方是巴菲特“SB”、索罗斯“SB”,我最“牛逼”。你要记住,他们的所有行为一定有很大的变化,很多人可能都不知道,巴菲特第一次去是2011年,我们正在讲福岛核电站泄漏,核废水污染以后海鲜不能吃的时候,一个80多岁的老头顶着核辐射泄漏去日本吃海鲜了,当然他去日本干吗,这其实很关键。 之后我们跑到日本做完调研回来之后那几年,我陆陆续续跟很多人讲,日本正在发生变化,日本的利率结构都会随之变化的,当然包括日本的证券市场。今年日本股市终于走出这35年了,创下...

如何从中国走线(润到)美国

经济学人: 他们来美国的原因各不相同。有些人寻求经济机会。其他人则对统治感到失望。许多人在网上看到其他中国移民穿越哥伦比亚和巴拿马之间无法无天的丛林地带,寻求更好的生活。数以万计的中国公民前往南美,这是前往美国的危险旅程的第一步。这条路线非常受欢迎,以至于它获得了一个中文昵称:走线,即走线。 过去两年,中国移民一直是穿越美国南部边境增长最快的群体。2023 年,美国边境巡逻队遇到了 3.7 万多名中国移民,高于 2022 年的 3,813 人和 2021 年的 689 人。今年前八个月又有 2.1 万人入境。他们仍然只是 2023 年试图越境的 200 万移民中的一小部分。但由于美国和中国陷入了经济、意识形态和地缘战略竞争,中国移民已成为政治焦点。 唐纳德·特朗普说,来自中国的新移民大多是适龄参军的男性。“他们是想在我们国家组建一支小军队吗?”他问道。其他共和党政客称中国移民是潜在的间谍。卡马拉·哈里斯和民主党人没有那么危言耸听,但他们也担心边境问题。在总统竞选中,移民是首要关注的问题,而中国是一个方便的反面人物,因此几乎没有人努力去了解是什么推动了这种人口流动,以及这对每个国家意味着什么。 《经济学人》花了三个月时间在哥伦比亚、墨西哥和美国进行报道。我们采访了数十名移民,以及走私者、边防警卫和专家。一些人允许我们追踪他们的移民旅程。一些人经过数周的乘船、乘公共汽车、步行和乘飞机的旅行才抵达美国。其他人则在途中失去了一切。大多数人被更美好未来的承诺所吸引,并遵循了试图利用美国不完善的移民制度的策略。但他们的旅程也揭示了中国的情况,压制性统治和日益恶化的经济萎靡不振正在将人们推向远离中国的道路。 第一部分 内科克利 对于许多中国移民来说,美洲的第一站是厄瓜多尔,直到最近,厄瓜多尔才向他们提供免签证入境。但他们很快就搬到了哥伦比亚。在那里,我们遇到了黄女士,一位 40 多岁、身穿亮粉色连衣裙的女性。她已经打破了出生地——中国西南部贵州省的一个贫穷村庄——的保守规范。村里大多数妇女终生务农和养育孩子。然而,黄女士离开家乡去了大城市,养育了两个孩子,并与嗜赌成性的丈夫离婚。她来到了加勒比海边缘的海滨小镇内科克利,即将进入哥伦比亚和巴拿马之间危险的达连峡丛林。 她两个 20 多岁的妹妹也来了。她们之前都没有离开过中国。黄女士说,她们对未来的危险知之甚少,但梦想着到达美国。自疫...

三联深度:逃出妙瓦底 缅甸诈骗园区

 原创 飞天小豚 三联生活周刊 2025年01月10日 18:06 北京 *本文为「三联生活周刊」原创内容 没有高薪,没有偷渡,更没有去缅甸、柬埔寨这些危险的国家,中国留学生李奥不明白,为什么自己只是在安全的国家想正常找一份工作,却不断跌入招聘陷阱,最终沦为人口贩卖的牺牲品。在经历过一场在缅东的死亡之旅后他才明白,海外华人招聘圈已经被博彩、诈骗等灰色产业渗透,而印象中的那些城市,已经不同以往。 记者|夏杰艺 实习记者|顾靓楠 陷阱 2022年6月5日,李奥站在东南亚一条混浊的泥水河前。河很窄,不过五六米,两岸是一样的黄褐色烂泥地和杂乱的野树林,河面上一条孤零零的小船。 很久之后他才知道,这条不起眼的小河是莫伊河,位于泰缅边境交界处,是知名的偷渡“天堂”。 这里荒无人烟,见不到警察和海关人员,和他同行的是一个肯尼亚女人和一个二三十岁的中国男子。三人的背后跟着四名大汉,他们不怎么说话,但其中一人手上拿着一把小臂长的砍刀,明晃晃的。 泰缅边境的莫伊河岸(摄于2022年) “They are human traffic.”旁边的肯尼亚女人意识到自己的命运,轻声说道。李奥也明白,他们三人已经沦为“猪仔”——人口贩卖的牺牲品。 李奥是浙江台州人,27岁,高二时被父母送到英国读书,随后进入英国利物浦大学学习,但因家中破产被迫辍学,没能获得高中和大学文凭。他的唯一优势是英语,所以工作后有一半时间都在中东、非洲等地的华人企业就职,从事翻译或行政工作。在李奥看来,海外华人企业的待遇更优厚:工资大多在每月一万五千元以上,还包食宿。 2022年初,他先是在肯尼亚的蒙巴萨为江门机械松林有限公司工作,后来又换到阿联酋阿布扎比,在中国通信服务(CCS)的分公司做项目经理,由于岗位期望与公司产生冲突,5月,他辞职来到迪拜,边旅行边求职。 李奥对本刊回忆,自己当时在迪拜当地的华人生活网站“迪拜全酋通”上浏览招聘信息,注意到了一家泰国曼谷的企业。该企业声称从事跨境电商业务,老板需要招聘一名助理兼翻译。该企业跟李奥约了一次英文电话面试,并要求他录制了一则自我介绍的英文短片,然后发放了入职邀请。在李奥看来,该企业和大部分他打过交道的海外华人企业类似——入职程序比较随意,薪资每月一万多元,包住宿和来程机票,但不愿意给劳动者办工签,而是以旅游签入境。“曼谷,在我心里还是一个比较安全、讲法治的地方,...

2025年首个交易日三大指数集体收跌,沪指跌2.66%,深成指跌3.14%,创业板指跌3.79%。全市场成交额1.4万亿元,全市场超4300只个股下跌。

2025年首个交易日三大指数集体收跌,沪指跌2.66%,深成指跌3.14%,创业板指跌3.79%。全市场成交额14095亿元,较上日放量509亿元。全市场超4300只个股下跌。 此前,中国股市去年 录得 2020 年以来的首次年度上涨。投资者指出,谨慎情绪背后有一系列因素,包括财新制造业调查结果低于预期。2024 年最后一个交易日,沪深 300 指数大幅下跌,也导致该指数跌破备受关注的技术门槛,可能导致一些基金进一步抛售。 与此同时,中国工商银行、中国农业银行等几只大型金融股正在进行除息交易,加剧了基准指数的损失。 abrdn Plc 投资总监Xin-Yao Ng 表示:“当我们将资金投入 2025 年第一季度时,中国经济的下行风险似乎远大于上行风险。” 他表示,关税、宏观数据疲软以及政策刺激措施可能在 3 月份两会(即中国一年一度的立法会议)召开之前停滞不前等因素都存在不确定性。 继 9 月底刺激措施推动的反弹之后,中国股市基本处于区间波动,投资者等待出台更大规模的刺激措施来推动市场走高。继 12 月中央经济工作会议之后,中国 表示 将在 2025 年增加公共借贷和支出,并将政策重点转向消费,以努力修复经济的薄弱环节,因为即将实施的美国关税威胁到出口。 周四香港股市休市后交易量显著,恒生指数成交量比过去 30 个交易日的平均成交量高出 60%。与此同时,上海和深圳股市的成交量最近几天一直低于 1.5 万亿元人民币(2060 亿美元),这表明交易员选择保持观望,直到催化剂变得明朗。 福建同恒投资的基金经理杨廷武表示,“今天的下跌可能是由于量化基金在12月31日下跌(当时基金调整了年终仓位)后,在岸指数跌破60日移动均线后,被迫抛售所致。”

Revealing DeepSeek: A more extreme story of Chinese technological idealism

  文 | 于丽丽    Wen | Yu Lili 编辑 | 刘旌    Edit | Liu Jing 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 Of the 7 major model startups in China, DeepSeek is the least silent, but it can always be remembered in an unexpected way. 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 A year ago, this kind of quantitative private equity giant fantasies that did not mean to derive behind it was the only company outside the large factory that reserved 10,000 A100 chips. One year later, it came from it to trigger the source of China's big model price war. 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 In May, which was bombarded by AI, Deepseek became famous. The reason is that they released an open source model called DeepSeek V2, which provides an unprecedented cost-effectiveness: the reasoning cost of reasoning is reduced to only 1 yuan per millio...

特朗普就职演讲中英文全文

谢谢,谢谢大家,非常感谢你们。非常非常感谢。副总统万斯,众议院议长约翰逊,参议员图恩,美国首席大法官罗伯茨,以及美国最高法院的大法官们。 克林顿总统、布什总统、奥巴马总统、拜登总统、哈里斯副总统,以及我的各位同胞, 美国的黄金时代从现在开始 。 从今天起,我们的国家将再次繁荣,并在全世界受到尊重。我们将成为每个国家的羡慕对象,不再让自己受到剥削。 在特朗普政府的每一天,我都会把美国放在第一位 。 我们的主权将被夺回。我们的安全将得到恢复。正义的天平将重新平衡。司法部和我们政府的恶劣、暴力和不公正的武器化将结束。 我们的首要任务是创造一个骄傲、繁荣和自由的国家。美国将很快变得更伟大、更强大,并且比以往任何时候都更加卓越。 我自信和乐观地回到总统职位上,我们正处于一个令人兴奋的新国家成功时代的开始。一股变革的浪潮正在席卷整个国家,阳光洒遍全世界,美国有机会前所未有地抓住这一机遇。 但是首先,我们必须诚实面对我们面临的挑战。虽然挑战很多,但它们将被美国当前所见证的这一伟大势头摧毁。 今天我们聚集在一起时,我们的政府正面临一场信任危机。多年来,一个激进且腐败的体制从我们的公民手中攫取权力和财富,而我们社会的支柱却破碎不堪,似乎完全失修。 我们现在的政府连国内的简单危机都无法应对,同时还在海外接二连三地陷入灾难性事件。 它未能保护我们辉煌、守法的美国公民,却为危险的罪犯提供庇护和保护,这些罪犯许多来自监狱和精神机构,他们非法进入我们的国家。我们有一个政府,无限制地资助外国边界的防御,却拒绝保护美国的边界,或者,更重要的是,保护自己的人民。 我们的国家在紧急情况下已经无法提供基本服务,这一点最近由北卡罗来纳州的优秀人民证明了。他们受到如此糟糕的对待。而其他几个州在几个月前发生飓风后仍在遭受痛苦。 或者更近的是洛杉矶,我们正在目睹大火仍在无情地燃烧。从几周前开始,它们毫无防备地横扫房屋和社区,甚至影响到我们国家一些最富有和最有权势的人,其中一些人现在就坐在这里。他们已经无家可归了。这很有趣。 但是我们不能让这种情况发生。每个人都无能为力。这将会改变。我们的公共卫生系统在灾难时无法提供帮助,却在其上花费了比世界上任何国家都要多的钱。 我们的教育系统则教导我们的孩子为自己感到羞愧,在许多情况下,教他们仇恨我们的国家,尽管我们试图如此绝望地向他们提供爱。所有这一切将从今天开始改变,而且...

市场对中国通货紧缩螺旋发出警报

彭博社: 中国11万亿美元政府债券 市场 的投资者对这个世界第二大经济体从未如此悲观,一些投资者现在大举押注中国将出现与上世纪90年代日本类似的通货紧缩螺旋。 尽管中国 政府 宣布了一系列经济刺激措施,但 中国 10 年期主权债券收益率近几周 跌至历史最低水平,与美国同类债券收益率差距达到前所未有的 300 个基点。 此次暴跌导致中国债券收益率远低于2008年全球金融危机和新冠疫情期间的水平,凸显出人们日益担心政策制定者无法阻止中国陷入可能持续数十年的经济低迷。 如果债券市场预测正确,其影响将是深远的。长期通货紧缩将阻碍世界最大的经济增长引擎之一,给这个人口第二大国家的社会稳定带来新的压力,并加剧资本外流,去年年底,资本外流导致中国金融市场出现创纪录的外逃现象。 投资者对日本化 风险的重视程度可见一斑 。中国 10 家最大的券商均对邻国日本的失落几十年进行了研究。 以比较两国经济而闻名的经济学家 顾朝林表示,中国企业和智库曾与他联系,请他分享自己的观点。 高盛集团 本周表示,日本的案例为中国股市投资者提供了“宝贵的策略”,他们正因近十年来最糟糕的开局而感到不安。 虽然还不能确定中国是否会重现泡沫破灭后的日本,但 相似之处 却不容忽视。两国都遭遇了房地产崩盘、私人投资疲软、消费不振、债务负担过重以及人口迅速老龄化。即便是那些将中国经济管控得更紧作为乐观理由的投资者也担心,官员们没有采取更有力的行动。日本的一个明显教训是:当局越是拖延消除投资者、消费者和企业的悲观情绪,恢复经济增长就越困难。 “如果不加以纠正,这种恶性循环将会越来越严重,”  abrdn Plc 驻新加坡的投资总监 Xin-Yao Ng表示 ,该公司管理着全球 4940 亿美元的资产。“日本的教训有心理因素,这种情况持续的时间越长,企业和消费者信心就会越弱。” 进入 2025 年,中国市场已处于危险之中。随着基准 10 年期国 债收益率 首次跌破 1.6%,专家们 提出了 收益率接近于零的曾经不可想象的前景。今年前四个交易日,沪深 300 指数 下跌了 3.5%,而离岸人民币交易价格接近历史低点——促使当局本周抑制跌势。 中国债券收益率下跌 其 30 年期主权债券收益率已跌至日本 资料来源:彭博社 野村综合研究所 首席经济学家辜朝晖表示:“债券市场已经在告诉中国人:‘你们正陷入资产负债表衰退’。...

2万字全文: 段永平2025年1月5日浙大师生见面会问答实录

   来源:Web3 天空之城   天空之城 · 城主:    今天,段永平回母校浙大与师生进行了一场 长达 90 分钟的现场见面问答会。本城进行了书面整理,全场问答一共两万字左右。和感兴趣各位分享。   --   男主持人:   我们学生在日常学习方法以及未来人生规划上,可以做出哪些顺应时代变迁的措施,特别是应对 AI 变化时,我们可以持有哪些因时而变的想法。不知道段学长有没有什么建议?   段永平:   时代一直在变,工具也在变,但基本的东西仍然一样。学校主要是学习方法,有了 AI 只是能让你效率更高。当然,做论文的时候需要小心,不要发生不当行为。我觉得最主要的是,不论你是在学习方法还是创业上,每一个决策不能仅着眼于当下,而应该考虑到五年、十年甚至二十年后的影响。我的回答可能适用于许多问题,我们需要有长远的眼光。   男主持人: 感谢段学长的建议,同时也提醒了我们要适当使用 AI 工具,特别是在学术研究上要谨慎。   段永平: AI 工具在学术和研究中确实需要谨慎使用。   女主持人:   感谢段学长的回答。接下来,我们来看我手中的入场券上的第一个问题,这是来自我们经济学院的同学。很幸运他成为今天第一个提问的同学。他的提问是,段学长在投资时如何快速判断一家公司是否值得长期投资?   段永平:   基本上,我不会快速做出这样的判断。过去十多年,我关注的公司就那几个,这源自我对企业、生意、产品多年的理解。我没见过谁能很快下判断,包括巴菲特和芒格这样的投资高手,他们的节奏也很慢。他们并不怕错过一些机会,但最重要的是不要踩雷。有人可能会说,有钱不需要快赚,但我们缺钱就想快赚。我回应说,这可能正是你缺钱的原因,因为一直想着快速赚钱。其实我也想挣快钱,谁不想挣快钱?但是呢,秩序不可违很重要,就是你还是要踏踏实实做该做的事情。   女主持人:   好的,学长的意思就是要敢于尝试,并且眼光要放得远一些。   段永平:   敢于尝试这个太难了。你怎么个尝试法?就说呢,我不是一个不敢冒风险的人,但是呢,你要拼到你能够承受得起的风险。大家不能够说,哎呀,谁谁谁,你看他赌对了。那你说这个投资我最厉害的,那是二十分钟赚了二十多倍。人家说你干嘛呢?我在赌场呢。一百块钱赚了两千多块钱,我就走了。但是我可以重复这件事吗?我不能。那你说我当年投 网易  ( 88.25 ,...