经济学人:
一家名不见经传的中国公司DeepSeek发布其最新的人工智能 ( AI ) 模型,打破了美国多年来旨在遏制中国创新的政策,并在此过程中,让包括美国AI芯片领军企业英伟达和数据中心电气设备制造商西门子能源在内的多家公司的估值大跌。DeepSeek 展示了其绕过美国出口限制进行创新的能力,但也引发了人们的质疑:在训练AI模型时,获得大量尖端半导体和相关设备是否像之前认为的那样重要。
这一切的中心人物是 DeepSeek 40 岁的创始人梁文峰。目前尚不清楚他对自己引发的全球市场动荡有多高兴。梁文峰的一位高中同学最近接受当地媒体采访时表示,梁文峰在家乡躲过农历新年(1 月 29 日开始)。梁文峰在中国社交媒体上被戏称为“瘦骨嶙峋、面色苍白”,对大多数人来说,他仍然是个谜。与 DeepSeek 有过专业接触的人说,他痴迷于类人通用人工智能 ( AGI ) 及其对世界的影响。在追求这一目标的过程中,DeepSeek 的创始人颠覆了西方和中国对技术进步的看法。
关于梁先生的公开信息很少。1985 年,梁先生出生于湛江市附近一个贫困村庄的教师家庭,是一名天才学生。一位前任教师声称,他在中学时就掌握了大学水平的数学。2002 年,他考入浙江大学电子信息专业,浙江大学是东部城市杭州的一所名校。在同一所大学,在一位知名机器视觉科学家的指导下,他获得了硕士学位,并接触到了人工智能领域。
当时,杭州是互联网技术繁荣的中心,电子商务公司阿里巴巴等新兴公司的所在地。梁先生和几位同学留在杭州,开始尝试量化投资模型,这种模型不依赖于公司基本面,而是依赖于对大量数据的分析。2013 年,梁先生和三名同学成立了一家名为雅克比的投资集团,试图将他们建立的交易模型货币化。
两年后,梁先生与他人共同创立了 High-Flyer,这是一家量化对冲基金,在中国放松管制和市场动荡时期,它与数十家类似的公司一起迅速成长。2021 年,它声称管理着高达 1000 亿元人民币(140 亿美元)的资金,尽管当年下半年其规模似乎迅速缩水。量化基金经常与中国监管机构发生争执,监管机构认为它们从市场暴跌中获利。业内人士表示,High-Flyer 以最激进的量化基金之一而闻名,经常引起证券监管机构的愤怒。
DeepSeek 的起源在于改进 High-Flyer 算法的努力。2019 年,该公司投资 2 亿元人民币成立了一个独立部门,开发自己的深度学习平台“Fire-Flyer 1”。该基金在 2021 年投入了 10 亿元人民币,以推出配备 10,000 个 Nvidia A 100 图形处理单元的第二代产品。这让 High-Flyer 成为了一个异类:当时中国只有另外四家公司拥有如此庞大的强大芯片库,这些公司都是阿里巴巴等科技巨头。DeepSeek 于 2023 年成为一家独立公司。
去年 5 月,该公司首次给市场带来了冲击,当时它发布了一款基于V 2 模型的超低价聊天机器人。这引发了中国人工智能行业的价格战,迫使中国最大的科技公司——阿里巴巴、百度、字节跳动和腾讯——降低自己的价格。
梁先生自己说,这不是为了吸引更多用户。今年 7 月,他表示,随着 DeepSeek 探索新的模型结构,成本已经下降,这是它与其他公司不同的地方。尽管竞争对手中国人工智能公司一直在进行自己的模型研究,但由于美国的出口限制,他们在计算能力方面的劣势使他们更专注于开发使用该技术的智能应用程序。许多中国人工智能公司已经使用美国社交媒体公司 Meta 开发的大型语言模型系列 Llama 作为其应用程序的基础。
深刻的思考
对于梁先生来说,开发使用较少计算能力的模型是实现其长期目标的重要一步。他告诉当地媒体:“我们的目标是AGI,这要求我们探索新的模型结构,以在有限的资源内实现卓越的能力。”
DeepSeek 的新R 1 模型震惊了西方,表明它正在取得进展。该公司表示,训练成本不到 600 万美元,只是Chat GPT制造商Open AI等公司同类模型的一小部分。Open AI的老板 Sam Altman 称R 1“令人印象深刻”(尽管他也承诺会生产“更好的模型”,并补充说“有新的竞争对手确实令人振奋”)。
当然,也有人对 DeepSeek 表示怀疑。早期测试似乎证实了R 1 确实像制造商所说的那样强大。但一些人质疑该公司是否低估了其用于开发该模型的高端芯片数量,即使其他人认为其说法是可信的。还有人猜测 DeepSeek 通过研究美国模型的结果来训练其模型,这一过程被称为“蒸馏”。Open AI表示,有证据表明 DeepSeek 对其模型进行了提炼,违反了其服务条款。
即使 DeepSeek 的效率提升并不像想象的那么令人印象深刻,但它仍然对硅谷和北京的思维方式构成了挑战。中国官方媒体迅速将 DeepSeek 推崇为国家在争夺人工智能霸权过程中的一笔国家资产。1 月 20 日,梁先生和其他几位企业家应邀与中国总理李强会面。
然而,正如投资公司 Pinpoint Asset Management 的张志伟所指出的那样,DeepSeek 的成就并非来自中国众多政府支持的研究机构或国有企业。梁先生似乎控制着 DeepSeek 的大部分股份,并避开了中国由国家主导的风险投资行业。
梁先生认为,过去 30 年来,中国扮演着技术“追随者”的角色,以西方发展的基础为基础。他在 7 月接受当地媒体采访时表示,美国和中国的差距在于“原创与模仿”之间。他认为,英伟达的成功不仅依赖于自身的表现,也依赖于西方公司之间的技术合作。在他看来,中国模仿西方计算能力的努力失败了,因为中国缺乏这种类型的合作,尽管政府投入了大量资金来创建这种合作。DeepSeek 可能不仅是对硅谷的警钟,也是对中国北京领导人的警钟。
评论
发表评论