跳至主要内容

博文

目前显示的是标签为“人工智能”的博文

deepseek:中国的人工智能产业几乎赶上了美国

经济学人: 9月,美国公司 Open  AI 发布了 世界 上第一个“推理模型”,这是一种先进的人工智能。该模型名为 o1,它使用“思维链”来解答科学和数学难题,将问题分解为组成步骤,并在后台测试各种方法,然后向用户呈现结论。它的发布引发了一场效仿此方法的竞赛。谷歌于 12 月推出了一种名为“双子闪电思维”的推理模型。 几天后, Open  AI推出了 o3,这是 o1 的更新版本。 图表:经济学人 但事实上,拥有众多资源的谷歌并不是第一家模仿 Open  AI 的 公司。在 o1 推出后不到三个月,中国电子商务巨头阿里巴巴就发布了新版 Qwen 聊天机器人 Q  w  Q ,具有相同的“推理”能力。该公司在一篇华丽的博客文章中问道:“思考、质疑和理解意味着什么?”并附上了该模型免费版本的链接。另一家中国公司 DeepSeek 在那之前一周发布了一款名为 R  1 的推理模型的“预览版”。尽管美国政府竭力遏制中国 人工智能 产业的发展,但两家中国公司已在短短几周内将美国同行的技术领先优势缩小到最小。 中国公司不仅在推理模型方面处于领先地位:去年 12 月,DeepSeek 发布了新的大型语言模型 (  LLM  ),这是一种分析和生成文本的 人工智能 。v3 大小接近 700 GB,大到无法在专业硬件上运行,并且有 6850 亿个参数,这些单独的规则组合起来构成了模型的神经网络。这使得它比以前免费下载的任何模型都要大。Facebook 母公司 Meta 的旗舰 LLM Llama 3.1 于 7 月发布,只有 4050 亿个参数。 DeepSeek 的 LLM 不仅比许多西方同行规模更大,而且更优秀,只有谷歌和 Open  AI 的专有模型可以与之匹敌。 人工智能 编码平台Aider 的创始人 Paul Gauthier 在他的编码基准测试中运行了新的 DeepSeek 模型,发现除了 o1 本身之外,它胜过所有竞争对手。众包聊天机器人排名 L  msys 将其排在第七位,高于任何其他开源模型,也是除谷歌或 Open  AI 以外的公司制作的最高排名(见图表)。 龙之崛起 如今,中国 人工智能的 质量已与美国竞争对手非常接近,Open  AI 的老板...

中国人工智能公司deepseek正在迎头赶上,给唐纳德·特朗普带来困境

经济学人: 如果 说美国   需要 一种技术来实现唐纳德·特朗普总统在就职演说中承诺的“激动人心的国家成功新时代”,那么这种技术就是生成式人工智能。至少,人工智能 将 增加未来十年的生产力,推动经济增长。最多,它将通过堪比工业革命的变革为人类提供动力。 特朗普在第二天主持了“史上最大 人工智能 基础设施项目”的启动仪式,表明他已经掌握了这一潜力。但世界其他国家也是如此——尤其是中国。就在特朗普发表就职演说时,一家中国公司发布了最新的令人印象深刻的大型语言模型 (  LLM  )。突然之间,美国在 人工智能领域 对中国的领先优势看起来比 Chat  GPT 成名 以来的任何时候都要小。 中国的追赶令人吃惊,因为它曾经远远落后——而且美国已经开始放慢它的步伐。乔·拜登政府担心先进的 人工智能 可能会确保中国共产党 (  CCP  ) 的军事霸权。因此,美国限制了对中国最好的人工智能训练芯片的出口 , 并切断了中国获取制造替代品所需的许多机器的渠道。在保护墙后面,硅谷大摇大摆地走着。中国研究人员如饥似渴地阅读美国关于人工智能的论文 ; 美国人很少回报他们的赞美。 然而,中国最近的进步正在颠覆整个行业,让美国决策者感到尴尬。中国模式的成功,加上整个行业的变革,可能会颠覆 人工智能的经济。美国必须为中国 人工智能 即将威胁到美国的 世界做好准备。 中国的 法学 硕士并非一流,但制作成本低得多。电子商务巨头阿里巴巴旗下的 Q  w  Q 于 11 月推出,落后美国顶级模型不到三个月。DeepSeek 的创建者是从一家投资公司分拆出来的,在一项基准测试中排名第七。它显然是使用 2,000 个二流芯片进行训练的,而 Meta 的模型使用了 16,000 个一流芯片,DeepSeek 在某些排名中胜过 Meta。训练美国法学 硕士 的成本为数千万美元,且还在不断上升。DeepSeek 的所有者表示,花费不到 600 万美元。 美国公司可以随意复制 DeepSeek 的技术,因为它的模型是开源的。但廉价的培训将在模型设计不断发展的同时改变行业。中国在 就职典礼当天发布的是 DeepSeek 的“推理”模型,旨在与 Open  AI 最先进的产品竞争 。这些模型在回答问题之前会自言自语。这种“思考”会...