华尔街日报:
上个月,中国公司 DeepSeek发布了一款新的人工智能模型,尽管使用的芯片不那么复杂,处理能力也只是美国的一小部分,但仍能与竞争对手的美国系统相媲美,这在华尔街引起了震动。
据该公司发表的论文称,DeepSeek 之所以能够事半功倍,是因为其最新的 R1 模型更多地依赖于一种名为强化学习的过程,在该过程中,模型使用其创建并适应自身的奖励系统从其动作中获得反馈。
该模型从现有的大量文本开始,这些文本被分解成独特的单词、单词片段和标点符号,可以用不同的方式重新组合在一起。这个“大型语言模型”有超过 6710 亿个可调整的设置,称为“参数”,可以调整这些设置来确定模型如何响应提示。

按模型划分的参数数量
参数是决定模型如何处理信息和做出决策的设置。模型中的参数数量表明了模型的大小。
DeepSeek 的最新模型
OpenAI 模型
可执行任何任务
37B
GPT-1
GPT-2
GPT-3
GPT-4
DeepSeek R1
1.17亿
15亿
175B
1.8T
671B
模型的参数数量是衡量其规模的一种方式。与传统 AI 模型不同,R1 的可调设置中只有一小部分在任何单个操作期间处于活动状态。活动参数的减少大大降低了处理所需的功率和计算能力,并允许模型在更便宜、更简单的芯片上运行。
DeepSeek 的 R1 模型通过分成多个具有不同专长的网络来工作,这种方法被称为“专家混合”方法。某些提示会要求不同的专长,而为了回答提示,模型只会处理它自己教过的、最相关的网络。
相比之下,传统的人工智能模型依赖于大量预先标记的数据集,这个过程被称为监督训练。预先标记是由人工完成的,成本高昂且耗时。
DeepSeek 模型的另一个显著特点是它是开源的,这意味着它可以被公司外部的开发人员重新利用。
该公司的 R1 模型在加州大学伯克利分校研究人员运营的 AI 模型评级平台 Chatbot Arena 上名列前茅。
对于数学和编码等任务,R1 的表现比大多数其他模型更好。

全面的
Gemini 2.0 闪电思维实验(谷歌)
Gemini 2.0 Pro 实验版(谷歌)
ChatGPT-4o-latest (OpenAI)
误差幅度
R1(DeepSeek)
Gemini 2.0 Flash (谷歌)
1325
1350
1375
1400
1425
创意写作
ChatGPT-4o-latest (OpenAI)
Gemini 2.0 闪电思维实验(谷歌)
Gemini 2.0 Pro 实验版(谷歌)
Gemini 2.0 Flash (谷歌)
R1(DeepSeek)
1325
1350
1375
1400
1425
编码
Gemini 2.0 Pro 实验版(谷歌)
ChatGPT-4o-latest (OpenAI)
Gemini 2.0 闪电思维实验(谷歌)
o1(OpenAI)
R1(DeepSeek)
1325
1350
1375
1400
1425
数学
o1(OpenAI)
o3-mini(OpenAI)
R1(DeepSeek)
Gemini 2.0 闪电思维实验(谷歌)
o1-预览(OpenAI)
1325
1350
1375
1400
1425
Chatbot Arena 的数据来自众包网站访问者,访问者使用其网站提出问题,从两个匿名 AI 模型获得答案,然后评定哪个更好。该网站已统计了约 200 个模型的 250 多万张投票。
根据人工智能基准测试公司 Artificial Analysis 汇编的数据,DeepSeek 为开发人员访问 R1 提供的定价低于其智能类别中的许多其他模型。
人工智能模型的制造商根据双方之间来回发送的数据量(或行业术语中的代币数量)向用户(例如想要将该技术集成到其产品的企业)收取费用。

70
o3-mini (OpenAI)
o1 (OpenAI)
R1 (DeepSeek)
60
智力指数
50
40
三十
20
0
5
10
15
20
二十五
30美元
每百万代币价格
评论
发表评论