跳至主要内容

博文

目前显示的是标签为“AI”的博文

李飞飞表示,了解世界如何运作是人工智能的下一步

 经济学人: 大 语言中充满了 格言。眼见为实。一图胜千言。眼不见,心不烦。这样的例子不胜枚举。这是因为我们人类从视觉中获得了很多意义。但视觉上的视觉并不普遍是可能的。 直到大约 5.4 亿年前,所有生物都生活在水面以下,它们都看不见。 直到三叶虫的出现,动物才第一次出现类似的阳光。 随后发生的事情令人惊叹。接下来的1000万到1500万年里,视觉的能力开启了一个被称为寒武纪生命大爆发的时期,大多数现代动物的先祖都出现在这个时期。 今天,我们正在经历人工智能(AI )的现代寒武纪大爆发 。似乎每周都会出现一种新的、令人难以置信的工具。最初,生成式 人工智能革命是由大型语言模型(如聊天) GPT) 推动的 ,这些模型模仿了人类的视觉智能。但我相信基于智能(我称之为空间语言智能)更为根本。语言很重要,但作为人类,我们理解和与世界互动的能力很大提示取决于我们所看到的东西。 计算机视觉是人工智能 的一个分支, 长期以来,它一直致力于让计算机拥有与人类相同甚至更好的智能空间。15年来,该领域发展迅速。我确信人工智能的 发展 必须以人类利益为中心,因此我将自己的职业生涯奉献给了人工智能。 没有人教孩子们如何看。孩子们通过经验和例子来理解世界。他们的眼睛就像生物相机,每秒拍摄五次“照片”。到三岁时,孩子们已经看过数亿张这样的照片了。 我们从近几年的研究中得知,视觉的一个基本要素是物体识别,所以我们开始教计算机这种能力。这并不容易。有无数种方法可以将猫的三维( 3D )形状渲染成两个维( 2D )图像,具体取决于视角、姿势、背景等。计算机要识别图片中的猫,它需要掌握大量 信息,就像孩子一样。 直到2000年代,不同元素汇聚在一起,才实现了这一目标。 当时,已经存在了几十年的多层神经算法与现代图形处理单元( GPU )的强大功能和“大数据”的可用性(来自互联网、数码相机等的存储亿张图像)相结合。 我的实验室为这种融合贡献了“大数据”元素。2007年,在一个叫ImageNet的项目中,我们创建了一个包含1500万张带标签图像的数据库,涵盖22,000个对象类别。然后,我们和其他研究人员使用图像对应的文本标签训练神经网络模型,模型学会使用简单的描述一张以前从未见过的照片。这些使用 ImageNet数据库创建的图像识别系统取得了迅速的进展,有助于引发现代 人工智能的 热潮。 随着技...

特朗普对 AI 和加密货币的支持会如何 “引爆” 清洁能源 - WSJ

  一个大型数据中心的耗电量与一座中等城市相当。天然气和可再生能源将担当新增发电量的主力。 数据中心给电网带来了非同寻常的压力,全天候都需要消耗大量能源,而且会出现短时电力需求突增。一个新一代大型数据中心的耗电量与一座中等城市的耗电量相当。 “我们已经没有足够的电力来满足这些服务器集群的需求,无论是 AI 还是加密货币,” 北达科他州共和党参议员凯文 · 克拉默 (Kevin Cramer) 说。他曾与特朗普及其顾问讨论过能源战略。 克拉默说,这就是为什么美国需要尽可能多地利用包括可再生能源和化石燃料在内的各种能源发电。他支持前北达科他州州长、共和党人道格 · 伯古姆 (Doug Burgum),后者已被特朗普提名为内政部长,预计将领导白宫国家能源委员会。 投资者正纷纷买入电力公司的股票,押宝数据中心不断增长的需求以及全方位能源战略。一只追踪大型公用事业公司的 ETF 今年累计上涨 20% 以上,这是该基金过去 10 年来第二次取得如此大的涨幅。 公用事业公司高管表示,天然气和可再生能源将继续担当新增发电量的主力。大量等待并网的太阳能和风能项目可能是提高电力供应最快的方式。一些科技巨头正在考虑新建核电站,但核电站的建设需要 10 年甚至更长时间。 可再生能源开发商 Intersect Power 首席执行官谢尔登 · 金伯 (Sheldon Kimber) 说:“可再生能源已准备就绪,能够立即提供其他任何能源都无法提供的东西,而且这种增长将是爆炸性的。” Intersect 最近宣布将与谷歌 (Google) 和投资公司 TPG 合作,为数据中心开发可再生能源和电池储能项目。这些公司的目标是到 2030 年投资 200 亿美元。 包括谷歌和 微软  (Microsoft) 在内的致力于 AI 发展的科技巨头已做出雄心勃勃的减排承诺,正投入巨资开发核能和地热能等零碳能源。 初创公司 Crusoe 首席执行官蔡斯 · 洛克米勒 (Chase Lochmiller) 说:“目前出现的需求激增真的会推动和促进许多清洁能源技术的发展。”该公司的目标是用清洁能源为数据中心和 AI 基础设施供电。Crusoe 最近从彼得 · 蒂尔 (Peter Thiel) 的 Founders Fund、 英伟达  (Nvidia)和富达 (Fidelity) 等投...

中国 AI 公司另辟蹊径快速追赶美国同行 - WSJ

尽管中国购买先进制程的芯片面临种种限制,但开发者们已经找到了变通途径。有迹象表明,中国初创企业追赶美国领先的 AI 模型的速度要比业内许多人预期的更快。 DeepSeek 是一家由中国最成功的对冲基金公司之一投资的初创公司,该公司在 11 月发布了最新大语言模型的预览版。该公司当时表示,该程序的能力优于 OpenAI 的推理模型 “o1”,后者于 9 月以预览版的形式发布。 近几周,其他中国公司也作出了类似的表态。由中国互联网巨头阿里巴巴 (Alibaba) 和腾讯 (Tencent) 支持的初创公司月之暗面 (Moonshot AI) 表示,该公司开发了一种专门研究数学的模型,其能力接近“o1”,与此同时,阿里巴巴表示,自己的一个实验性研究模型在数学方面优于 o1 模型的预览版。 这些公司尚未发表描述其模型的论文,而且由于目前还没有一个公认的 AI 模型能力测试标准,因此很难评估这些说法。尽管如此,一些美国专家表示,他们对此印象深刻。 “中国正在加速追赶,”OpenAI 前研究员、如今的 AI 创业者安德鲁 · 卡尔 (Andrew Carr) 说。他说,试图复制 OpenAI 推理模型的 DeepSeek 研究人员“在几个月内就搞定了,坦率地说,我的许多同事对此感到惊讶”。 其中一项用于比较的测试是美国数学邀请赛 (American Invitational Mathematics Examination, 简称 AIME),该竞赛是为最聪明的高中学生举办的数学挑战赛。 DeepSeek 表示,其模型在 AIME 测试中胜过了 OpenAI 的模型。《华尔街日报》(The Wall Street Journal)利用今年 AIME 的 15 道题进行的一项实验发现,OpenAI 的 “o1” 预览版模型得出答案的速度比 DeepSeek、月之暗面和阿里巴巴的实验模型更快。例如,一个假设的双人博弈问题需要用到策略来解字谜,OpenAI 的程序在 10 秒内给出了答案,而 DeepSeek 花了 2 分多钟。 在第一次尝试时就得到正确答案仍然非常了不起,因为文字题常常难倒 AI 程序。 自 2022 年以来,中国 AI 开发者面临美国对其获得全球最先进制程 AI 芯片的限制,包括来自芯片领导者 英伟达   (Nvidia) 的芯片。拜登 (Biden) 政府...