跳至主要内容

疯狂的幻方:一家隐形AI巨头的大模型之路



暗涌Waves

 |于丽丽



在蜂拥而至的大模型团战中,幻方大概是最异类的一个。

这是一场注定是少数人的游戏,很多创业公司在大厂入局后开始调整方向甚至萌生退意,而这家量化基金却孤绝前行。

5月,幻方把下场做大模型的独立新组织,命名为“深度求索”,并强调将专注于做真正人类级别的人工智能。他们的目标,不只是复刻ChatGPT,还要去研究和揭秘通用人工智能(AGI)的更多未知之谜。

不仅如此,在这个被认为格外依赖稀缺人才的赛道,幻方还试图去集结一批有执念的人,并祭出了他们认为的最大武器:一群人的好奇心。

在量化领域,幻方是一家抵达过千亿规模的“顶级基金”,但它被这波AI新浪潮集中关注到,其实还颇具戏剧性。

当国内云厂商高性能GPU芯片缺货成为限制中国生成式AI诞生的最直接因素时,据《财经十一人》报道,国内拥有超过1万枚GPU的企业不超过5家。而除几家头部大厂外,还包括一家名为幻方的量化基金公司。通常认为,1万枚英伟达A100芯片是做自训大模型的算力门槛。

其实,这家很少被置于人工智能视野打量的公司,早已是一家隐秘的AI巨头:2019年,幻方量化成立AI公司,其自研的深度学习训练平台“萤火一号”总投资近2亿元,搭载了1100块GPU;两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。

这意味着,单从算力看,幻方甚至比很多大厂都更早拿到了做ChatGPT的入场券。

只是大模型对算力、算法和数据都有强依赖,所以起步就需要5000万美金,训练一次需要上千万美金,非百亿美金公司其实很难持续跟进。各种艰难之下,幻方却很乐观,创始人梁文锋告诉我们:“关键是我们想做这件事,能做这件事,那我们就是最合适的人选之一。”

这种谜之乐观,首先来自幻方的独特成长路径。

量化投资是一个源自美国的舶来品,这使得几乎所有中国的头部量化基金创始班底,都或多或少有过美国或欧洲对冲基金的履历。唯独幻方是一个例外:它完全是本土班底起家,独自摸索着长大。

2021年,成立仅六年的幻方,抵达千亿规模,并被称为“量化四大天王”之一。

以局外人杀入的成长路径,让幻方始终像一个搅局者。多位行业人士向我们表示,幻方“无论研发体系、产品还是销售,都始终在用一种崭新的方式,切入到这个行业中来。”

一家头部量化基金创始人认为,这些年的幻方,始终“没有按照某种约定成俗的道路在走”,而是“按照他们想要的方式 ” ,即便是有点离经叛道或者争议,“也敢大大方方说出来 ,然后按照自己的想法去做”。

关于幻方的成长奥秘,幻方内部将之归结为“选用了一批没有经验但有潜能的人,以及有一个可以让创新发生的组织架构和企业文化”,他们认为这也将是大模型创业公司可以与大厂竞争的秘密所在。

而更关键的秘密,或许来自幻方的创始人梁文锋。

还在浙江大学攻读人工智能时,梁文锋就无比笃信“人工智能一定会改变世界”,而2008年,这还是一个不被认同的执念。

毕业后,他没有像周围人一样去大厂做个程序员,而是躲在成都的廉价出租屋里,不停接受进入诸多场景中尝试的挫败,最终切入了最复杂场景之一的金融,并成立了幻方。

一个有趣的细节是,在最早几年,曾有个同样疯癫的、在深圳城中村做着“不靠谱”飞行器的朋友拉他入伙。后来这个朋友做成了一个千亿美金的公司,名叫:大疆。

也因此,在做大模型必然涉及的钱、人、算力等话题外,我们还和幻方创始人梁文锋特别聊了聊,怎样的组织架构可以让创新发生,以及人的疯狂可以持续多久。

创业十余年,这是这位鲜少露面的“技术宅”型创始人第一次公开受访。

巧合的是,4月11日,幻方在发布做大模型公告时,也引用了法国新浪潮导演特吕弗曾告诫青年导演的一句话:“务必要疯狂地怀抱雄心,且还要疯狂地真诚。”

以下为对话:

做研究,做探索

>“做最重要、最困难的事”

「暗涌」:前不久,幻方发公告决定下场做大模型,一家量化基金为什么要做这样一件事?
梁文锋:我们做大模型,其实跟量化和金融都没有直接关系。我们独建了一个名为深度求索的新公司来做这件事。
幻方的主要班底里,很多人是做人工智能的。当时我们尝试了很多场景,最终切入了足够复杂的金融,而通用人工智能可能是下一个最难的事之一,所以对我们来说,这是一个怎么做的问题,而不是为什么做的问题。

「暗涌」:你们要自训一个大模型,还是某个垂直行业——比如金融相关的大模型?
梁文锋:我们要做的是通用人工智能,也就是AGI。语言大模型可能是通往AGI的必经之路,并且初步具备了AGI的特征,所以我们会从这里开始,后边也会有视觉等。

「暗涌」:因为大厂的入局,很多创业型公司都放弃了只做通用型大模型的大方向。
梁文锋:我们不会过早设计基于模型的一些应用,会专注在大模型上。

「暗涌」:很多人认为,创业公司在大厂形成共识后下场,已经不是一个好的时间点。
梁文锋:现在看起来,无论大厂,还是创业公司,都很难在短时间内建立起碾压对手的技术优势。因为有OpenAI指路,又都基于公开论文和代码,最晚明年,大厂和创业公司都会把自己的大语言模型做出来。
大厂和创业公司都各有机会。现有垂类场景不掌握在初创公司手上,这个阶段对初创公司不太友好。但因为这种场景说到底也是分散的、碎片化的小需求,所以它又是更适合灵活的创业型组织的。从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。
我们的目标也很明确,就是不做垂类和应用,而是做研究,做探索。

「暗涌」:为什么你的定义是“做研究、做探索”?
梁文锋:一种好奇心驱动。从远处说,我们想去验证一些猜想。比如我们理解人类智能本质可能就是语言,人的思维可能就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。
从近处说,GPT4还有很多待解之谜。我们去复刻的同时,也会做研究揭秘。

「暗涌」:但研究意味着要付出更大的成本。
梁文锋:只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。

「暗涌」:那研究经费哪里来?
梁文锋:幻方作为我们的出资人之一,有充足的研发预算,另外每年有几个亿的捐款预算,之前都是给公益机构,如果需要,也可以做些调整。

「暗涌」:但做基础层大模型,没有两三亿美元,连牌桌都上不了,我们如何支撑它的持续投入?
梁文锋:我们也在找不同出资方在谈。接触下来,感觉很多VC对做研究有顾虑,他们有退出需求,希望尽快做出产品商业化,而按照我们优先做研究的思路,很难从VC那里获得融资。但我们有算力和一个工程师团队,相当于有了一半筹码。

「暗涌」:我们对商业模式做了哪些推演和设想?
梁文锋:我们现在想的是,后边可以把我们的训练结果大部分公开共享,这样可以跟商业化有所结合。我们希望更多人,哪怕一个小 app都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断。

「暗涌」:一些大厂后期也会有一些服务提供,你们差异化的部分是什么?
梁文锋:大厂的模型,可能会和他们的平台或生态捆绑,而我们是完全自由的。

「暗涌」:无论如何,一个商业公司去做一种无限投入的研究性探索,都有些疯狂。
梁文锋:如果一定要找一个商业上的理由,它可能是找不到的,因为划不来。
从商业角度来讲,基础研究就是投入回报比很低的。OpenAI早期投资人投钱时,想的一定不是我要拿回多少回报,而是真的想做这个事。
我们现在比较确定的是,既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。

万卡储备与它的代价

>“一件激动人心的事,或许不能单纯用钱衡量。”

「暗涌」:GPU是这次ChatGPT创业潮的稀缺品,你们在2021年就可以有先见之明,储备了1万枚。为什么?
梁文锋:其实从最早的1张卡,到2015年的100张卡、2019年的1000张卡,再到一万张,这个过程是逐步发生的。几百张卡之前,我们托管在IDC,规模再变大时,托管就没法满足要求了,就开始自建机房。
很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动。

「暗涌」:什么样的好奇心?
梁文锋:对 AI 能力边界的好奇。对很多行外人来说,ChatGPT 这波浪潮冲击特别大;但对行内人来说,2012年 AlexNet 带来的冲击已经引领一个新的时代。AlexNet 的错误率远低于当时其他模型,复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的,特别是当 2020 年 OpenAI 发布 GPT3 后,方向很清楚,需要大量算力;但即便 2021 年,我们投入建设萤火二号时,大部分人还是无法理解。

「暗涌」:所以2012年起,你们就开始关注到算力的储备?
梁文锋:对研究员来说,对算力的渴求是永无止境的。做了小规模实验后,总想做更大规模的实验。那之后,我们也会有意识地去部署尽可能多的算力。

「暗涌」:很多人以为搭这个计算机集群,是量化私募业务会用到机器学习做价格预测?
梁文锋:如果单纯只做量化投资,很少的卡也能达到目的。我们在投资外做了大量研究,更想搞清楚什么样的范式可以完整地描述整个金融市场,有没有更简洁的表达方式,不同范式能力边界在哪,这些范式是不是有更广泛适用,等等。

「暗涌」:但这个过程也是一个烧钱行为。
梁文锋:一件激动人心的事,或许不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。

「暗涌」:显卡通常会以20%的速度在折损。
梁文锋:我们没有精确计算过,但应该没这么多。英伟达的显卡是硬通货,即使是很多年前的老卡,也还有很多人在用。我们之前退役的老卡,二手处理时还挺值钱的,没亏太多。

「暗涌」:搭一个计算机集群,维护费用,人工成本,甚至电费也都是不菲的支出。
梁文锋:电费和维护费用其实是很低的,这些支出每年只占硬件造价的1%左右。人工成本不低,但人工成本也是对未来的投资,是公司最大的资产。我们选的人也会相对朴实一点,有好奇心,来这里有机会去做研究。

「暗涌」:2021年,幻方是亚太地区第一批拿到A100显卡的公司,为什么会比一些云厂商更早?
梁文锋:我们很早就对新卡做了预研、测试和规划。至于一些云厂商,据我所知,他们之前的需求都是分散的,直到2022年自动驾驶,有租用机器做训练的需求,又有付费能力,一些云厂商才去把基础设施建好。大厂很难单纯去做研究,做训练,它更多会是业务需求驱动。

「暗涌」:你会如何看大模型的竞争格局?
梁文锋:大厂肯定有优势,但如果不能很快应用,大厂也不一定能持续坚持,因为它更需要看到结果。
头部的创业公司也有技术做得很扎实的,但和老的一波AI创业公司一样,都要面对商业化难题。

「暗涌」:一些人会觉得一个量化基金却强调自己做AI,是为其他业务吹泡泡。
梁文锋:但其实我们的量化基金已经基本不怎么对外募集了。

「暗涌」:你会如何去辨别哪些是AI信仰者,哪些是投机者?
梁文锋:信仰者会之前就在这里,之后也在这里。他们更会去批量买卡,或者跟云厂商签长协议,而不是短期去租。


如何让创新真正发生

> “创新往往都是自己产生的,不是刻意安排的,更不是教出来的”

「暗涌」:深度求索团队的招聘进展如何?
梁文锋:初始团队已经集结到位,前期因为人手不够,会从幻方临时借调一部分人过去。去年底ChatGPT3.5风靡时,我们就开始动手招聘了,不过我们依然需要更多的人加入。

「暗涌」:大模型创业的人才也是稀缺的,有投资人说很多适合的人才可能只在OpenAI、FacebookAI Research 等巨头的AI lab里。你们会去海外挖这类人才吗?
梁文锋:如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。从这个角度看,国内合适的候选人就不少。

「暗涌」:为什么经验没那么重要?
梁文锋:不一定是做过这件事的人才能做这件事。幻方招人有条原则是,看能力,而不是看经验。我们的核心技术岗位,基本以应届和毕业一两年的人为主。

「暗涌」:在创新业务上,你觉得经验是阻碍吗?
梁文锋:做一件事,有经验的人会不假思索告诉你,应该这样做,但没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。

「暗涌」:幻方从一个完全无金融基因的外行,切入到这个行业,几年内做到头部,这条招人法则是其中秘密之一吗?
梁文锋:我们的核心团队,连我自己,一开始都没有量化经验,这一点很特殊。不能说是成功的秘密,但这是幻方的文化之一。我们不会故意回避有经验的人,但更多是看能力。
拿销售这个岗位举个例子。我们的两个主力销售,都是这个行业的素人。一个原来做德国机械品类外贸的,一个是原来在券商做后台写代码。他们进入这个行业时,没有经验,没有资源,没有积累。
而现在我们可能是唯一一家能以直销为主的大私募。做直销意味着不用给中间商分费用,同样规模和业绩下,利润率更高,很多家会试图模仿我们,但并没有成功。

「暗涌」:为什么很多家试图模仿你们,却没有成功?
梁文锋:因为仅凭这一点不足以让创新发生。它需要和公司的文化和管理相匹配。
事实上,第一年他们什么都做不出来,第二年才开始有点成绩。但我们的考核标准和一般公司不太一样。我们没有 KPI,也没有所谓的任务。

「暗涌」:那你们的考核标准是?
梁文锋:我们不像一般公司,看重客户下单量,我们的销售卖多少和提成不是一开始就算好的,而会更鼓励销售去发展自己的圈子,认识更多人,产生更大影响力。
因为我们认为,一个让客户信任的正直的销售,可能在短时间内做不到让客户来下单,但可以让你觉得他是个靠谱的人。

「暗涌」:选来合适的人后,用何种方式让他进入状态?
梁文锋:交给他重要的事,并且不干预他。让他自己想办法,自己发挥。
其实,一家公司的基因是很难被模仿的。比如说招没有经验的人,怎么判断他的潜力,招进来之后如何才能让他成长,这些都没法直接模仿。

「暗涌」:你觉得什么是打造一个创新型组织的必要条件?
梁文锋:我们的总结是,创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。

「暗涌」:这是一种非常规的管理方式,这种情况下你如何确保一个人做事是有效率的,而且在你要的方向上?
梁文锋:招人时确保价值观一致,然后通过企业文化来确保步调一致。当然,我们并没有一个成文的企业文化,因为所有成文东西,又会阻碍创新。更多时候,是管理者的以身示范,遇到一件事,你如何做决策,会成为一种准则。

「暗涌」:你觉得这波做大模型的竞争中,创业公司更适合创新的组织架构会是和大厂竞争的破局点吗?
梁文锋:按照教科书的方法论来推导创业公司,在当下,他们做的事,都是活不下来的。
但市场是变化的。真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。
很多大公司的组织结构已经不能快速响应和快速做事,而且他们很容易让之前的经验和惯性成为束缚,而这波AI新浪潮之下,一定会有一批新公司诞生。


真正的疯狂

> “创新就是昂贵且低效的,有时候伴随着浪费。”

「暗涌」:做这样一件事,最让你们兴奋的是什么?

梁文锋:去搞清我们的猜想是不是事实,如果是对的,就会很兴奋了。


暗涌」:这次大模型招人,什么是我们必卡的条件?

梁文锋:热爱,扎实的基础能力。其他都没那么重要。


暗涌」:这种人容易找到吗?

梁文锋:他们的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。


「暗涌」:大模型可能是一件无休止投入的事,付出的代价会让你们顾虑吗?

梁文锋:创新就是昂贵且低效的,有时候伴随着浪费。所以经济发展到一定程度之后,才能够出现创新。很穷的时候,或者不是创新驱动的行业,成本和效率非常关键。看OpenAI也是烧了很多钱才出来。


「暗涌」:会觉得你们在做一件很疯狂的事吗?

梁文锋:不知道是不是疯狂,但这个世界存在很多无法用逻辑解释的事,就像很多程序员,也是开源社区的疯狂贡献者,一天很累了,还要去贡献代码。


「暗涌」:这里边会有一种精神奖赏。

梁文锋:类似你徒步50公里,整个身体是瘫掉的,但精神很满足。


「暗涌」:你觉得好奇心驱动的疯狂可以一直持续下去吗?

梁文锋:不是所有人都能疯狂一辈子,但大部分人,在他年轻的那些年,可以完全没有功利目的,投入地去做一件事。

评论

此博客中的热门博文

付鹏11月24日在HSBC内部演讲速记

《2024年年终回顾和2025年展望——对冲风险VS软着陆》   上篇 正值年底,虽然刚才汇丰一直强调大家不录音不录像,但大概率你挡不住。我在这儿讲话会谨慎一些,非常小心谨慎,大概率会有人透露出去,放到YouTube上,基本上所有见我都说付总我在YouTube上看过你的视频,我说那都是盗版的,靠盗版发财的也不少。 今天和大家分享的内容基本上都是官方的,回顾会多一点,展望不多,因为这个月展望完了之后下个月怎么办?有些话对我来讲我倒觉得很简单,本质上原来我们是做Hedge Fund出身,所以我们的逻辑框架整体具有极强的延续性,不是说今年去讨论,或者说明年去讨论。 惯性思维从2016年开始,我一直在跟大家强调这个世界已经完全不一样了。当然经历过过去的几年时间,我相信在座各位应该对这番话的理解变得越发深刻。 2016年实际上是美国特朗普的第一次大选,我有一个特点,我的特征是如果我觉得什么地方有投资机会,我可能第一时间去一线调研,我不喜欢看YouTube,我也不喜欢在网上扒。当然你会说,现在ChatGPT很强大了,人工智能好像能帮你解决很多问题,但你们有没有想过,可能广泛流传或者广泛传播的很多信息是错的。这一点在2012年当时我从日本做完调研回来之后,我的感悟是最深的。 当然去日本有一个重要的人物,名字叫本森特,很快大家就会非常熟悉他的,目前来讲应该是特朗普政府提名的美国财长。本森特原来是索罗斯基金实际掌控人,因为索大爷已经年龄很大了,去年的时候才刚刚把基金的业务交给他儿子亚历山大,但在这之前,最主要的几场战役本质上来讲都是本森特在主导。 2012年当时我从北京去香港约朋友们吃饭的饭局上,当时斯索罗斯基金在香港办公室跟我说,本森特从这儿去了日本。我说OK。我经常说一句话“站在巨人的肩膀上看问题。” 当然你知道,网民们最可怕的地方是巴菲特“SB”、索罗斯“SB”,我最“牛逼”。你要记住,他们的所有行为一定有很大的变化,很多人可能都不知道,巴菲特第一次去是2011年,我们正在讲福岛核电站泄漏,核废水污染以后海鲜不能吃的时候,一个80多岁的老头顶着核辐射泄漏去日本吃海鲜了,当然他去日本干吗,这其实很关键。 之后我们跑到日本做完调研回来之后那几年,我陆陆续续跟很多人讲,日本正在发生变化,日本的利率结构都会随之变化的,当然包括日本的证券市场。今年日本股市终于走出这35年了,创下...

中国 AI 初创公司 DeepSeek 是如何与硅谷巨头竞争的

纽约时报: DeepSeek 的工程师说,他们的系统只需要约 2000 块美国芯片制造商英伟达生产的专用计算机芯片,而美国大公司的 AI 系统需要多达 1.6 万块芯片。 Marlena Sloss/Bloomberg 圣诞节的第二天,一家名为深度求索 (DeepSeek) 的中国小型初创公司发布了一个新的人工智能系统,其功能可与 OpenAI 和谷歌等公司的尖端聊天机器人相媲美。 能做到这点本已是一个里程碑。但这个名为 DeepSeek-V3 的大模型背后的团队描述了一个更大的进步。深度求索的工程师在介绍他们如何构建这个大模型的 研究论文 中写道,他们在训练该系统时只用了领先人工智能公司用的高度专业化计算机芯片的一小部分。 这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片(如硅谷公司英伟达生产的那些)进行限制。 但 DeepSeek 大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。 据美国人工智能公司一直使用的行业基准测试,DeepSeek 聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。 而且它的造价很低,挑战了只有最大的科技企业(它们全都在美国)才能制造出最先进的人工智能系统的普遍观念。中国工程师称,他们只花了约 600 万美元的原始计算能力就训练了新模型,不到科技巨头 Meta 训练其最新人工智能模型所耗资金的十分之一。 “有 600 万美元资金的公司在数量上远远多于有 1 亿美元或 10 亿美元资金的公司,” 风险投资公司 Page One Ventures 的投资人克里斯 · 尼科尔森说道,他主要投资人工智能技术。 自从 OpenAI 2022 年发布了 ChatGPT,引发人工智能热潮以来,许多专家和投资者曾得出结论认为,如果不投入数亿美元购买人工智能专用芯片的话,没有公司能与行业领军者竞争。 世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达 1.6 万个芯片,甚至更多。但 DeepSeek 的工程师却说,他们只用了约 2000 个英伟达生产的专用芯片。 中国进口芯片受到限制,迫使 DeepSe...

关于完善药品价格形成机制的意见

 关于完善药品价格形成机制的意见 (征求意见稿) 党的十八大以来,以市场为主导的药品价格机制改革持续深化,以药品集中带量采购、医保目录谈判为切入口的医保基金战略性购买持续发力,增进市场公平竞争,有力引导药品价格趋于合理,有效推动医药领域发展活力进发,有序促进医药行业发展方式转变。为更好发挥市场机制作用,支持医药高质量创新发展,规范药品价格秩序,现就完善药品价格形成机制提出如下意见。 一、总体要求 以习近平新时代中国特色社会主义思想为指导,着力构建药品领域全国统一大市场,创造更加公平、更有活力的市场环境,健全完善以市场为主导、以临床价值为导向、以有效竞争为基础的药品价格形成机制,引导医保药品价格运行在合理区间,规范非医保药品自主定价,大力支持高质量创新药发展,充分发挥医保基金战略性购买作用,更好发挥商业健康保险多元支付功能,推进药品价格秩序治理,实现有效市场和有为政府更好结合,保障人民群众获得质优价宜药品。到2027年、药品价格形成机制成熟定型,推动医药行业高质量发展取得新成效。 二、发挥市场决定性作用,支持创新药高质量发展 (-)设立创新药产业招资基金。鼓励商业保险公司设立创新药产业投资基金,或明确现有投资基金对创新药产业进行重点投资,发挥保险资金期限长、稳定性优势,减低创新药产业融资成本,支持医药创新发展。涉创新药权益类投资规模达到上季度末总资产5%的,视为创新支持型商业保险公司,可获得税收政策优惠、大病保险承办、城市定制型商业健康保险合作、探索允许职工医保个人账户购买其覆盖高水平创新药的保险产品等支持政策,并在有关商保产品结算支付一站式清分、医保商保同步结算、医保商保数据共享等方面给子支持。完善商业保险权益投资监管制度,督促指 导商业保险公司优化长周期考核评估机制,为创新药高质量发展提供稳定的长期投资。 (二)优化新上市药品首发挂网服务和价格机制。试行以药学和临床价值为基础的新上市药品自评制度,医药企业实事求是做好自评和自主定价,公开接受社会监督和同行评议。做好首发挂网服务,支持创新药加快进入临床。综合自评结果和临床获益因素,分层次落实价格政策,积极支持满足临床急需的高水平创新药在上市初期获得与高投入、高风险相符的收益回报,在一定期限内保持价格相对稳定;鼓励引导改良进步药品价格体现与临床获益相称的价值;规范引导其他新上市药品和仿制药参考同通用名药品、同作...

图解美国对华及对全球其他国家关税政策影响-wsj

候任总统特朗普 (Donald Trump) 在他的第一个任期内把对华加征关税搞成了他的标志性政策。之后上台的总统拜登 (Joe Biden) 基本上保留了这些关税,并指示提高对半导体和电动汽车等产品的关税。 根据 Trade Partnership Worldwide 对截至 9 月份的美国人口普查局 (U.S. Census Bureau) 数据的分析,自特朗普在 2018 年开始对中国上调关税以来,从中国进口的商品的平均实际关税税率已从约 3% 跃升至约 11%。为商业团体提供数据和研究的 TPW 表示,美国从所有国家进口商品的平均实际关税税率已从逾 1% 升至逾 2%。 现在,特朗普准备再次加大对中国和其他贸易伙伴的压力,他最近提议对所有来自中国的产品加征 10% 的关税,对来自墨西哥和加拿大的进口商品加征 25% 的关税。这可能会颠覆他在 2020 年签署的《美墨加协定》(USMCA),该协定在很大程度上维持了这三个北美国家之间的免税贸易。 在关税提高的情况下,中国商品在美国进口中所占份额已经下降,而全球其他国家在美国进口中所占份额有所上升。尽管如此,中国仍是美国的第二大商品供应国。 关税是对跨境商品征收的税。在适用关税的时候,美国进口商通常在外国商品抵达入境口岸时缴纳关税,这一过程由美国海关边境保护局 (U.S. Customs and Border Protection) 负责。美国主要将关税作为保护某些行业的工具,以及对其他国家贸易壁垒的回应手段。关税也是美国政府的一个收入来源。 特朗普过渡团队发言人 Brian Hughes 表示:“特朗普总统已承诺实施关税政策,保护美国制造商和劳动者免受外国公司和外国市场不公平做法的伤害。” 拜登在上周敦促特朗普重新考虑对墨西哥和加拿大征收关税的威胁,警告称这可能会损害美国与这两个最亲密盟友的关系。白宫没有回应置评请求。 平均实际关税税率的计算方法是用关税收入占进口商品价值的百分比来衡量。例如,2023 年美国从印度购买了价值约 840 亿美元的商品,进口商为这些商品支付了约 20 亿美元的关税,鉴于此,来自印度的进口商品的平均实际关税税率约为 2.4%。 经济学家使用这一指标来衡量关税如何应用于大类商品或原产国,并根据进口价值和关税税率的构成进行加权。 即使关税政策没有改变,随着进口商品结构的变化,这一税率也会...

揭秘DeepSeek:一个更极致的中国技术理想主义故事

  做贡献者,而非搭便车者。 文 | 于丽丽 编辑 | 刘旌 中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。 一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。 在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。 DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。 弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。 这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA( 一种新的多头潜在注意力机制 )架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。 在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。” 在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。 多位行业人士告诉我们, 这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。 一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。” 而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见: 美国更擅长从0-1的技...

如何从中国走线(润到)美国

经济学人: 他们来美国的原因各不相同。有些人寻求经济机会。其他人则对统治感到失望。许多人在网上看到其他中国移民穿越哥伦比亚和巴拿马之间无法无天的丛林地带,寻求更好的生活。数以万计的中国公民前往南美,这是前往美国的危险旅程的第一步。这条路线非常受欢迎,以至于它获得了一个中文昵称:走线,即走线。 过去两年,中国移民一直是穿越美国南部边境增长最快的群体。2023 年,美国边境巡逻队遇到了 3.7 万多名中国移民,高于 2022 年的 3,813 人和 2021 年的 689 人。今年前八个月又有 2.1 万人入境。他们仍然只是 2023 年试图越境的 200 万移民中的一小部分。但由于美国和中国陷入了经济、意识形态和地缘战略竞争,中国移民已成为政治焦点。 唐纳德·特朗普说,来自中国的新移民大多是适龄参军的男性。“他们是想在我们国家组建一支小军队吗?”他问道。其他共和党政客称中国移民是潜在的间谍。卡马拉·哈里斯和民主党人没有那么危言耸听,但他们也担心边境问题。在总统竞选中,移民是首要关注的问题,而中国是一个方便的反面人物,因此几乎没有人努力去了解是什么推动了这种人口流动,以及这对每个国家意味着什么。 《经济学人》花了三个月时间在哥伦比亚、墨西哥和美国进行报道。我们采访了数十名移民,以及走私者、边防警卫和专家。一些人允许我们追踪他们的移民旅程。一些人经过数周的乘船、乘公共汽车、步行和乘飞机的旅行才抵达美国。其他人则在途中失去了一切。大多数人被更美好未来的承诺所吸引,并遵循了试图利用美国不完善的移民制度的策略。但他们的旅程也揭示了中国的情况,压制性统治和日益恶化的经济萎靡不振正在将人们推向远离中国的道路。 第一部分 内科克利 对于许多中国移民来说,美洲的第一站是厄瓜多尔,直到最近,厄瓜多尔才向他们提供免签证入境。但他们很快就搬到了哥伦比亚。在那里,我们遇到了黄女士,一位 40 多岁、身穿亮粉色连衣裙的女性。她已经打破了出生地——中国西南部贵州省的一个贫穷村庄——的保守规范。村里大多数妇女终生务农和养育孩子。然而,黄女士离开家乡去了大城市,养育了两个孩子,并与嗜赌成性的丈夫离婚。她来到了加勒比海边缘的海滨小镇内科克利,即将进入哥伦比亚和巴拿马之间危险的达连峡丛林。 她两个 20 多岁的妹妹也来了。她们之前都没有离开过中国。黄女士说,她们对未来的危险知之甚少,但梦想着到达美国。自疫...

特朗普就职演讲中英文全文

谢谢,谢谢大家,非常感谢你们。非常非常感谢。副总统万斯,众议院议长约翰逊,参议员图恩,美国首席大法官罗伯茨,以及美国最高法院的大法官们。 克林顿总统、布什总统、奥巴马总统、拜登总统、哈里斯副总统,以及我的各位同胞, 美国的黄金时代从现在开始 。 从今天起,我们的国家将再次繁荣,并在全世界受到尊重。我们将成为每个国家的羡慕对象,不再让自己受到剥削。 在特朗普政府的每一天,我都会把美国放在第一位 。 我们的主权将被夺回。我们的安全将得到恢复。正义的天平将重新平衡。司法部和我们政府的恶劣、暴力和不公正的武器化将结束。 我们的首要任务是创造一个骄傲、繁荣和自由的国家。美国将很快变得更伟大、更强大,并且比以往任何时候都更加卓越。 我自信和乐观地回到总统职位上,我们正处于一个令人兴奋的新国家成功时代的开始。一股变革的浪潮正在席卷整个国家,阳光洒遍全世界,美国有机会前所未有地抓住这一机遇。 但是首先,我们必须诚实面对我们面临的挑战。虽然挑战很多,但它们将被美国当前所见证的这一伟大势头摧毁。 今天我们聚集在一起时,我们的政府正面临一场信任危机。多年来,一个激进且腐败的体制从我们的公民手中攫取权力和财富,而我们社会的支柱却破碎不堪,似乎完全失修。 我们现在的政府连国内的简单危机都无法应对,同时还在海外接二连三地陷入灾难性事件。 它未能保护我们辉煌、守法的美国公民,却为危险的罪犯提供庇护和保护,这些罪犯许多来自监狱和精神机构,他们非法进入我们的国家。我们有一个政府,无限制地资助外国边界的防御,却拒绝保护美国的边界,或者,更重要的是,保护自己的人民。 我们的国家在紧急情况下已经无法提供基本服务,这一点最近由北卡罗来纳州的优秀人民证明了。他们受到如此糟糕的对待。而其他几个州在几个月前发生飓风后仍在遭受痛苦。 或者更近的是洛杉矶,我们正在目睹大火仍在无情地燃烧。从几周前开始,它们毫无防备地横扫房屋和社区,甚至影响到我们国家一些最富有和最有权势的人,其中一些人现在就坐在这里。他们已经无家可归了。这很有趣。 但是我们不能让这种情况发生。每个人都无能为力。这将会改变。我们的公共卫生系统在灾难时无法提供帮助,却在其上花费了比世界上任何国家都要多的钱。 我们的教育系统则教导我们的孩子为自己感到羞愧,在许多情况下,教他们仇恨我们的国家,尽管我们试图如此绝望地向他们提供爱。所有这一切将从今天开始改变,而且...

抖音平台八种算法机制的底层逻辑,不要被算法操控,要了解算法的机制

抖音是算法机制最复杂的平台之一。平台内的每一条内容、每一个短视频,背后都是由算法支配的。同时,抖音算法还影响着我们短视频的制作和发布。这篇文章为大家总结了抖音平台的八种算法机制,助力大家做好运营工作。 抖音是算法机制最复杂的平台之一。平台内的每一条内容、每一个短视频,背后都是由算法支配的。同时,抖音算法还影响着我们短视频的制作和发布。 对于做抖音短视频的运营者来说,想要高效获取到流量,摸清抖音算法至关重要! 这篇文章为大家总结了抖音平台的八种算法机制,助力大家做好运营工作。 一、流量池算法机制 抖 音的流量池是一个庞大的内容分发网络 ,是通过一系列复杂的算法和机制,将不同的内容推荐给不同的用户群体。 具体来讲: ·   抖音系统会将创作者发布的视频,先投放在一个小范围数量的用户人群中; ·   根据短视频的点击量、播放量、完播率、互动率等数据进行评估; ·   根据短视频作品的表现数据,来决定系统是否会将短视频推荐给更大用户人群的流量池。 创作者发布的短视频都会享受到抖音官方提供的推荐流量,但流量推荐量的数据范围是不一定的,这就是流量池。 抖音流量池的推荐规则如下: 种子流量池 创作者上传完短视频,视频在经过审核之后会先进入到种子流量池中,此时的流量分发人数只有数百人。如果视频在种子流量池中有很好的完播率,那么接下来才会被推荐给更多人;如果各项数据未达到要求,则会减少推荐量。 多级流量池 抖音的流量池是分级的,每一级都有不同的用户规模和推荐要求。 种子流量池中的优质视频才会获得叠加推荐,此时会进入到更高一级的初级流量池中,能够获得好的完播率和互动量的视频会紧接着推荐到中级流量池。以此类推,再到高级流量池。 这种多级流量池的设计,让优质的短视频内容可以获得更多的曝光。 延后曝光 偶尔也会出现这样一种情况,视频发布后的几天或者几周内,数据效果都不是很好,但是某天就突然火了,这就是我们说的 “延后曝光”,是抖音系统考虑了时间效应后的展示效果。 可能是因为用户翻看之前的视频时,带动了视频的播放量,抖音重新将这条视频推荐到更大的流量池中,从而获得新的曝光。 对于创作者来说,想要突破抖音冷启动流量池,就需要密切关注下面几个指标: 二、标签算法机制 无论是创作者,还是用户,都会被抖音系统打上不同类型的标签。 · ...

华尔街日报:制药行业正在经历自己的 DeepSeek 时刻

  制药行业正在经历自己的 DeepSeek 时刻 不仅仅是人工智能——中国生物技术公司现在开发药物的速度比美国同行更快、成本更低 生物技术行业的 DeepSeek 时刻 到来于去年秋天。 那时 Summit Therapeutics  SMMT   -2.71  % 减少;红色向下三角形 亿万富翁鲍勃·杜根 (Bob Duggan ) 支持的   Summit 宣布, 其药物在肺癌头对头试验中优于 默克公司的重磅疗法 Keytruda。Keytruda 是每年收入 300 亿美元的免疫疗法巨头,是制药行业最畅销的药物,长期以来一直占据市场主导地位。因此,出现更强大的竞争对手的前景令人震惊。更引人注目的是:Summit 两年前刚刚从一家鲜为人知的中国生物技术公司 Akeso  9926获得了该药物的许可. 这一消息让 Summit 的市值增加了数十亿美元,尽管该公司尚未获得任何药物批准,但该公司却跃居生物技术行业的前列。尽管 Summit 的药物尚未获得美国监管机构的批准,但这一结果对整个行业来说都是一个分水岭,凸显了来自中国的竞争威胁。 中国在生物技术领域的崛起已历经多年,但现在已无法忽视。2020 年,在价值 5,000 万美元或以上的大型医药交易中,只有不到 5% 涉及中国。据 DealForma 称,到 2024 年,这一数字已飙升至近 30%。十年后,许多进入美国市场的药物将源自中国实验室。 中国生物科技的繁荣与其科技领域的崛起如出一辙。在这两种情况下,中国都已从制造业向价值链上游迈进,成为更先进的创新中心,在曾经由美国主导的行业中展开竞争。该行业的增长有几个原因。首先,过去十年来,许多在美国接受过培训的顶尖科学家回到了中国,推动了上海周边生物科技中心的兴起。正如 DeepSeek 打造出一款强大的聊天机器人一样——据称是在预算紧张、半导体资源有限的情况下——中国生物科技公司也更加拼命,利用技术娴熟、成本低廉、行动速度更快的劳动力。 此外,公司在中国开展临床试验的成本仅为在美国成本的一小部分,而中国监管体系的最新变化也简化并加快了开展研究的审批流程。  目前,中国生物技术创新大多是渐进式的,而非突破性的。许多公司专注于改进现有药物——调整化学成分、提高疗效或以关键方式使其与众不同。 但中国...

对美国繁荣的真正威胁

FT: 即便在动荡的当下,也很难想象未来会有什么天翻地覆的变化。但国家的命运确实会发生变化,而且变化往往十分剧烈。政治会带来后果。因此,我们应该创造性地思考这些后果可能是什么,以及我们可能会如何看待这些后果。 作为一名习惯于研究长期增长和停滞的经济学家,我可以想象自己在 2050 年评估美国历史(假设到那时我还活着,而且没有老糊涂)。当然,这个故事还有待讲述。但它可能会是这样的。 衰落来得 突然,出乎意料。20 世纪是美国的世纪,在 21 世纪的头几十年,美国看起来更加势不可挡。随着它在人工智能领域取得领先地位,其经济表现强劲,注定会超越仍在遭受 2007-09 年金融危机和 2020-22 年新冠疫情影响的西欧竞争对手。中国是一个更强大的对手,但许多评论家已经开始否认中国超越美国的可能性。2030 年代初,美国经济停止增长,甚至落后于欧洲,这让大多数人感到惊讶。 历史学家和记者一直在争论此后发生的事情。一些人关注唐纳德·特朗普第二任期的经济政策:对盟友征收关税,经过一番反复,引发了一场全球贸易战,损害了而不是帮助了美国制造业,并导致通胀飙升;进一步减税企业和高收入美国人,导致联邦债务从原本庞大的 36 万亿美元增加到 50 多万亿美元。 去年 1 月,唐纳德·特朗普在新罕布什尔州曼彻斯特的竞选集会上 © Mark Peterson/Redux/Eyevine 其他人则认为特朗普第二任期内出现的“政府科技联合体”才是真正的罪魁祸首。随着所有人工智能和加密货币监管法规的取消以及特朗普司法部宣布不会施加任何反垄断压力,科技行业进一步整合,少数几家大型企业开始主导整个行业。这不仅减缓了新的有用创新,还为 2030 年的科技大崩溃埋下了祸根,当时数万亿美元从经济中蒸发,因为很明显,对人工智能的大部分巨额投资都没有得到回报。 另一派则认为,腐败始于第 46 任总统乔·拜登,在他的领导下,通货膨胀飙升,联邦债务激增,监管变得更加政治化,对企业造成压制——尽管特朗普做出了承诺,但他从未扭转这一局面。相反,由特朗普盟友埃隆·马斯克管理的新成立的政府效率部 (Doge) 专注于解雇和恐吓同情上一届政府的公务员。这对改善商业环境或竞争力没有多大帮助,反而进一步削弱了对腐败的监督。 美国世纪的一个基本支柱是该国能够以有利于自身经济(包括金融和科技产业)的方式塑造世界秩序。但美国退出巴黎协...