跳至主要内容

揭秘DeepSeek:一个更极致的中国技术理想主义故事

 

做贡献者,而非搭便车者。

文 | 于丽丽
编辑 | 刘旌

中国的7家大模型创业公司中,DeepSeek(深度求索)最不声不响,但它又总能以出其不意的方式被人记住。

一年前,这种出其不意源自它背后的量化私募巨头幻方,是大厂外唯一一家储备万张A100芯片的公司,一年后,则来自它才是引发中国大模型价格战的源头。

在被AI连续轰炸的5月,DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型,提供了一种史无前例的性价比:推理成本被降到每百万token仅 1块钱,约等于Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。

DeepSeek被迅速冠以“AI界拼多多”之称的同时,字节、腾讯、百度、阿里等大厂也按耐不住,纷纷降价。中国大模型价格战由此一触即发。

弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。

这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结构,也把计算量降到极致,所有这些最终促成了成本的下降。

在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。”

在基本由硅谷牵动故事进展的AI浪潮里,这是罕有的情形。多位行业人士告诉我们,这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。一位AI研究者表示,Attention架构提出多年来,几乎未被成功改过,更遑论大规模验证。“这甚至是一个做决策时就会被掐断的念头,因为大部分人都缺乏信心。”

而另一方面,国产大模型之前很少涉足架构层面的创新,也是因为很少有人主动去击破那样一种成见:美国更擅长从0-1的技术创新,而中国更擅长从1-10的应用创新。何况这种行为非常不划算——新一代模型,过几个月自然有人做出来,中国公司只要跟随、做好应用即可。对模型结构进行创新,意味着没有路径可依,要经历很多失败,时间、经济成本都耗费巨大。

DeepSeek显然是逆行者。在一片认为大模型技术必然趋同,follow是更聪明捷径的喧哗声中,DeepSeek看重“弯路”中积累的价值,并认为中国的大模型创业者除应用创新外,也可以加入到全球技术创新的洪流中。

DeepSeek的很多抉择都与众不同。截至目前,7家中国大模型创业公司中,它是唯一一家放弃“既要又要”路线,至今专注在研究和技术,未做toC应用的公司,也是唯一一家未全面考虑商业化,坚定选择开源路线甚至都没融过资的公司。这些使得它经常被遗忘在牌桌之外,但在另一端,它又经常在社区被用户“自来水”式传播。

DeepSeek究竟是如何炼成的?我们为此访谈了甚少露面的DeepSeek创始人梁文锋。

这位从幻方时代,就在幕后潜心研究技术的80后创始人,在DeepSeek时代,依旧延续着他的低调作风,和所有研究员一样,每天“看论文,写代码,参与小组讨论”。

和很多量化基金创始人都有过海外对冲基金履历,多出身物理、数学等专业不同的是,梁文锋一直是本土背景,早年就读的也是浙江大学电子工程系人工智能方向。

多位行业人士和DeepSeek研究员告诉我们,梁文锋是当下中国AI界非常罕见的“兼具强大的infra工程能力和模型研究能力,又能调动资源”、“既可以从高处做精准判断,又可以在细节上强过一线研究员”的人,他拥有“令人恐怖的学习能力”,同时又“完全不像一个老板,而更像一个极客”。

这是一次尤为难得的访谈。访谈里,这位技术理想主义者,提供了目前中国科技界特别稀缺的一种声音:他是少有的把“是非观”置于“利害观”之前,并提醒我们看到时代惯性,把“原创式创新”提上日程的人。

一年前,DeepSeek刚下场时,我们初次访谈了梁文锋 :《疯狂的幻方:一家隐形AI巨头的大模型之路》 。如果说当时那句「务必要疯狂地怀抱雄心,且还要疯狂地真诚」还是一句美丽的口号,一年过去,它已经在成为一种行动。

以下为对话部分:

价格战第一枪是怎么打响的?

「暗涌」:DeepSeek V2模型发布后,迅速引发一场血雨腥风的大模型价格战,有人说你们是行业的一条鲶鱼。

梁文锋:我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。

「暗涌」:这个结果让你们意外吗?

梁文锋:非常意外。没想到价格让大家这么敏感。我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。

「暗涌」:5天后智谱AI就跟进了,之后是字节、阿里、百度、腾讯等大厂。

梁文锋:智谱AI降的是一个入门级产品,和我们同级别的模型仍然收费很贵。字节是真正第一个跟进的。旗舰模型降到和我们一样的价格,然后触发了其它大厂纷纷降价。因为大厂的模型成本比我们高很多,所以我们没想到会有人亏钱做这件事,最后就变成了互联网时代的烧钱补贴的逻辑。

「暗涌」:外部看来,降价很像在抢用户,互联网时代的价格战通常如此。

梁文锋:抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。

「暗涌」:在这之前,大部分中国公司都会直接copy这一代的 Llama结构去做应用,为什么你们会从模型结构切入?

梁文锋:如果目标是做应用,那沿用 Llama结构,短平快上产品也是合理选择。但我们目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。另外,Llama的结构,在训练效率和推理成本上,和国外先进水平估计也已有两代差距。

「暗涌」:这种代差主要来自哪里?

梁文锋:首先训练效率有差距。我们估计,国内最好的水平和国外最好的相比,模型结构和训练动力学上可能有一倍的差距,光这一点我们要消耗两倍的算力才能达到同样效果。另外数据效率上可能也有一倍差距,也就是我们要消耗两倍的训练数据和算力,才能达到同样的效果。合起来就要多消耗4倍算力。我们要做的,正是不停地去缩小这些差距。

「暗涌」:大部分中国公司都选择既要模型又要应用,为什么DeepSeek目前选择只做研究探索?

梁文锋:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

「暗涌」:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。

梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。Scaling Law也在被如此对待。

但其实,这是西方主导的技术社区一代代孜孜不倦创造出来的,只因为之前我们没有参与这个过程,以至于忽视了它的存在。

真正的差距不是一年或两年,而是原创和模仿之差

「暗涌」:为什么DeepSeek V2会让硅谷的很多人惊讶?

梁文锋:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯follow,而不是创新。

「暗涌」:但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,不是所有公司都有资本只去研究创新,而不是先考虑商业化。

梁文锋:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

「暗涌」:为什么中国公司——包括不缺钱的大厂,这么容易把快速商业化当第一要义?

梁文锋:过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。

「暗涌」:但你们究竟是一个商业组织,而非一个公益科研机构,选择创新,又通过开源分享出去,那要在哪里形成护城河?像5月这次MLA架构的创新,也会很快被其他家copy吧?

梁文锋:在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。所以我们把价值沉淀在团队上,我们的同事在这个过程中得到成长,积累很多know-how,形成可以创新的组织和文化,就是我们的护城河。

开源,发论文,其实并没有失去什么。对于技术人员来说,被follow是很有成就感的事。其实,开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。

「暗涌」:你怎么看类似朱啸虎的这种市场信仰派观点?

梁文锋:朱啸虎是自洽的,但他的打法更适合快速赚钱的公司,而你看美国最赚钱的公司,都是厚积薄发的高科技公司。

「暗涌」:但做大模型,单纯的技术领先也很难形成绝对优势,你们赌的那个更大的东西是什么?

梁文锋我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。

英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。

更多的投入并不一定产生更多的创新

「暗涌」:现在的DeepSeek有一种OpenAI早期的理想主义气质,也是开源的。后边你们会选择闭源吗?OpenAI和Mistral都有过从开源到闭源的过程。

梁文锋:我们不会闭源。我们认为先有一个强大的技术生态更重要。

「暗涌」:你们有融资计划吗?看有媒体报道,幻方对DeepSeek有独立拆分上市的计划,硅谷的AI创业公司,最终也都难免要和大厂绑定。

梁文锋:短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。

「暗涌」:很多人认为,做AGI和做量化是完全不同的两件事,量化可以闷声去做,但AGI可能更需要高举高打,需要结盟,这样可以让你的投入变大。

梁文锋:更多的投入并不一定产生更多的创新。否则大厂可以把所有的创新包揽了。

「暗涌」:你们现在不做应用,是因为你们没有运营的基因吗?

梁文锋:我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在DeepSeek 的基础上构建toB、toC的业务。如果能形成完整的产业上下游,我们就没必要自己做应用。当然,如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。

「暗涌」:但选择API的话,为什么选择DeepSeek,而不是大厂?

梁文锋:未来的世界很可能是专业化分工的,基础大模型需要持续创新,大厂有它的能力边界,并不一定适合。

「暗涌」:但技术真的可以拉开差距吗?你也说过并不存在绝对的技术秘密。

梁文锋:技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。

「暗涌」:你们降价后,字节率先跟进,说明他们还是感受到某种威胁。你怎么看创业公司与大厂竞争的新解法?

梁文锋:说实话我们不太care这件事,只是顺便做了这件事。提供云服务不是我们的主要目标。我们的目标还是去实现AGI。

目前没有看到什么新解法,但大厂也没有明显占优。大厂有现成的用户,但它的现金流业务也是它的包袱,也会让它成为随时被颠覆的对象。

「暗涌」:你怎么看DeepSeek之外的6家大模型创业公司的终局?

梁文锋:可能活下来2到3家。现在都还处在烧钱阶段,所以那些自我定位清晰、更能精细化运营的,更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。

「暗涌」:幻方时代,面对竞争的姿态就被评价为“我行我素”,很少在意横向比较。关于竞争,你思考的原点是什么?

梁文锋:我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高,就是成立的。中间很多都是阶段性的,过度关注必然眼花缭乱。

一群做“高深莫测”事的年轻人

「暗涌」:OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇佣了“一批高深莫测的奇才”,做出DeepSeek v2的是怎样一群人?

梁文锋:并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。

「暗涌」:很多大模型公司都执着地去海外挖人,很多人觉得这个领域前50名的顶尖人才可能都不在中国的公司,你们的人都来自哪里?

梁文锋:V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

「暗涌」:这次MLA创新是如何发生的?听说idea最早来自一个年轻研究员的个人兴趣?

梁文锋:在总结出Attention架构的一些主流变迁规律后,他突发奇想去设计一个替代方案。不过从想法到落地,中间是一个漫长的过程。我们为此组了一个team,花了几个月时间才跑通。

「暗涌」:这种发散性灵感的诞生和你们完全创新型组织的架构很有关系。幻方时代,你们就很少自上而下地指派目标或任务。但AGI这种充满不确定性的前沿探索,是否多了管理动作?

梁文锋:DeepSeek也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要push他。探索过程中,他遇到问题,自己就会拉人讨论。不过当一个idea显示出潜力,我们也会自上而下地去调配资源。

「暗涌」:听说DeepSeek对于卡和人的调集非常灵活。

梁文锋:我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。

「暗涌」:一种松散的管理方式也取决于你们筛选到了一批强热爱驱动的人。听说你们很擅长从细节招人, 可以让一些非传统评价指标里优秀的人被选出来。

梁文锋:我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。

「暗涌」: transformer诞生在谷歌的AI Lab,ChatGPT诞生在OpenAI,你觉得大公司的AILab 和一个创业公司对于创新产生的价值有什么不同?

梁文锋:不管是Google实验室,还是OpenAI,甚至中国大厂的AI Lab,都很有价值的。最后是OpenAI做出来,也有历史的偶然性。

「暗涌」:创新很大程度也是一种偶然吗?我看你们办公区中间那排会议室左右两侧都设置了可以随意推开的门。你们同事说,这就是给偶然留出空隙。transfomer诞生中就发生过那种偶然经过的人听到后加入,最终把它变成一个通用框架的故事。

梁文锋:我觉得创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。Chatgpt出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信。这种信心通常在年轻人身上更明显。

「暗涌」:但你们不参与融资,很少对外发声,社会声量上肯定不如那些融资活跃的公司,怎么确保DeepSeek就是做大模型的人的首选?

梁文锋:因为我们在做最难的事。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。

「暗涌」:前一段OpenAI的发布并没有等来GPT5,很多人觉得这是技术曲线明显在放缓,也很多人开始质疑Scaling Law,你们怎么看?

梁文锋:我们偏乐观,整个行业看起来都符合预期。OpenAI也不是神,不可能一直冲在前面。

「暗涌」:你觉得AGI还要多久实现,发布DeepSeek V2前,你们发布过代码生成和数学的模型,也从dense模型切换到了MOE,所以你们的AGI路线图有哪些坐标?

梁文锋:可能是2年、5年或者10年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。但我们确实押注了三个方向。一是数学和代码,二是多模态,三是自然语言本身。数学和代码是AGI天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。另一方面,可能多模态、参与到人类的真实世界里学习,对AGI也是必要的。我们对一切可能性都保持开放。

「暗涌」:你觉得大模型终局是什么样态?

梁文锋:会有专门公司提供基础模型和基础服务,会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。

所有的套路都是上一代的产物

「暗涌」:过去这一年,中国的大模型创业还是有很多变化的,比如去年开头还很活跃的王慧文中场退出了,后来加入的公司也开始呈现出差异化。

梁文锋:王慧文自己承担了所有的损失,让其他人全身而退。他做了一个对自己最不利,但对大家都好的选择,所以他做人是很厚道的,这点我很佩服。

「暗涌」:现在你的精力最多放在哪里?

梁文锋:主要的精力在研究下一代的大模型。还有很多未解决的问题。

「暗涌」:其他几家大模型创业公司都是坚持既要又要,毕竟技术不会带来永久领先,抓住时间窗口把技术优势落到产品也很重要,DeepSeek敢于专注在模型研究上是因为模型能力还不够吗?

梁文锋:所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。

「暗涌」:过去幻方就有很强的技术和创新基因,成长也比较顺利,这是你偏乐观的原因吗?

梁文锋:幻方某种程度上增强了我们对技术驱动型创新的信心,但也不都是坦途。我们经历了一个漫长的积累过程。外部看到的是幻方2015年后的部分,但其实我们做了16年。

「暗涌」:回到关于原创式创新的话题。现在经济开始进入下行,资本也进入冷周期,所以它对原创式创新是否会带来更多抑制?

梁文锋:我倒觉得未必。中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。

「暗涌」:所以你对这件事也是乐观的?

梁文锋:我是八十年代在广东一个五线城市长大的。我的父亲是小学老师,九十年代,广东赚钱机会很多,当时有不少家长到我家里来,基本就是家长觉得读书没用。但现在回去看,观念都变了。因为钱不好赚了,连开出租车的机会可能都没了。一代人的时间就变了。

以后硬核创新会越来越多。现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程。

评论

此博客中的热门博文

付鹏11月24日在HSBC内部演讲速记

《2024年年终回顾和2025年展望——对冲风险VS软着陆》   上篇 正值年底,虽然刚才汇丰一直强调大家不录音不录像,但大概率你挡不住。我在这儿讲话会谨慎一些,非常小心谨慎,大概率会有人透露出去,放到YouTube上,基本上所有见我都说付总我在YouTube上看过你的视频,我说那都是盗版的,靠盗版发财的也不少。 今天和大家分享的内容基本上都是官方的,回顾会多一点,展望不多,因为这个月展望完了之后下个月怎么办?有些话对我来讲我倒觉得很简单,本质上原来我们是做Hedge Fund出身,所以我们的逻辑框架整体具有极强的延续性,不是说今年去讨论,或者说明年去讨论。 惯性思维从2016年开始,我一直在跟大家强调这个世界已经完全不一样了。当然经历过过去的几年时间,我相信在座各位应该对这番话的理解变得越发深刻。 2016年实际上是美国特朗普的第一次大选,我有一个特点,我的特征是如果我觉得什么地方有投资机会,我可能第一时间去一线调研,我不喜欢看YouTube,我也不喜欢在网上扒。当然你会说,现在ChatGPT很强大了,人工智能好像能帮你解决很多问题,但你们有没有想过,可能广泛流传或者广泛传播的很多信息是错的。这一点在2012年当时我从日本做完调研回来之后,我的感悟是最深的。 当然去日本有一个重要的人物,名字叫本森特,很快大家就会非常熟悉他的,目前来讲应该是特朗普政府提名的美国财长。本森特原来是索罗斯基金实际掌控人,因为索大爷已经年龄很大了,去年的时候才刚刚把基金的业务交给他儿子亚历山大,但在这之前,最主要的几场战役本质上来讲都是本森特在主导。 2012年当时我从北京去香港约朋友们吃饭的饭局上,当时斯索罗斯基金在香港办公室跟我说,本森特从这儿去了日本。我说OK。我经常说一句话“站在巨人的肩膀上看问题。” 当然你知道,网民们最可怕的地方是巴菲特“SB”、索罗斯“SB”,我最“牛逼”。你要记住,他们的所有行为一定有很大的变化,很多人可能都不知道,巴菲特第一次去是2011年,我们正在讲福岛核电站泄漏,核废水污染以后海鲜不能吃的时候,一个80多岁的老头顶着核辐射泄漏去日本吃海鲜了,当然他去日本干吗,这其实很关键。 之后我们跑到日本做完调研回来之后那几年,我陆陆续续跟很多人讲,日本正在发生变化,日本的利率结构都会随之变化的,当然包括日本的证券市场。今年日本股市终于走出这35年了,创下...

高善文:2025年可能是一个重要的转折点,GDP增速每一年被高估了3个百分点,累计高估了10个百分点

  主要内容 GDP增速每一年被高估了3个百分点,累计高估了10个百分点; 中国经济增长需要较长时间恢复到泡沫破灭前,积极状态下需3-4年; 经济转型有一定成绩,但周期对中性行业的影响程度大于转型; 数据反映一个省人口越年轻,消费增长越慢,越老则增长越快; 累计有4700万劳动力,无法正常找到工作;就业数据下降,就业质量恶化; 就业和增长的关系在过去两年显得非常反常。 (路演时间2024年12月3日) 一、转型取得积极进展,但周期性压力超过了成长的烦恼 2018年前后,中国经济增长模式逐步摆脱依靠债务基建和房地产驱动的增长形式,转向依靠技术进步和产业升级,经济转型过程中有些行业兴起,有些行业衰落,总量层面经济增速放慢可以理解可以想像,属于转型过程中的成长的烦恼,更多来自于周期的扰动而不是转型的代价。 我们以全部上市公司为基础(A股、港股,中概股),把这些公司分为三类, 1.支持类2500家,政府支持鼓励,支持经济转型引导方向; 2.限制类500家,政府试图加以规范管理和限制,行业自身也在走向衰落; 3.中性类2600家,商贸零售社会服务,和转型过程没有很紧密的联系,整体属于中性。 上市公司营业收入占2024GDP总量50%以上,具有一定代表性。 上市公司营业收入占比,中性类占比60%,支持类占比20%,限制类占比低一些。 上市公司总市值占比,中性类略高于50%,限制类和支持类在20%上下。 2016年至今,中性类行业的营业收入/总市值占比总体稳定, 2018-2020年之间,限制类行业占比明显收缩,支持类行业占比明显扩张 ,政府试图限制的行业在收缩,政府试图支持的行业在扩张,营业收入和总市值维度都是如此。 说明,经济转型在确定性的发生。无论经济增速如何波动,中性行业的占比一直保持不变,不受到限制性和支持性政策的影响。 观察股价表现,我们把所有支持类上市公司视为一家公司, 设定在2018年股价为1,其他类别同理。2018年以来,支持类板块的股价上升,限制类板块的股价大幅下跌,二者之间的裂口是过去十几年没有看到的,这说明政府引导经济转型的努力在金融市场的定价反映出来。2010-2018年,股价表现则完全相反,进一步确认政府引导经济转型的转折点。 人们很容易把总量层面的问题和转型结构联系起来,甚至可能把总量的问题归结为转型的问题。 我们通过观察中性行业的表现,去剥...

从抚顺看中国老龄化城市的困局:年轻人外流、新生儿锐减 - WSJ

去年,这座拥有 170 万人口的城市新生儿数量仅为 5,541 名。相比之下,美国密歇根州韦恩县当年的新生儿数量超过了 20,000,该县包括底特律,人口规模与抚顺相当。 抚顺老龄化的迹象随处可见。公交车站张贴着墓地的广告。出租车上刊登着牙科种植广告——每颗 200 美元,或是 “半口种植牙”1,680 美元。 最近一个周末,在一辆城市公交车上,几十位老人聊着退休生活,对车上为数不多的几个小孩关爱有加,确保这些孩子有座位可坐。这辆公交车经过了一栋栋曾经住满矿工家庭的空置公寓楼,在附近一所被改造成养老院的小学旧址附近停了下来。 再过十年,整个中国都会更像这番景象。 中国人口在 2022 年开始萎缩,出生人数已连续数年锐减。根据联合国的人口预测,到 2035 年,抚顺现状将成为届时中国的写照,60 岁及以上人口占比将达到 30%。 抚顺的崛起建立在中国共产党以国家主导投资和控制生育为核心的增长策略之上。抚顺在这两方面都表现优异。现如今,这里却集中体现了整个中国将要面临的经济和人口压力。 今年是农历龙年,在中国文化中,龙年被视为结婚和生育的吉祥年。尽管如此,2024 年的出生人口预计将降至 800 万以下,不到 2015 年中国实施独生子女政策最后一年出生人口的一半。 中国的生育率徘徊在略高于每名女性生育一个孩子的水平,远低于维持人口稳定所需的 2.1。中国正在试图推广 “生育友好型文化”。 抚顺的生育率长期以来一直低于 1,自 2000 年以来该市人口减少了五分之一以上。根据威斯康星大学麦迪逊分校 (University of Wisconsin-Madison) 研究员易富贤基于人口普查数据和抚顺目前 0.7 的生育率计算,再过十年,抚顺将有一半以上居民年龄在 60 岁或以上。 “双奇迹” 抚顺曾一度跻身中国前十大重工业城市,吸引了来自全国各地的劳动者。 20 世纪初,日本占领者为开采抚顺的石油和煤炭资源奠定了基础。中国经济腾飞之际,抚顺曾被称为中国的 “燃料供应部”,一度占到中国石油总产量的 50%、煤炭产量的十分之一。 抚顺的经济规模在 20 世纪 80 年代中期超过了几个省会城市。从毛泽东开始,中国许多领导人都视察过抚顺的西露天矿 (West Open Pit),该矿当时是亚洲最大的露天煤矿,矿坑东西长 6.6 公里,南北宽 2.2 公里,垂直深度距地表 420...

中国或将继续尝试刺激消费,但不采取大规模刺激措施

 BMG: 中国高层领导人已暗示将采取更强有力的刺激措施,以填补消费需求缺口。但这并不意味着北京方面会立即推出“火箭筒式”刺激计划,或放弃对制造业的关注。 上周,高级官员批准了十年来 最强有力的 促进增长立场,表示将增加政府支出并进一步降息。促进消费十年来第二次被提升为首要任务,甚至在周一发布的数据 显示 零售支出意外放缓之前。 经济学家和外国政府一直希望官员们重新平衡中国的双轨经济,目前,出口激增,北京有望实现创纪录的 贸易顺差 ,而国内需求则萎靡不振。但最近暗示的举措可能达不到分析师认为遏制通货紧缩螺旋和拯救房地产市场所需的那种激进行动。 中国经济双速发展:工业飞速发展,消费却落后 月度工厂产量和零售额(2019年12月=100) 数据来源:彭博经济根据国家统计局数据 令人担忧的 低债券利率 表明,决策者在恢复信心方面面临严峻挑战,而信心是消费的基础。尽管官员们周一承诺大幅增加高价位消费品补贴计划的 资金 ,但到目前为止,这一举措效果有限,因为在就业市场低迷的情况下,消费者仍在继续储蓄。 摩根士丹利首席中国经济学家闫永刚 表示,执政的共产党在重振经济方面面临着一场“漫长的战斗”, 并补充说,2025 年将是“努力的一年”。 “他们会尝试很多东西——发现还不够,就继续尝试,”Xing 告诉彭博电视台。“也许到 2026 年,他们最终会找到合适的政策——以消费为中心的刺激加上社会保障网改革。” 拉动内需仍未代表中国领导人 推动世界第二大经济体发展高科技制造业的宏伟战略发生根本性转变。如果与 唐纳德·特朗普的贸易战 削弱了中国进入国际市场的渠道,那么促进中国消费将保护备受推崇的制造业。 北京的下一步刺激措施可能最早在本周出台。美联储预计将于 周三 降息,为中国央行创造宽松空间。 温和的态度 北京将在 3 月份的年度立法会议上公布其 2025 年的具体经济路线图,该会议将确定年度增长目标和财政赤字。这意味着政府支出的任何扩张可能不会在未来几个月内实现。 《人民日报》 评论 称,经济目标具有很强的导向作用。12 月 17 日的这篇文章称:“保持一定的经济增长水平,是解决发展中各种矛盾和问题的关键。” 根据瑞银集团和法国巴黎银行的预测,财政刺激措施的整体增幅——包括更高的总体赤字和未包含在内其他政府债券——可能相当于国内生产总值的 2% 左右。 虽然这对传统上谨慎的...

越南曾是中美贸易战的大赢家,现在却成为特朗普的打击目标 - WSJ

  如今,随着即将上任的美国下一届政府准备打响新一轮贸易战,特朗普及其团队暗示,他们打算堵住这扇后门。 此举将损害规模虽小但增长迅速的越南经济,而且可能意味着,购买越南商品的美国消费者以及由越南工厂供货的美国公司要面临更高的价格。自特朗普六年前对中国商品加征关税以来,在外国投资大量涌入和对美出口蓬勃发展的推动下,越南经济每年增长约 8%。 目前美国三分之一的运动鞋、一半的木床和餐桌以及四分之一的太阳能电池是由越南供应。 在首都河内郊外,曾经沉睡的北部省份已转变为出口重地,稻田被价值数十亿美元、用于组装智能手机和半导体的庞大工厂取代。拥有越南供应商的美国公司包括苹果 (Apple)、耐克(Nike) 和盖璞(Gap)。 但今年 5 月,特朗普提名的美国贸易代表人选杰米 · 格里尔 (Jamieson Greer) 表示,美国应该收紧贸易规则,以防止他所说的“第三国变通做法”。这一做法使得含有大量中国零部件或由中国公司子公司在第三国制造的商品进入美国时,不必像直接从中国进口那样面临高额关税。尽管他没有具体指明是哪些国家,但中国企业已在越南和墨西哥等 国建 立起通往美国市场的桥头堡。 越南也是美国新一届政府贸易行动的目标。特朗普已经提出对所有进口到美国的商品征收关税的想法,并谈到要迫使各国缩小对美国的贸易顺差。 越南对美国的出口是其从美国进口的九倍,对美国的双边贸易逆差排名第四,仅次于中国、墨西哥和欧盟。2019 年,特朗普曾表示,越南是贸易方面 “最糟糕的滥用者”,河内方面对此予以否认。 美国商会 (American Chamber of Commerce) 驻河内负责人亚当 · 斯特科夫 (Adam Sitkoff) 说:“鉴于越南对美国拥有巨额贸易顺差,该国可能尤其容易受到更具保护主义的经济议程影响。” 尽管如此,越南国内一些人士表示,特朗普对中国和墨西哥的关注将使越南能够避开锋芒,最终吸引更多外国投资进入该国。对越南商品征收的任何新关税都可能低于特朗普对中国征收的关税,这将有助于越南保持竞争优势。 总部位于胡志明市的资产管理公司 Dragon Capital 的国家问题专家 Thuy Anh Nguyen 说 “在特朗普的第一个任期内,让越南具有吸引力的很多因素现在仍然存在。” 她指的是越南有所改善的基础设施以及较低的劳动力和其他成本。 越南仍然具有很大的...

阿萨德向莫斯科运送了2.5亿美元叙利亚现金

FT: 在当时的叙利亚独裁者巴沙尔·阿萨德欠克里姆林宫军事支持之债且其亲属在俄罗斯秘密购买资产的两年时间里,阿萨德的中央银行向莫斯科空运了约 2.5 亿美元现金。 英国《金融时报》披露的记录显示,阿萨德政权在极度缺乏外汇的情况下,于2018年至2019年期间将重达近两吨的100美元和500欧元钞票空运到莫斯科伏努科沃机场,存入受制裁的俄罗斯银行。 大马士革的这些不同寻常的资金转移凸显了俄罗斯作为阿萨德的重要盟友,向他提供军事支持以延长其政权,而在西方制裁将俄罗斯排除在金融体系之外后,俄罗斯已成为叙利亚现金的最重要目的地之一。 反对派人士和西方政府指责阿萨德政权掠夺叙利亚财富,并利用犯罪活动为战争和自身致富提供资金。在向俄罗斯运送现金的同时,叙利亚开始依赖克里姆林宫的军事支持,包括瓦格纳集团雇佣兵的支持,而阿萨德的大家族开始在莫斯科大肆购买豪宅。 曾于 2019 年至 2021 年担任美国负责近东事务的助理国务卿的戴维·申克 (David Schenker) 表示,这些转移并不令人意外,因为阿萨德政权定期将资金汇出国外,“以保证其不义之财和叙利亚的遗产在海外的安全”。 他说:“政权必须把钱转移到海外的安全避风港,才能用它为政权及其核心圈子提供美好的生活。” 叙利亚法律发展项目高级研究员艾亚德·哈米德表示:“多年来,俄罗斯一直是阿萨德政权的金融避风港。”他指出,莫斯科成为阿萨德在 2011 年残酷镇压起义后逃避西方制裁的“枢纽”。 当叛军包围大马士革时,阿萨德逃往莫斯科,这甚至激怒了一些前政权支持者,他们认为这是阿萨德追求超越自我的私利的证据。 他的不稳定统治曾得到伊朗及其代理武装组织(它们于 2012 年进行干预)和俄罗斯(2015 年派遣战机对叙利亚残余叛军和伊斯兰叛乱分子进行打击)的支持。 随着俄罗斯军事顾问支持阿萨德的战争努力,俄罗斯公司参与叙利亚宝贵的磷酸盐供应链,叙利亚与莫斯科的关系急剧加深。驻伦敦的叙利亚分析师马利克·阿卜杜赫 (Malik al-Abdeh) 表示:“叙利亚政府可能会向俄罗斯政府支付军事干预的费用。” 从左至右:巴沙尔·阿萨德、弗拉基米尔·普京和时任俄罗斯国防部长谢尔盖·绍伊古,2020 年在大马士革 © Alexey Nikolsky/Sputnik/AFP/Getty Images 2018年3月至2019年9月期间,阿萨德政权向俄罗...

2024年12月9日中共中央政治局会议新华社通稿

中共中央政治局12月9日召开会议,分析研究2025年经济工作;听取中央纪委国家监委工作汇报,研究部署2025年党风廉政建设和反腐败工作。中共中央总书记习近平主持会议。 会议认为,今年是实现“十四五”规划目标任务的关键一年,以习近平同志为核心的党中央团结带领全党全国各族人民,沉着应变、综合施策,经济运行总体平稳、稳中有进,我国经济实力、科技实力、综合国力持续增强。新质生产力稳步发展,改革开放持续深化,重点领域风险化解有序有效,民生保障扎实有力,全年经济社会发展主要目标任务将顺利完成。 会议强调,做好明年经济工作,要以习近平新时代中国特色社会主义思想为指导,全面贯彻落实党的二十大和二十届二中、三中全会精神,坚持稳中求进工作总基调,完整准确全面贯彻新发展理念,加快构建新发展格局,扎实推动高质量发展, 进一步全面深化改革,扩大高水平对外开放,建设现代化产业体系,更好统筹发展和安全,实施更加积极有为的宏观政策,扩大国内需求,推动科技创新和产业创新融合发展,稳住楼市股市,防范化解重点领域风险和外部冲击,稳定预期、激发活力,推动经济持续回升向好,不断提高人民生活水平,保持社会和谐稳定,高质量完成“十四五”规划目标任务,为实现“十五五”良好开局打牢基础。 会议指出, 明年要坚持稳中求进、以进促稳,守正创新、先立后破,系统集成、协同配合,实施更加积极的财政政策和适度宽松的货币政策,充实完善政策工具箱,加强超常规逆周期调节,打好政策“组合拳”,提高宏观调控的前瞻性、针对性、有效性。要大力提振消费、提高投资效益,全方位扩大国内需求。要以科技创新引领新质生产力发展,建设现代化产业体系。要发挥经济体制改革牵引作用,推动标志性改革举措落地见效。要扩大高水平对外开放,稳外贸、稳外资。要有效防范化解重点领域风险,牢牢守住不发生系统性风险底线。要持续巩固拓展脱贫攻坚成果,统筹推进新型城镇化和乡村全面振兴,促进城乡融合发展。要加大区域战略实施力度,增强区域发展活力。要协同推进降碳减污扩绿增长,加快经济社会发展全面绿色转型。要加大保障和改善民生力度,增强人民群众获得感幸福感安全感。 会议强调, 要加强党对经济工作的领导,确保党中央各项决策部署落到实处。要充分调动各方面积极性,调动干部干事创业的内生动力。要坚持求真务实,统筹发展和安全,增强协同联动,加强预期管理,提高政策整体效能。要做好民生保障和安全稳定...

中国政府急于寻求通缩 “解药” - WSJ

山东晨鸣纸业   (Shandong Chenming Paper) 是中国最大造纸企业之一,该公司采取了任何面临产能过剩的企业都会采取的措施:在试图渡过难关的同时选择降价,以出售更多产品。 但此举却导致亏损扩大。晨鸣纸业上个月表示,累计逾期的债务本息合计约 2.5 亿美元。晨鸣纸业称,债权人已提起诉讼,该公司部分银行账户已被冻结。 在工厂艰难应对产能过剩和需求疲软之际,这家造纸企业的困境再一次表明价格下跌给中国经济造成的破坏。 中国领导人上周承诺将采取更多措施刺激经济,包括降息和增加政府借款。但中国政府面临的压力越来越大,需要采取更有力的行动,以防止通缩的恶性循环自我强化,令中国陷入较长期的衰退。 中国工厂产品出厂价格已连续 26 个月同比下降,11 月份同比下降 2.5%,而且几乎没有迹象表明短期内会出现反弹。中国 GDP 平减指数是衡量整体经济价格水平的更广泛指标,该指数已连续六个季度处于负值区域,为上世纪 90 年代末以来持续时间最长的一次。 如果与美国当选总统特朗普 (Donald Trump) 爆发新的贸易战,可能会加剧当前困境,因为这将使中国更难将过剩的工厂产品销往美国,导致中国国内积压更多商品。 中国的通缩是否已在固化的问题引人担忧。随着价格下跌侵蚀企业利润,企业可能推迟投资或裁员,导致更多人削减支出。其他人则可能因为预期价格会进一步下跌而推迟购买。 总部位于亚特兰大的智库中国研究中心 (China Research Center) 的创始董事佩内洛普 · 普莱姆 (Penelope Prime) 表示:“这会变成一个恶性循环。” 中国消费者价格指数 (CPI) 变动率目前仅略高于零,11 月份同比仅上涨 0.2%,而美国同期涨幅为 2.7%。中国的 CPI 增速远低于大多数央行认为对本国经济有利的 2% 左右的水平。 考虑到中国经济增长对制造业的依赖,许多经济学家尤其关注中国的生产者价格指数 (PPI)。该数据反映的是工厂价格水平。 近几个月来,中国领导人已经采取了一系列措施为困境中的经济托底,房地产市场低迷以及许多地方债务负担不断上升都拖累了经济。中国已经降低了利率,并在上个月批准了一项 1.4 万亿美元的债务置换计划,以努力充实地方财政。 上周,由 24 名委员组成的中共中央政治局表示,明年将实施更加积极的财政政策,并采取 “适度宽松”...

中国陷入困境的富裕城市正在威胁整个经济

BMG:  贫困省份的财政困境正蔓延到长期以来被认为不受经济放缓影响的富裕地区。这威胁着整个国家的经济。 张亚历克斯将他的建筑材料公司的命运与中国沿海最富裕的一些城市巧妙地联系在一起。在杭州、苏州和南京,政府支持的承包商的付款似乎很有保障——这些工业巨头位于八个省份,占全国国内生产总值的近一半。 四年过去了,张先生已经欠下了 1000 万元人民币(140 万美元)的已完工项目款,因为即使是中国富裕地区也受到了全国经济放缓的影响。绝望的他花了 10 万元人民币请神秘的中间人吃了两顿饭,这些中间人自称在北京有强大的人脉,可以帮助他拿到工资并找到新工作——张先生说,这最后的努力似乎不太可能让他还清债务。 “我还没见过一个成功的案例,”38 岁的张先生说,这些中间人从欠款不断增加的人身上捞钱。“地方政府的钱快用完了。要花好几年才能拿到钱。我们被压得喘不过气来——我只想辞职。” 7 月,苏州张泾高长江大桥施工现场。 来源:CFOTO/Future Publishing/Getty Images 张先生并不是唯一一个。自疫情爆发以来,财政紧缩政策一直困扰着中国较贫困的地区,如今正蔓延到那些长期以来似乎不受经济放缓影响的省份,威胁到共产党推动其 18 万亿美元经济的能力。唐纳德·特朗普在选举中获胜,并承诺要切断中国的关键出口,这让保持这种盈利能力变得更加紧迫。 为遏制经济下滑,北京方面采取的核心措施之一是向地方政府提供 10 万亿元人民币的救助资金,用于将其“ 隐性 ”债务重新融资到公共资产负债表上。尽管该计划只占国际货币基金组织 (IMF) 估计的各省 60 万亿元 隐性债务的一小部分,但其目标是释放资金,让当局化解潜在的信贷危机,支付工资,解决企业欠款,投资新项目——这些措施对于让资金再次在经济中流通,以恢复增长至关重要。 困扰中国富裕省份的麻烦加重了前所未有的房地产衰退带来的伤痛,也在一定程度上解释了政府最近为何采取刺激措施。债务置换计划能否成功拯救富裕省份可能需要数月甚至数年的时间。 采访了中国财政困境新热点地区的数十名居民,发现他们对该项目持怀疑态度,他们担心当地官员的腐败或不作为会削弱该项目的实施,认为该项目的影响需要很长时间才能显现,并且担心该项目仍会留下巨额债务需要偿还。几位居民要求匿名讨论政治敏感问题。 北京以前也曾这样做过。香港龙洲经讯 (Gaveka...