## 中国AI产业崛起:DeepSeek追赶ChatGPT

在会议中,梁——这家最近颠覆人工智能世界的中国初创公司DeepSeek的创始人——身形瘦削,风格内敛,甚至显得有些腼腆和紧张。他常常说话犹豫,长时间沉默。但新员工很快就会明白,不要把他的沉静思考误认为胆怯。一旦梁理解了讨论的细节,他就会针对模型架构、计算成本以及DeepSeek人工智能系统的其他复杂问题,提出精准且难以回答的问题。

员工们尊称梁为“老板”,这是中国商界对上级的常见尊称。但不同寻常的是,他们的“老板”赋予年轻研究人员甚至实习生权力,让他们承担大型实验项目,经常到他们的办公桌旁了解最新进展,并鼓励他们考虑非同寻常的工程路径。技术性越强的对话越好,尤其是当它能带来实际的性能提升时。梁经常在内部的Lark消息频道上分享这些里程碑。

一位不愿透露姓名的DeepSeek前员工表示:“他是个真正的技术狂人。有时,我觉得他对研究的理解甚至超过了他的研究人员。” 梁和他的年轻公司在1月份声名鹊起,当时DeepSeek发布了R1,这款人工智能模型给人一种爆炸性突破的感觉。R1在一些常用于评估人工智能性能的标准测试中击败了西方的主要竞争对手,但DeepSeek声称,其基础模型的构建成本仅为OpenAI的ChatGPT所采用的GPT-4模型估计成本的5%左右。

测试结果引发了对美国试图通过出口管制来减缓中国人工智能发展战略的质疑。亚马逊和微软争相将DeepSeek的模型添加到他们的云服务中,与Meta和Mistral AI等竞争对手并驾齐驱。Atul Deo负责管理亚马逊的语言模型市场,他说:“基本上在一个周末的时间里,人们对DeepSeek的兴趣大增,我们立即采取了行动。”

DeepSeek拨开了笼罩在美国人眼中的中国人工智能景象的迷雾:神秘莫测,容易被视为夸大的幽灵,但很可能比他们愿意承认的更令人生畏。在这家初创公司出现之前,许多美国公司和政策制定者都抱着一种令人安慰的观点,认为中国仍然大大落后于硅谷,这让他们有时间为最终的平起平坐做准备,或者阻止中国赶上。

现实情况是,DeepSeek所在的杭州以及其他中国高科技中心,如雨后春笋般涌现出许多人工智能初创公司,被称为“AI小龙”。来自澜舟科技等本土初创公司的成熟聊天机器人迅速走红,甚至在美国也广受欢迎。阿里巴巴的Qwen模型在谷歌和Anthropic等公司的大型语言模型排行榜上名列前茅;阿里巴巴首席执行官吴泳铭在4月份吹嘘说,由于其使用内部芯片组装的新型超级计算机,阿里巴巴可以开发出与DeepSeek一样好的模型,而且成本更低。摩尔线程也在赢得赞誉,其设计的产品旨在与英伟达的设备竞争,英伟达的图形处理器(GPU)为美国和欧洲最先进的人工智能模型提供动力。

不久前,中国共产党还对它认为失控的科技行业持谨慎态度。反垄断调查和数据合规审查启动,阿里巴巴联合创始人马云等行业领袖受到关注,社交媒体、零工经济和游戏应用也受到了新的监管。现在,面对外部干预,中国共产党正在扶持国内科技产业。中国国家主席习近平正在调集资源发展人工智能和半导体,鼓励中国的高技能人才,并呼吁建立“自主可控、协同”的软硬件生态系统。

具有讽刺意味的是,旨在减缓中国人工智能发展势头的地缘政治限制,也在推动中国最近取得的进展。Counterpoint Technology Market Research的分析师魏孙表示,美国和中国之间的人工智能差距现在是以月来衡量,而不是以年。魏孙指出,对英伟达芯片的强制稀缺性激发了新的人工智能创新,“在中国,有一种集体伦理和强烈的合作意愿,从而实现了卓越的执行力。这种动态创造了一种达尔文式的压力:适者生存,那些能以更少资源做更多事情的人才能生存。”

在中国看到创新的同时,许多美国人继续怀疑存在不当行为。美国众议院一个两党委员会4月份发布的一份报告称,DeepSeek与中国政府之间存在“重大”联系,并得出结论,该公司非法窃取了OpenAI的数据,对美国国家安全构成了“严重威胁”。Anthropic首席执行官达里奥·阿莫代伊呼吁美国加强出口管制,他在一篇博客文章中声称,DeepSeek肯定走私了大量英伟达GPU,包括其最先进的H100。彭博新闻社报道称,美国官员正在调查DeepSeek是否通过新加坡的第三方购买违禁芯片来规避出口限制。

中国大使馆驳斥了众议院委员会的说法,称其“毫无根据”。英伟达表示,DeepSeek的芯片符合出口规定,更多的限制可能会让中国半导体受益。这家芯片制造商的一位发言人表示,迫使DeepSeek使用更多来自中国的芯片和服务将“提振华为和外国人工智能基础设施提供商”。

这场辩论的中心公司仍然有些神秘。DeepSeek以开源其人工智能技术为荣,但对其内部运作或意图却完全不公开。它在公开论文中披露了其研究的超具体细节,但不会提供关于构建其人工智能的一般成本、当前GPU的构成或数据来源的基本信息。

长期以来,梁一直以不善交际而闻名,以至于中国人工智能界的一些领导人私下称他为“技术狂人”,这是对雄心勃勃的古怪企业家的一个昵称。在过去的10个月里,他没有接受过一次媒体采访,直到最近中国国务院总理李强举行的一次听证会上,一张他那孩子气、戴眼镜的照片浮出水面,很少有人知道他的长相。彭博商业周刊多次要求梁和他的同事对此事发表评论,但没有得到回应,只有一位员工发来一封自动回复邮件,称该询问正在处理中:“感谢您对DeepSeek的关注和支持!”她的邮件补充道。

为了进一步了解该公司的运作方式以及它如何融入中国更广泛的人工智能雄心,彭博商业周刊采访了梁的11位前员工,以及30多位分析师、风险投资家和与中国人工智能行业关系密切的高管。

缺乏公开形象让阿莫代伊和OpenAI负责人山姆·奥特曼等批评人士得以利用这些空缺发表诋毁言论,这些言论引起了美国观众的共鸣,他们已经准备好将中国技术视为一种阴暗的威胁。但即使是那些对DeepSeek保持警惕的人,也不得不努力应对其人工智能的不可否认的实力。人工智能搜索产品公司Perplexity AI Inc.的首席商务官德米特里·舍夫连科表示,他公司没有一个人能与DeepSeek的任何同行进行沟通。尽管如此,Perplexity还是采用了DeepSeek的技术,只将其托管在美国和欧洲的服务器上,并在训练后对其进行处理,以删除任何表明中国共产党审查制度的数据集。Perplexity将其命名为R1 1776(指的是美国建国年份),舍夫连科将其描述为对自由的致敬。“我们不知道DeepSeek的真正动机是什么,”他说。“这有点像一个黑匣子。”

DeepSeek曾预料到其人工智能可能会在国外引起担忧。在2024年3月举行的英伟达开发者大会上,DeepSeek的深度学习研究员陈德力在一个被忽视的虚拟演示中谈到了价值观应该如何与大型语言模型“分离”,并适应不同的社会。在一张冷冰冰的逻辑幻灯片上,陈展示了一个DeepSeek原型,用于定制聊天机器人中内置的道德标准,供不同背景的人使用。只需轻点一下按钮,开发人员就可以设置包括赌博、安乐死、性交易、枪支所有权、大麻和代孕等问题的合法性。“他们所要做的就是选择符合他们需求的选项,然后他们就可以享受专门为其价值观量身定制的模型服务,”陈解释说。

寻找如此高效的解决方案一直是DeepSeek的文化规范。梁和他的朋友们在2000年代中期在浙江大学学习了各种技术领域——机器学习、信号处理、电子工程等——显然是为了好玩(而且,你知道,为了赚钱),开发了计算机程序,在全球金融危机期间交易股票。

毕业后,梁继续独自构建量化交易系统,赚了一小笔财富,然后在杭州与几位大学朋友联手,于2015年创立了后来被称为High-Flyer Quant的公司。

早期的招聘信息吹嘘要吸引来自谷歌和Facebook的顶尖人才,并寻找具有情景喜剧《生活大爆炸》中笨拙的主角谢尔顿的“古怪才华”的数学和编码“怪才”。他们承诺提供免费零食、Herman Miller椅子、扑克之夜、一种认可T恤和拖鞋的办公文化,以及一剂金融科技兄弟文化,即有机会与“出生于1990年代的可爱、轻声细语的女孩”和“从华尔街回来的精明女神”一起工作。

与DeepSeek的情况一样,High-Flyer营造了一种神秘感——其第一个社交媒体帖子只称梁为“L先生”——同时致力于一种“让我证明给你看”的透明度。每周五,High-Flyer都会在微信上发布其10只原始基金的业绩图表。在2016年夏季将每周数据仅提供给注册投资者之前,该投资组合的平均年化回报率为35%。

数十亿美元最终流入High-Flyer的投资,其投资和研究团队增加到100多名员工。梁于2019年开始认真招募人工智能部门,旨在挖掘庞大的数据集,以发现被低估的股票、高频交易的微小价格波动以及特定行业投资者错过的宏观趋势。到新冠疫情开始时,他和他的团队构建了一个由互连处理器并行运行的高性能计算系统,这种设置被称为集群。High-Flyer表示,为了这个集群,它购买了1000个英伟达2080Ti芯片(通常由游戏玩家和3D艺术家使用)和额外的100个Volta系列GPU。(Volta GPU,又名V100,是英伟达首款人工智能优化处理器。)High-Flyer之前较小的计算架构需要两个月才能训练一个新的经济分析模型,而其新设备处理相同的工作负载所需的时间不到四天。

这些金融模型令人印象深刻,但比OpenAI等美国公司构建的通用模型要小得多。梁推动构建一个更大的超级计算机,由A100组成,它是V100的升级版。一位参与该项目的前High-Flyer工程师表示,梁是这个不断增长的集群的“最大用户”,估计用于开发模型的计算机处理量的80%都分配给了他的用户名。这位前工程师说,梁似乎对深度学习很着迷,称其为“他昂贵的爱好”。对于一家量化公司来说,向如此人工智能基础设施投入数亿美元可能有些过分,但梁已经创造了足够的利润来承担。“对当时的梁来说是小钱,”这位工程师回忆道。“更多的计算能力、更好的模型、更多的交易收益。”

至少这是希望。High-Flyer当时管理着约141亿美元的资产,因一系列令人失望的回报向利益相关者道歉。该公司将其归咎于其人工智能系统,称其人工智能系统做出了明智的股票选择,但在疫情的波动中未能熟练地把握退出这些交易的时机。即便如此,它还是决定在人工智能上加倍投入:2022年1月,High-Flyer在社交媒体上发布消息称,它已经积累了5000个英伟达A100,每个通常价值数万美元。3月份,它宣布该集群已扩展到10000个,仅仅六个月前,英伟达警告称,新的美国限制可能会影响此类芯片对中国的出口。

目前尚不清楚这些基础设施最终有多少用于量化交易,又有多少用于梁的昂贵爱好。第二年春天,在OpenAI推出ChatGPT约五个月后,他将DeepSeek剥离为一个独立的研究实验室。在杭州和北京的独立办公室里,金融不再是重点。在一份没有署名的宣言中,High-Flyer发誓要避开平庸,迎接人工智能革命最严峻的挑战。其最终目标:通用人工智能。

在2023年的整个过程中,DeepSeek实验室竞相构建人工智能代码助手、通用知识聊天机器人和文本到3D艺术生成器。梁从High-Flyer带来了工程师,并从百度的北京办事处以及中国领先的科技公司和大学招募了更多人。Bo“Benjamin”Liu于9月加入,担任学生研究员,然后开始攻读博士学位,他说梁经常给实习生关键的工作,这些工作在其他地方会被分配给高级员工。“以我为例:当我进入公司时,没有人从事RLHF infra的工作”——支持一种重要技术(称为从人类反馈中进行强化学习)所需的基础设施——“所以他只是让我来做,”Liu说。“他会信任你去做别人没有做过的事情。”(这种信任给DeepSeek带来了额外的好处:它向实习生支付相当于每天140美元的工资,每月提供420美元的住房补贴,这在中国是一笔慷慨的报酬,但大约是美国人工智能公司实习生收入的三分之一,而且只是硅谷全职工程师收入的一小部分。)

据两位DeepSeek前研究人员称,梁早期在很大程度上押注于稀疏性,这是一种通过将大型语言模型分解为专业来更有效地训练和运行它们的技术。当你向最初的ChatGPT提问时,它的整个大型语言模型大脑都会激活,以确定最佳答案,无论你要求计算2 + 2的总和还是馅饼食谱。相比之下,稀疏模型会更好地利用资源,将其划分为“专家”,只有相关的专家才会响应任何特定的提示。

稀疏方法可以大大节省计算成本,但它变得极其复杂。如果一个问题没有被大脑的足够回路处理,或者被发送到错误的脑叶,答案质量就会下降。(数学大脑知道如何在公式中使用pi,但不知道馅饼食谱中包含什么,例如。)梁看到了谷歌和Meta在这方面的进展,Meta于2023年12月发布了一个稀疏模型,该模型分为八个专家,每个查询都会根据上下文激活两个最相关的专家。他召集他的团队设计具有更多专家的模型,这种技术有可能增加幻觉并分裂人工智能的知识。“这引发了重大的内部辩论,”这位DeepSeek前员工说。

随之而来的是更多的突破,每个突破都公开分享,并越来越引起中国竞争对手的关注。然后,在2024年末,DeepSeek发布了V3,这是一个通用人工智能模型,比Meta的Llama 2的等效模型大65%左右,而Llama 2当时是最大的开源大型语言模型。但真正引起谷歌、OpenAI和微软高管注意的是DeepSeek在2024年末发布的V3,大约在一个月前,DeepSeek凭借其R1推理模型进入了更广泛的意识。一个令人震惊的统计数据从PDF中跃然而出:DeepSeek暗示V3的整体开发成本仅为560万美元。这个数字可能仅指最终的训练运行——一种数据提炼过程,它将模型的先前原型转化为完整的产品——但许多人认为这是整个项目令人难以置信的低预算。相比之下,最先进的前沿模型的累积训练成本可能达到1亿美元或更多。Anthropic的阿莫代伊甚至预测(在DeepSeek崛起之前),下一代模型的训练成本将高达100亿美元到1000亿美元。

流行的AI平台Hugging Face的研究主管Leandro von Werra表示,DeepSeek模型的“架构创新”并不是最引人注目的。他从其研究论文中得出的最大启示是,该公司必须开发出高质量的数据——要么是从网络上巧妙地清理出来,要么是通过其他方式提取出来的——才能使V3栩栩如生。von Werra说:“如果没有非常强大的数据集,模型将缺乏性能。从报告中可以清楚地看出,DeepSeek拥有最好的大型语言模型训练数据集之一。不幸的是,该报告在50页中仅用半页的篇幅介绍了数据集。”

DeepSeek展示了其快速进展,因为梁认为开源对其理念至关重要。他认为,隐藏专有技术并为强大的模型收费——OpenAI和谷歌等美国顶级实验室采取的方法——将短期优势置于更持久的成功之上。使其模型完全可供公众访问,并且在很大程度上是免费的,这是DeepSeek加速采用并让初创公司和研究人员在其技术上进行构建的最有效方式。希望这将创建一个产品消费和反馈的飞轮。正如DeepSeek在近两年前发布其首个公开大型语言模型时所写的那样,引用了开源操作系统Linux的发明者的话:“空谈无补,给我看代码。”

四月的一个多云的星期天,在杭州熙熙攘攘的萧山国际机场,宣传阿里巴巴、字节跳动和华为人工智能服务的数字广告牌迎接着旅客。一个有着蓝色头发的类人机器人在现代化的航站楼内挥手欢迎乘客。在外面,一家自动驾驶汽车初创公司一直在测试小型自动驾驶卡车,用于在停机坪周围运输货物。尽管围绕DeepSeek的喧嚣声不断,但西方人似乎忘记了它只是在中国众多硅谷同等地区崛起的人工智能小龙之一。仅在人口为1250万的特大城市杭州,DeepSeek就属于一个被称为“六小龙”的科技初创公司精英团体。

在风景秀丽的西湖区,有游戏科学,这是一家中国游戏工作室,其开发的《黑神话:悟空》是一款畅销的动作游戏,因使用机器学习技术使其计算机角色更加逼真而受到赞誉。不远处是两家机器人巨头和一家专注于3D空间软件的独角兽公司。附近还有浙江强脑科技有限公司,该公司被称为BrainCo,可以最好地理解为中国支持的Neuralink公司版本。它可以追溯到哈佛大学一位中国出生的博士生韩璧丞孵化的一家初创公司,目前正在杭州的附属实验室开发仿生肢体和用于大脑活动控制计算机的技术。BrainCo的一只人工智能驱动的假肢手目前在中国人工智能小镇的一个展览中心展出,这是杭州另一个新兴的科技中心。

据一位参加会议的人士透露,最近几周,BrainCo的领导人在展览上进行了参观。与会者经常想投资,但显然这些天才们并没有显得太渴望外部资金。“基本上他们不需要钱,”一位参加参观的基金经理说。“由于围绕六小龙的所有炒作,人们都在向他们扔钱。”

在所有这些初创公司的背后,静静地站立着中国国家主席习近平的政府。正如中国官方新华社报道的那样,生成式人工智能、机器人技术和其他高科技雄心正在推动一项国家议程,这项议程首先寻求国内的“自力更生和自强”。“我们必须认识到差距,加倍努力,全面推进技术创新、产业发展和人工智能赋能应用。”

人工智能小龙们正在听取意见,而且并非所有人工智能小龙都很小。价值3000亿美元的综合企业阿里巴巴的主要园区是一个广阔的物业,拥有自己的湖泊,位于杭州西湖以西约40分钟车程的地区。该公司最近承诺在未来三年内投资530亿美元用于建设更多的人工智能数据中心,据说其最新的Qwen3旗舰模型的性能和成本效益与DeepSeek相媲美。在中国境外,阿里巴巴通常被认为是一家电子商务企业,但其发展速度更快的人工智能和云部门于2022年剥离到杭州郊外的一个独立枢纽。在其会议室内,大屏幕上闪烁着“行业洞察速递”,每72小时更新一次,详细介绍了DeepSeek和OpenAI等竞争对手的最新成就。甚至在洗手间里也有每周更新的版本,提醒人们即使人类技术人员需要方便,人工智能竞赛也在继续进行。

今年4月,在中共对中国科技行业进行打击后几乎消失了五年的阿里巴巴神秘联合创始人马云重新出现在公司园区,庆祝其云部门成立15周年。据几位看到的人士透露,在一次罕见的演讲中,马云表示他希望人工智能为人类服务,而不是统治人类。参加者还通过香港和东京办事处的直播收看了演讲,他们表示对马云的凯旋归来感到兴奋。

这提醒人们,像马云这样的科技摇滚明星显然又重新获得了中共的青睐——并且正在被像梁这样的后起之秀所取代——即使美国科技领导人的光芒正在褪色。中国国内的民族自豪感正在增强,中国渴望表明它可以克服西方的障碍。香港政策顾问公司亚洲集团有限责任公司董事总经理陈乔治表示,在苹果、谷歌、微软和其他领先公司在美国工作一段时间后,中国顶尖工程师已开始回国。虽然特朗普政府的敌意是其中的一部分原因,但他们也被一种真正的行动可能正在向东转移的感觉所吸引。“硅谷不再是中国人才有吸引力的工作场所,”陈说。

另一家中国独角兽公司01.AI的创始人李开复更进一步。作为苹果、谷歌和微软的资深人士,李开复表示,下一代人才并没有追随他的道路,先在美国公司工作,然后在国内建立自己的公司。“这些年轻的人工智能工程师基本上都是本土培养的,”他说。“DeepSeek的成功以及其他新兴人工智能初创公司的成功正在激励更多的年轻人才参与到中国的人工智能复兴中。”

如今,中国没有任何一家科技公司能像DeepSeek那样激起如此强烈的自豪感。今年4月,来自加拿大的27岁计算机科学家柯比·方与家人一起访问杭州时,带家人参观了梁的母校浙江大学。方在那里做了一个交换项目,并想向他的祖父母和弟弟表明,他与DeepSeek的创始人曾在同一所学校学习。“向我在加拿大的朋友解释说,制造DeepSeek的人上了我的学校,这真的很酷,”方说。

游客和社交媒体影响者也经常涌向DeepSeek的总部,该总部位于一个俯瞰中国著名京杭大运河的四塔建筑群中。游客们在当地商店寻找梁的踪迹,包括DeepSeek大楼内一家高档火锅店,DeepSeek的员工有时会在那里用餐。(女服务员不得不遗憾地告诉他们,他从不光顾。)

认识梁的人说,他把时间分配在杭州和DeepSeek的北京办事处,后者位于当地一个科技中心的一座玻璃塔楼的五楼。在那里,二十多岁的程序员在高度可调节的桌子上辛勤工作,食品储藏室里堆满了能量饮料、康师傅方便面和辣条。员工可以在白板上潦草地写下对额外食物的要求。“在那里吃了几个月的午餐和晚餐后,我有点发胖了,”一位最近离职的研究员说。

梁很少同意与外界人士会面,有时甚至以全息投影的形式出现,以参加他接受的少数几次会面。他拒绝了在韩国举行的AI首尔峰会的邀请,这次峰会吸引了OpenAI的奥特曼、英伟达的黄仁勋和谷歌首席执行官桑达尔·皮查伊以及众多总理和总统。

当中国庆祝DeepSeek时,美国却将它视为一种神秘地出现在供水系统中的不熟悉的生物,检查它是否良性或恶性。批评人士认为,DeepSeek正在窃取美国的技术、违反出口管制,并参与某种更大的间谍活动或心理战,以破坏硅谷的人工智能霸权。美国众议院调查DeepSeek的委员会的一位发言人说:“DeepSeek是从美国科技行业到中国共产党监控国家的直接渠道,不仅威胁着美国公民的隐私,也威胁着我们的国家安全。”

然而,DeepSeek一直将自己定位为与任何热门初创公司没有什么不同——这是“纯粹的车库能量”的产物,它在2月份的X帖子中说。毕竟,它与谷歌在同一个北京园区运营,离汉堡王和两家Tim Hortons不远。仅仅因为更广泛的人工智能行业直到现在才对DeepSeek给予太多关注,并不意味着幕后发生了什么不正当的事情。风险投资公司Alpha Intelligence Capital的合伙人Arnaud Barthelemy说:“人工智能世界没有预料到DeepSeek,他们本应该预料到。”该公司投资了OpenAI和商汤科技。

Barthelemy说,从DeepSeek吸取的真正教训是中国科技公司如何有效地将它们所面临的限制转化为优势。“中国有很多聪明的人,他们以更低的计算要求做了很多聪明的创新,”他说。

事实上,在2023年5月,巧合的是DeepSeek成立的同一个月,英伟达首席执行官黄仁勋告诉《商业周刊》,美国过度监管中国只会激励它超越那些阻碍它的人。他将经济影响力描述为国家安全的有效工具,并强调政府干预的意外后果将是严重的。“被剥夺了三分之一的技术产业市场肯定是灾难性的,”他说,指的是限制美国对华技术出口的风险。“他们将在没有竞争的情况下蓬勃发展。他们将蓬勃发展,并将出口到欧洲、东南亚。”

“你必须注意你把竞争推到什么程度,”黄继续说道。“突然之间的反应非常不可预测。一无所有的人的反应方式非常令人惊讶。”

关于DeepSeek故事的一个重要部分仍然存在争议:它实际花费了多少钱来构建其模型。在美国研究公司SemiAnalysis的一份被广泛引用的报告中,该公司声称High-Flyer和DeepSeek可能拥有大约50000个英伟达顶级H系列GPU集群的访问权限,价值14亿美元,他们基本上对公众隐瞒了这些信息。SemiAnalysis表示,这些基础设施的大部分包括可能符合出口规定的GPU。(美国允许英伟达向中国销售一些芯片——H20和H800——它修改了这些芯片以限制性能,使其符合白宫的限制。)但这家咨询公司还声称,DeepSeek还可以访问额外的10000个英伟达最先进的H100芯片,美国政府已禁止向中国销售这些芯片。

三位前员工强烈否认了这些说法,称DeepSeek拥有的GPU不到20000个,其中包括较旧的英伟达芯片和受出口管制的芯片。博士候选人Bo Liu在谈到SemiAnalysis时说:“他们正在散布谎言。”该研究公司表示,它坚持其报告。

毫无疑问的是,DeepSeek是否会欢迎获得美国科技公司拥有的计算能力规模。该公司似乎有信心,它可以比硅谷做得更多。“现实情况是,大型语言模型研究人员对计算资源有着巨大的需求——如果我使用数万个H系列GPU,我也可能会变得浪费,运行许多可能并非绝对必要的实验,”一位DeepSeek前员工说。但是,获得更多资源是中国技术人员愿意处理的问题。“我希望我们中国公司有一天能拥有50000个GPU,”这位已经加入北京另一家开源人工智能实验室的离职研究员说。“想看看我们能取得什么成就吗?”


分析大模型:gemma2
得分:35
原因:

文章主要报道了中国AI公司DeepSeek在技术上的突破和快速发展,以及中国政府对AI产业的支持,展现了中国在AI领域取得的成就和潜力。同时,文章也提到了中国工程师的回流和国内AI行业的蓬勃发展,表达了作者对中国AI发展前景的看好。

原文地址:DeepSeek Races After ChatGPT as China’s AI Industry Soars
新闻日期:2025-05-13

Verified by MonsterInsights