科技股暴跌,Meta和英伟达等巨头公司面临着对其未来的一连串质疑,科技高管们纷纷在社交媒体上表达他们的担忧。这一切的起因,是一家鲜为人知的中国人工智能初创公司——深势科技(DeepSeek)。

深势科技周一在全球掀起波澜,其一项成就——以远低于许多人工智能专家认为可能的成本,创建了一个非常强大的人工智能模型——引发了一系列问题,包括美国公司在人工智能领域是否还具有竞争力。科技风险投资家马克·安德森在社交媒体上发帖称,深势科技是“人工智能领域的斯普特尼克时刻”。

这家鲜为人知的公司是如何产生如此大的影响的?深势科技是由中国股票交易公司高瓴资本(High-Flyer)创立并拥有的初创公司。其目标是构建类似于OpenAI的ChatGPT聊天机器人或谷歌的Gemini的人工智能技术。到2021年,深势科技已从美国芯片制造商英伟达公司购买了数千枚计算机芯片,这些芯片是创建强大人工智能系统的基础。

在中国,这家初创公司以从顶尖大学吸引年轻有才华的人工智能研究人员而闻名,承诺高薪和参与尖端研究项目的机会。高瓴资本和深势科技都由中国企业家梁文峰运营。

过去几年里,深势科技发布了几款大型语言模型,这是ChatGPT和Gemini等聊天机器人背后的技术。1月10日,该公司发布了首个基于名为DeepSeek-V3的新模型的免费聊天机器人应用程序。

深势科技在圣诞节后第二天推出了DeepSeek-V3模型,其能力与美国公司(如OpenAI和谷歌)的最佳聊天机器人相媲美。单单这一点就令人印象深刻。

但新系统背后的团队还揭示了更大的进步。在一篇解释其如何构建该技术的研究论文中,深势科技表示,它仅使用了领先人工智能公司训练其系统所依赖的一小部分计算机芯片。

世界顶级公司通常使用多达16000个或更多芯片的超级计算机来训练其聊天机器人。深势科技的工程师表示,他们只需要大约2000个英伟达芯片。

自2022年末OpenAI掀起人工智能热潮以来,普遍的观点是,如果没有数十亿美元投资于专用人工智能芯片,就无法构建最强大的人工智能系统。这意味着只有最大的科技公司——例如微软、谷歌和Meta,它们都位于美国——才能负担得起构建领先技术。

(《纽约时报》已起诉OpenAI及其合作伙伴微软,声称其人工智能系统侵犯了新闻内容的版权。这两家科技公司均否认了该诉讼的指控。)

但深势科技的工程师表示,他们仅需约600万美元的原始计算能力即可训练其新系统。这大约是Meta构建其最新人工智能技术所花费的十分之一。

美国顶尖的人工智能工程师表示,深势科技的研究论文阐述了用更少芯片构建人工智能技术的巧妙而令人印象深刻的方法。

简而言之,这家初创公司的工程师展示了一种更有效的数据分析方法。领先的人工智能系统通过在大量数据(包括文本、图像和声音)中找出模式来学习技能。深势科技描述了一种将这种数据分析分散到多个专用人工智能模型(研究人员称之为“专家混合”方法)的方法,同时最大限度地减少了数据从一个地方移动到另一个地方所损失的时间。

其他人以前也使用过类似的方法,但模型之间的信息移动往往会降低效率。深势科技以一种允许它使用更少计算能力的方式做到了这一点。

位于西雅图的艾伦人工智能研究所的研究员、卡内基梅隆大学计算机科学教授蒂姆·德特默斯表示:“现在已经非常清楚,其他公司,而不仅仅是像OpenAI这样的公司,也可以构建这种系统。”他专门研究构建高效的人工智能系统。“深势科技使用的方法任何人都可以复制。”

深势科技的研究论文引发了人们对美国大型公司是否能在人工智能领域保持显著领先地位的质疑。许多专家认为,人工智能技术将成为一种商品,许多公司将销售大致相同的产品。

根据标准基准测试,DeepSeek-V3可以像市场上任何现有产品一样有效地回答问题、解决逻辑问题和编写自己的计算机程序。

就在深势科技发布其技术之前,OpenAI推出了一种名为OpenAI o3的新系统,该系统似乎比DeepSeek-V3更强大。但OpenAI尚未向公众发布该系统。

OpenAI o3旨在“推理”涉及数学、科学和计算机编程的问题。许多专家指出,深势科技尚未构建沿着这些思路的推理模型,而这被认为是人工智能的未来。

然后在1月20日,深势科技发布了自己的推理模型DeepSeek R1,它也给专家们留下了深刻的印象。这最终导致美国投资者和其他人在上周末恐慌,因为他们意识到深势科技新技术的意义。

是的,这仍然很重要。

大量人工智能芯片仍然可以在很多方面帮助公司。有了更多的芯片,他们可以在探索构建人工智能的新方法时运行更多的实验。换句话说,更多的芯片仍然可以给公司带来技术和竞争优势。

专家表示,运行新型“推理”人工智能模型也需要更多的芯片。当个人和企业使用它们时,这些模型需要更多的计算能力。

是的。为了保持美国在全球人工智能竞赛中的领先地位,拜登政府制定了限制向中国和其他竞争对手出售强大芯片数量的规则。

但深势科技模型的出色表现引发了人们对美国政府贸易限制的意外后果的质疑。这些控制措施迫使中国的研究人员创造性地使用互联网上可以免费获得的各种工具。

一些专家继续支持美国的贸易限制,称这些限制措施只是最近才实施的,随着时间的推移,它们将对中国创造人工智能的能力产生更大的影响。

不。世界尚未见到OpenAI的o3模型,其在标准基准测试中的表现比市场上任何其他产品都更令人印象深刻。但专家们担心,中国正在开源人工智能系统方面取得领先。

像许多其他公司一样,深势科技已“开源”其最新的人工智能系统,这意味着它已与其他企业和研究人员共享了底层计算机代码。这允许其他人使用相同的技术构建和分发自己的产品。

这是深势科技和其他中国公司能够如此快速且廉价地构建具有竞争力的人工智能系统的部分原因。

在人工智能领域,开源在2023年首次获得发展势头,当时Meta免费共享了一个名为Llama的人工智能系统。当时,许多人认为,只有像Meta这样拥有数据中心(其中装满了专用芯片)的巨头公司继续开源其技术,开源生态系统才会蓬勃发展。

但深势科技和其他公司已经表明,这种生态系统可以以超越美国科技巨头的方式蓬勃发展。

许多专家认为,美国大型公司不应开源其技术,因为它们可能被用来传播虚假信息或造成其他严重危害。一些美国立法者已经探索了阻止或限制这种做法的可能性。

但其他专家认为,如果监管机构扼杀美国开源技术的进步,中国将获得显著优势。这些专家认为,如果最好的开源技术来自中国,美国的研究人员和公司将基于这些技术构建其系统。

从长远来看,这可能会使中国成为人工智能研究和开发的核心,这可能会进一步加速其构建包括自主武器和其他军事系统在内的各种人工智能技术的努力。


分析大模型:gemma2
得分:50
原因:

文章主要报道了中国AI初创公司深势科技的技术突破和成就,以及其对全球AI领域的影响,整体上对中国在AI领域取得的进展持肯定态度,赞赏其以较少资源取得的成就,以及开源策略对行业的影响。虽然也提到了美国的一些担忧,但整体基调是正面的,突出了中国的创新能力。

原文地址:What is DeepSeek? And How Is It Upending A.I.?
新闻日期:2025-01-27

Verified by MonsterInsights