中国人工智能初创公司深势科技如何与OpenAI和谷歌竞争
圣诞节后一天,一家名为深势科技的中国初创公司发布了一款新的人工智能系统,其能力可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。这本身就是一个里程碑。但该系统背后的团队,即DeepSeek-V3,描述了一个更大的进步。在解释他们如何构建该技术的研究论文中,深势科技的工程师表示,他们仅使用了领先人工智能公司用于训练其系统的一小部分高度专业化的计算机芯片。
这些芯片是美国和中国之间紧张的技术竞争的核心。在美国政府努力保持该国在全球人工智能竞赛中的领先地位之际,它正试图限制可以出售给中国和其他竞争对手的强大芯片数量,例如硅谷公司英伟达生产的芯片。但DeepSeek模型的性能引发了人们对美国政府贸易限制的意外后果的质疑。这些管制迫使中国研究人员创造性地使用互联网上广泛提供的各种工具。
根据美国人工智能公司一直在使用的基准测试,DeepSeek聊天机器人回答问题、解决逻辑问题和编写自己的计算机程序的能力与市场上已有的任何产品一样出色。而且它的创建成本很低,这挑战了只有科技行业最大的公司(所有这些公司都位于美国)才能负担得起制造最先进的人工智能系统的普遍观点。中国工程师表示,他们只需要大约600万美元的原始计算能力即可构建他们的新系统。这大约是科技巨头Meta构建其最新人工智能技术所花费的十分之一。
风险投资公司Page One Ventures的投资者Chris V. Nicholson表示:“有600万美元可供支出的公司数量远远多于有1亿美元或10亿美元可供支出的公司数量。”自OpenAI在2022年发布ChatGPT引发人工智能热潮以来,许多专家和投资者得出结论,如果没有在专业芯片上花费数亿美元,任何公司都无法与市场领导者竞争。
世界领先的人工智能公司使用超级计算机来训练他们的聊天机器人,这些超级计算机使用多达16,000个或更多的芯片。另一方面,深势科技的工程师表示,他们只需要大约2000个英伟达的专用计算机芯片。乔治华盛顿大学专门研究新兴技术和国际关系的助理教授Jeffrey Ding表示,中国的芯片限制迫使深势科技的工程师“更有效地训练它,以便它仍然具有竞争力”。
本月早些时候,拜登政府发布了新规定,旨在阻止中国通过其他国家获得先进的人工智能芯片。这些规定建立在早先多轮限制的基础上,这些限制阻止中国公司购买或制造尖端计算机芯片。特朗普总统尚未表示他是否会维持或撤销这些规定。
美国政府试图阻止中国公司获得先进芯片,原因是担心这些芯片可能被用于军事目的。作为回应,中国的一些公司囤积了数千个芯片,而另一些公司则从走私者的蓬勃发展的地下市场采购芯片。深势科技由一家名为高飞的量化股票交易公司运营。到2021年,它已将其利润投入到收购数千个英伟达芯片中,并用这些芯片来训练其早期的模型。该公司没有回应置评请求,但因以高薪和允许他们遵循最感兴趣的研究问题而从顶尖大学挖掘人才而闻名于中国。
曾参与早期深势科技模型的计算机工程师王子涵表示,该公司还聘请了没有任何计算机科学背景的人员,以帮助该技术理解和生成诗歌,并在难度极高的中国高考中取得优异成绩。深势科技不为消费者制造任何产品,这使其工程师可以完全专注于研究。这意味着其技术不受中国对人工智能最严格的法规的限制,这些法规要求面向消费者的技术必须符合政府对信息的控制。
美国领先的公司继续推进人工智能的最新技术。12月,OpenAI发布了一个名为o3的新“推理”系统,该系统的性能超过了现有技术,尽管它尚未在该公司之外广泛使用。但深势科技继续表明,它并不落后。本月,它发布了自己令人印象深刻的推理模型。(《纽约时报》已起诉OpenAI及其合作伙伴微软,指控他们侵犯了与人工智能系统相关的新闻内容的版权。OpenAI和微软否认了这些指控。)
这个快速变化的全球市场的关键部分是一个古老的想法:开源软件。像许多其他公司一样,深势科技也将其最新的人工智能系统开源,这意味着它已与其他企业和研究人员共享了底层代码。这允许其他人使用相同的技术构建和分发自己的产品。旧金山Baseten公司的首席软件工程师张逸能表示,虽然大型中国科技公司的员工只能与同事合作,但“如果你从事开源工作,你就会与世界各地的人才合作”。他帮助其他人和其他公司使用深势科技的系统构建产品。
当Meta免费共享名为LLama的人工智能系统时,人工智能的开源生态系统在2023年获得了发展势头。许多人认为,只有像Meta这样拥有大量数据中心和专业芯片的科技巨头继续开源他们的技术,这个社区才会蓬勃发展。但深势科技和其他公司已经表明,他们也可以扩展开源技术的力量。许多高管和评论员认为,美国大型公司不应开源他们的技术,因为这些技术可能被用来传播虚假信息或造成其他严重危害。一些美国立法者已经探讨了阻止或限制这种做法的可能性。但其他人认为,如果监管机构扼杀美国开源技术的进步,中国将获得显著优势。他们认为,如果最好的开源技术来自中国,美国开发人员将基于这些技术构建他们的系统。从长远来看,这可能会使中国成为人工智能研发的中心。“开源社区的重心一直在向中国转移,”加州大学伯克利分校计算机科学教授Ion Stoica说。“这对美国来说可能是一个巨大的危险”,因为它允许中国加速开发新技术。特朗普总统在就职几小时后,撤销了拜登政府威胁要限制开源技术的行政命令。
Stoica博士和他的学生最近构建了一个名为Sky-T1的人工智能系统,该系统在某些基准测试中可以与OpenAI的最新系统OpenAI o1的性能相媲美。他们只需要450美元的计算能力。他们通过构建中国科技巨头阿里巴巴发布的两种开源技术之上来实现这一目标。他们450美元的系统不如OpenAI的技术或深势科技的新系统强大。他们使用的技术不太可能产生超过领先技术性能的系统。但该项目表明,即使是资源微薄的运营也可以构建有竞争力的系统。多伦多的技术顾问Reuven Cohen自12月底以来一直在使用DeepSeek-V3。他说,它与OpenAI、谷歌和旧金山初创公司Anthropic的最新系统相当,而且使用起来便宜得多。“DeepSeek是我省钱的一种方式,”他说。“这是像我这样的人想要使用的那种技术。”
分析大模型:gemma2
得分:50
原因:
文章主要报道了中国初创公司深势科技在人工智能领域的突破,以及其在技术研发和成本控制方面的优势。文章强调了深势科技在开源技术方面的贡献,并指出中国在开源社区中的影响力日益增强,这些都体现了对中国技术进步的正面肯定。文章最后引用用户评论,认为深势科技的系统能帮助用户省钱,也体现了对中国技术发展带来的好处的正面肯定。
原文地址:How Chinese A.I. Start-Up DeepSeek Is Competing With OpenAI and Google
新闻日期:2025-01-23