中国人工智能初创公司深势(DeepSeek)成立仅一年多,其人工智能模型在性能上可与世界顶尖的聊天机器人相媲美,且开发成本似乎仅为其一小部分,这在硅谷引发了敬畏和不安。深势的出现可能反驳了人工智能的未来需要不断增加的计算能力和能源的普遍观点。
1月27日,随着围绕深势创新的炒作不断升温,投资者开始消化其对美国竞争对手和人工智能硬件供应商(如英伟达)的影响,全球科技股应声下跌。深势由高飞量化对冲基金的负责人于2023年创立。该公司开发的人工智能模型是开源的,这意味着广大的开发者社区可以检查和改进该软件。其移动应用程序在1月初发布后,迅速攀升至美国iPhone下载排行榜的榜首。该应用程序与诸如OpenAI的ChatGPT等其他聊天机器人不同之处在于,它在回复提示之前会阐明其推理过程。该公司声称,其R1版本的性能与最新版本的ChatGPT相当。它以远低于OpenAI类似访问的价格向有兴趣使用该技术开发聊天机器人的个人提供许可。
深势表示,R1在多个领先的基准测试中,其性能接近或超过竞争对手的模型,例如用于数学任务的AIME 2024、用于通用知识的MMLU和用于问答性能的AlpacaEval 2.0。它还在一个名为的排行榜上名列前茅。虽然该公司没有详细说明,但深势模型训练和开发的成本似乎仅为OpenAI或谷歌最佳产品所需成本的一小部分。该模型更高的效率让人怀疑是否需要大量资金来购买英伟达等公司最新、最强大的人工智能加速器。这也引发了人们对美国限制向中国出口此类先进半导体的关注——这些限制旨在阻止像深势所代表的那种突破。
自2023年发布最早的模型以来,这家人工智能开发商一直备受关注。去年11月,该公司向世界展示了其旨在模仿人类思维的深势R1推理模型。该模型是其聊天机器人应用程序的基础,该应用程序作为OpenAI更便宜的替代品而迅速流行起来,投资者马克·安德森称其为“令人震惊的”。根据市场追踪机构App Figures的数据,截至1月25日,深势移动应用程序的下载量达到160万次,并在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店中排名第一。
自ChatGPT引发全球人工智能热潮以来的两年多时间里,投资者一直押注人工智能的改进将需要英伟达等公司更先进的芯片。深势的突破表明,人工智能模型正在涌现,它们可以使用不那么复杂的芯片以更少的支出实现相当的性能。受此影响,投资者抛售英伟达股票,导致该股在1月27日下跌17%,市值蒸发5890亿美元,创下有史以来最大单日跌幅。半导体设备制造商阿斯麦和其他受益于尖端人工智能硬件需求激增的公司也纷纷下跌。
深势的成功让人质疑Meta和微软等公司的大量支出——这两家公司今年都承诺投入数十亿美元或更多的资本支出,主要用于人工智能基础设施。Meta和微软的股价也开盘走低,尽管跌幅小于英伟达,投资者正在权衡这些科技巨头在人工智能投资方面节省大量资金的可能性。Meta甚至在当天晚些时候反弹收高。与深势相关的中国公司(如)的股价也上涨。一些行业观察人士认为,如果深势的突破推动OpenAI和其他美国供应商降低价格,从而刺激人工智能的更快普及,那么整个行业可能会从中受益。人工智能是美中两国在技术霸权竞争中的关键前沿。华盛顿已禁止向中国出口高端图形处理单元等设备,以阻止中国在该领域的进步。深势的进展表明,中国人工智能工程师已经克服了这些限制,专注于以有限的资源提高效率。
尽管如此,目前尚不清楚深势获得了多少先进的人工智能训练硬件。世界各地的开发者已经在尝试使用深势的软件,并希望用它来构建工具。这可能有助于美国公司提高其人工智能模型的效率,并加快先进人工智能推理的采用。反过来,这可能会迫使监管机构制定关于如何使用这些模型以及用于什么目的的规则。深势的进展提出了另一个问题,这个问题在中国公司进军国外市场时经常出现:移动应用程序收集并存储在中国服务器中的大量数据是否会对美国公民构成隐私或安全威胁?深势的模型是开源的,这使得美国用户有可能下载并在不触及中国服务器的情况下运行这些模型。
梁生于1985年广东,是一位工程学毕业生,他从未在中国大陆以外学习或工作过。他获得了浙江大学电子与信息工程专业的学士和硕士学位。根据公司数据库天眼查的数据,他以1000万元人民币(140万美元)的注册资本创立了深势。梁在接受采访时表示,进一步发展的瓶颈不是更多的融资,而是美国对获得最佳芯片的限制。他说,他的大多数顶尖研究人员都是来自中国顶尖大学的应届毕业生,他强调中国需要发展自己的国内生态系统,类似于围绕英伟达及其人工智能芯片建立的生态系统。“更多的投资不一定能带来更多的创新。否则,大公司就会接管所有的创新,”梁说。
梁被比作OpenAI创始人山姆·奥特曼,但这位中国公民保持着更为低调的姿态,很少公开讲话。从百度和阿里巴巴到腾讯和字节跳动,中国的科技领导者们已经为争夺人工智能业务的硬件和客户投入了大量资金和资源。与零一万物(01.AI)的初创公司一样,深势以其开源方法脱颖而出——旨在在开发基于大量受众的商业化策略之前,迅速招募最多的用户。由于深势的模型更实惠,它已经在帮助降低中国人工智能开发商的成本方面发挥了作用,过去一年半的时间里,更大的参与者已经参与了价格战,使得价格连续下降。像所有其他中国人工智能模型一样,深势会对在中国被认为敏感的话题进行自我审查。它会回避有关1989年天安门广场抗议活动或地缘政治问题(如中国入侵台湾的可能性)的询问。在测试中,深势机器人能够就印度总理纳伦德拉·莫迪等政治人物给出详细的回应,但拒绝就中国国家主席习近平这样做。深势的云基础设施可能会因其突然的流行而受到考验。该公司在1月27日短暂经历了中断,随着新用户和回头用户将更多查询输入其聊天机器人,该公司将不得不管理更多的流量。
分析大模型:gemma2
得分:60
原因:
文章主要报道了中国AI公司深势的突破性进展,以及其对全球科技行业的影响,整体上对中国AI技术的发展持肯定态度,并暗示了中国可能在AI领域挑战美国霸权。
原文地址:What Is DeepSeek R1? Why Has China’s AI Model Hit Nvidia, ASML, Meta Shares?
新闻日期:2025-01-28