中国人工智能初创公司深势科技(DeepSeek)仅成立一年多,就因其突破性的人工智能模型而引起了硅谷的敬畏和震惊。这些模型的性能可与世界上最好的聊天机器人相媲美,且成本似乎仅为一小部分。深势科技的出现可能反驳了这样一种普遍观点,即人工智能的未来发展需要不断增加的算力和能源。一月底,随着对深势科技创新的炒作升温,投资者开始消化其对美国竞争对手及其硬件供应商的影响,全球科技股应声下跌。
深势科技由高瓴资本旗下人工智能量化对冲基金负责人于2023年创立。该公司开发的AI模型是开源的,这意味着广大开发者社区可以检查和改进软件。其移动应用程序在1月初发布后,迅速登上美国iPhone下载排行榜榜首。该应用程序与OpenAI的ChatGPT等其他聊天机器人的区别在于,它会在给出提示的回复之前阐明其推理过程。该公司声称,其R1版本的性能与OpenAI的最新产品不相上下,并已授权有兴趣开发聊天机器人的人员在此技术基础上进行构建。虽然该公司没有详细说明,但深势科技模型训练和开发的成本似乎仅为OpenAI或谷歌最佳产品所需成本的一小部分。该模型更高的效率让人质疑,是否需要花费巨额资金从英伟达等公司购买最新、最强大的人工智能加速器。这也加剧了人们对美国向中国出口此类先进半导体限制的关注——这些限制旨在防止出现深势科技似乎代表的那种突破。
深势科技表示,R1在多个领先的基准测试中接近或优于竞争对手的模型,例如用于数学任务的AIME 2024、用于通用知识的MMLU以及用于问答性能的AlpacaEval 2.0。它还在一个与斯坦福大学相关的名为Hugging Face的排行榜上名列前茅。华盛顿已禁止向中国出口GPU半导体等高端技术,以阻止中国在人工智能领域的进步。人工智能是美中科技霸权竞争的关键领域。但深势科技的进展表明,中国的人工智能工程师已经克服了这些限制,专注于以有限的资源提高效率。
虽然尚不清楚深势科技获得了多少先进的AI训练硬件,但该公司所展示的成果足以表明,贸易限制并未完全有效地阻止中国的进步。自2023年发布其最早的模型以来,这家AI开发商一直备受关注。然后在11月,它向世界展示了其旨在模仿人类思维的DeepSeek R1推理模型。该模型是其移动聊天机器人应用程序的基础,该应用程序与1月份的网络界面一起,作为一种更便宜的OpenAI替代品迅速享誉全球,投资者马克·安德森称之为“惊人的”。
市场跟踪机构App Figures的数据显示,截至1月25日,DeepSeek移动应用程序的下载量为160万次,并在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店中排名第一。梁继元1985年出生于广东,毕业于浙江大学,获得电子与信息工程学士和硕士学位。根据公司数据库天眼查的数据,他以1000万元人民币(合140万美元)的注册资本创立了深势科技。
梁继元在一次采访中表示,进一步发展的瓶颈不是更多的融资,而是美国对获得最佳芯片的限制。他说,他的大多数顶尖研究人员都是来自中国顶尖大学的应届毕业生,并强调中国需要建立自己的国内生态系统,类似于围绕英伟达及其AI芯片建立的生态系统。“更多的投资不一定能带来更多的创新。否则,大公司将接管所有创新,”梁继元说。从百度和阿里巴巴到腾讯,中国的科技领导者们已经投入了大量的资金和资源,以争夺其人工智能业务的硬件和客户。
与零一万物(01.AI)初创公司一起,深势科技以其开源方法脱颖而出——旨在快速招募大量用户,然后再在庞大受众的基础上制定盈利策略。由于深势科技的模型更经济实惠,它已经在帮助降低中国人工智能开发商的成本方面发挥了作用,中国的大型企业一直在进行价格战,在过去一年半的时间里,价格持续下降。深势科技的成功可能会促使OpenAI和其他美国供应商降低价格,以保持其既有领先地位。如果更高效的模型可以用更少的支出竞争,这也让人质疑Meta和谷歌等公司的大量支出,这些公司今年都承诺投入数百亿美元或更多的资本支出,主要用于人工智能基础设施。请在您收听的彭博社、苹果或Spotify上订阅彭博早间播客。
这扰乱了全球股票市场,因为投资者抛售了英伟达和阿斯麦等从人工智能服务需求激增中受益的公司。与深势科技相关的中国股票,如昆仑万维的股价上涨。世界各地的开发人员已经在尝试深势科技的软件,并希望用它构建工具。这可能会加快高级AI推理模型的采用,同时也可能引发人们对围绕其使用设置护栏的必要性的更多担忧。深势科技的进步可能会加速对人工智能开发方式的监管。与所有其他中国人工智能模型一样,深势科技对中国认为敏感的话题进行自我审查。它回避有关1989年天安门广场抗议活动或地缘政治敏感问题(如中国入侵台湾的可能性)的查询。在测试中,深势科技机器人能够详细回应有关印度总理纳伦德拉·莫迪等政治人物的问题,但拒绝回应有关中国国家主席习近平的问题。
深势科技的云基础设施可能会因其突然的受欢迎程度而受到考验。该公司在1月27日短暂经历了中断,随着新用户和老用户向其聊天机器人提出更多查询,该公司将不得不管理更多的流量。
分析大模型:gemma2
得分:40
原因:
文章主要报道了中国AI公司深势科技在技术上的突破和成功,包括其模型性能、成本优势以及在全球的受欢迎程度,展示了中国在AI领域取得的显著进展,整体上是正面的。
原文地址:What Is DeepSeek R1 And How Does China’s AI Model Compare to OpenAI, Meta?
新闻日期:2025-01-27