**中国人工智能新星崛起,挑战DeepSeek**
全球人工智能产业格局或将迎来新的挑战者,而这一次,潜力股很可能来自中国。这个拥有14亿人口的国度,孕育着众多极具前景的AI初创企业和项目。与此同时,中国互联网巨头们也已投入多年,积极构建基础设施,为这些新兴企业提供有力支持。
随着DeepSeek的成功经验逐渐显现,人们开始重新审视对尖端、昂贵AI硬件的依赖——尤其是在美国已禁止向中国出口相关产品的情况下。这无疑为中国本土AI公司的发展带来了新的机遇。在2025年,阿里云的通义千问平台已成为领先的竞争者之一,其目标不仅是赶超DeepSeek,更要比肩ChatGPT的创造者OpenAI。日前,阿里云发布了最新的开源模型QwQ,声称其性能与DeepSeek相当,但所需数据量仅为其十分之一。另一备受关注的参与者是字节跳动及其豆包聊天机器人,该产品一度跃居iPhone下载排行榜榜首。
以下是中国冉冉升起的AI公司和服务,它们正在贸易限制下积极创新,并开发更高效的AI模型,值得我们密切关注(估值数据来自Pitchbook和彭博新闻的过往报道):
* **Moonshot:** 由前谷歌研究员、卡内基梅隆大学助理教授杨植麟创立。最新发布的模型利用强化学习加速和扩展训练过程,与DeepSeek的功能类似,采用链式思考方法寻找和完善答案。Kimi k1.5专为简短回应而设计,支持高达200万汉字的上下文。
* **智谱AI:** 发布了一系列应用程序和工具,包括一个可以模拟用户在智能手机或网络浏览器上操作的自主代理。其语音AI模型模拟人类的语调、情感和缺陷,例如语气词、停顿和偶尔的呼吸声。该公司在拜登政府执政的最后几天被美国商务部列入实体清单,进一步限制了其获取美国AI芯片的途径。清华大学将智谱AI的成功归功于其校友唐杰,唐杰的团队领导了该公司的模型开发。唐杰还曾指导过在清华大学学习的Moonshot创始人杨植麟。
* **阿里巴巴:** 在DeepSeek引起全球轰动后不久,中国电商和云计算领导者阿里巴巴便推出了最新版本的模型,并标榜其性能。阿里巴巴与腾讯共同持有榜单上大多数其他竞争者的股份,即便彼此之间存在竞争关系。在首席执行官吴泳铭的领导下,该公司正重新聚焦其核心优势,其中云计算和新兴的AI浪潮是关键组成部分。
* **字节跳动:** TikTok的母公司。到目前为止,字节跳动在AI领域还有追赶的空间,但已将AI列为首要任务。豆包采用混合专家(MoE)机器学习方法,这在中国多个AI模型中很常见。豆包凭借其诙谐、类人的对话和用户友好的界面赢得了用户的青睐。其会议总结和图像生成功能也吸引了年轻用户。
* **百川智能:** 最新的模型采用了一种名为“深度思考”的技术——一种模仿人类解决问题的复杂推理方法。它适用于文本、语言和视觉。该公司提供了一种更窄范围的循证医学模式,旨在为医疗专业人员和学者检索医疗保健研究和数据。创始人王小川在创办百川智能之前,将他的搜索引擎搜狗出售给了腾讯。
* **MiniMax:** 使用所谓的“闪电注意力”机制,有效地将极长的数据序列分解为更小、更易于管理的数据块。该模型旨在优先处理长文本中最重要的部分,而不会陷入困境。创始人闫俊杰在中国科学院获得博士学位,并在清华大学继续深造。在离开创立MiniMax之前,他曾担任商汤科技的副总裁。
* **01.AI:** 像DeepSeek一样开源,01.AI于去年10月发布了Yi-Lightning混合专家模型,在密切关注的基准测试中仅次于OpenAI和谷歌的闭源模型。这家初创公司声称其训练AI模型比行业领导者更快,并且在商业化其服务方面处于领先地位,并正在为各种行业应用构建解决方案。它宣布了与阿里巴巴的联合开发项目。
* **Stepfun:** 最新的产品是一个万亿参数的大型语言模型,也依赖于MoE技术。MoE是一种将模型划分为子集的方法,每个子集都具有处理特定类型数据或任务的专业知识,通过仅激活每个任务所需的专家子网络来帮助提高效率。首席执行官姜大鑫曾领导微软亚洲的研究工作。上海市政府支持的基金是最早的投资者之一。
分析大模型:gemma2
得分:65
原因:
文章主要聚焦中国AI公司的崛起和技术创新,积极评价了中国在AI领域取得的进展,并列举了多家具有潜力的公司和模型,表达了对中国AI未来发展的乐观态度。文章整体基调是正面的,认为中国AI有能力挑战甚至赶超国际领先水平。
原文地址:8 Chinese AI Models to Watch Out for That Are Not DeepSeek
新闻日期:2025-03-06