从股市交易员到人工智能新星,深势科技的崛起之路

两年前,当百度和阿里巴巴等中国科技巨头还在竞相模仿硅谷的人工智能技术,并推出各种引人注目的公告和聊天机器人时,深势科技却选择了另一条道路:专注于研究。而这项策略最终得到了回报。

这家中国初创公司声称,他们开发出了一种强大的人工智能模型,其构建成本远低于其资金更雄厚的美国竞争对手,这让科技界为之震惊。在美中两国争夺人工智能主导地位的竞争中,深势科技似乎横空出世。事实上,近年来,它以一种非传统的方式在中国科技界迅速崛起。

深势科技的使命是追求研究,这与2022年秋天在美国人工智能领域留下印记的硅谷公司OpenAI相似。但相似之处也仅限于此。深势科技的起源是金融,而非纯粹的科技。它的母公司,一家名为高瓴资本的中国对冲基金,最初并非像OpenAI那样致力于保护人类免受人工智能威胁的实验室,而是一家利用人工智能在中国股市进行投资的公司。

高瓴资本通过利用中国散户投资者主导的市场而蓬勃发展,这些散户投资者以冲动地买卖股票而闻名。2021年,高瓴资本发现自己受到了中国对投机交易的监管打击的压力,北京当局认为这与他们保持市场稳定的努力背道而驰。

因此,高瓴资本开始寻求新的机遇,并表示这更符合中国政府的优先事项:先进的人工智能。“我们希望做更有价值的事情,以及超越投资行业的事情,但它被误解为人工智能股票投机,”高瓴资本首席执行官陆正哲在2023年告诉中国官方媒体。“我们已经成立了一个独立于投资的新团队,这相当于第二次创业。”

深势科技由此诞生。与许多其他中国初创公司一样,深势科技以不同的商业模式进入了一个成熟的市场。

据信,深势科技最新的人工智能模型几乎与美国竞争对手一样强大,但效率却高得多。它的成功表明,硅谷在人工智能领域的领先地位已经缩小。尽管华盛顿努力限制中国获得人工智能所需的高级芯片,但深势科技的突破引发了人们对这些控制措施长期有效性的质疑——尽管深势科技的创始人承认芯片限制是一个限制因素。

深势科技并没有依赖面向消费者的AI产品来获取收入,直到本月才发布了首个聊天机器人,允许任何人通过简单的命令生成文本和照片。相反,该公司利用高瓴资本从股票交易中赚取的资金来资助雄心勃勃的研究。这种做法使其与美国竞争对手区分开来,后者最终都是消费科技公司。

这种非传统的方法也让深势科技得以避开中国政府对公众使用人工智能的严格监管。由于其重点是研究和向使用其模型的企业销售(并且直到本月发布聊天机器人之前,并非面向消费者应用),其早期工作并没有触发同样的政府限制。

深势科技由首席执行官梁文峰领导,他是一位戴着眼镜的瘦削工程师,曾在杭州的浙江大学学习。他在为数不多的几次中国媒体采访中多次表示,为了赶上美国的创新,中国公司必须把研究放在利润之前。深势科技和高瓴资本没有回应置评请求。

他在接受中国科技媒体36氪的广泛采访时说,中国科技公司“缺乏的创新肯定不是资本,而是缺乏信心和如何组织高密度人才来实现有效创新的知识”。

据采访和公开资料显示,那些与梁先生合作过的人形容他是一位具有深厚技术背景的优秀管理者。“他绝对是一个INTP,”曾参与早期深势科技模型工作的计算机工程师王子涵说,他指的是迈尔斯-布里格斯测试中的一种内省型人格,这是中国年轻人中流行的人格测试。“INTP是非常好的研究人员,他们有探索的意愿,”王先生说。“他不是那种想控制一切的人。”

王先生说,梁先生不太在意项目时间表等细节,偶尔会向整个研究团队发送发人深省的研究问题。但总的来说,梁先生似乎是出于推动技术进步的动力,而不是专注于利润。

与许多倾向于聘请程序员的中国公司不同,梁先生因雇用计算机领域以外的人而声名鹊起。深势科技的员工中有来自中国顶尖大学的诗人和人文学科专业人士,他们训练模型撰写中国古典诗歌,并回答中国高考中的难题。

“团队中的大多数人毕业于中国顶尖大学,”旧金山Baseten公司的首席软件工程师张一能说,他正在从事SGLang项目,该项目不是深势科技的一部分,旨在帮助人们在深势科技的系统之上进行构建。“他们非常聪明,而且非常年轻。”

多年来,中国科技公司在计算机视觉(如面部识别)中使用的人工智能应用方面处于领先地位。但OpenAI的ChatGPT的发布引发了一场反思。当没有一家中国公司立即发布任何可与之匹敌的产品时,许多人得出结论,美国公司在先进人工智能领域处于领先地位。

在中国,计算机科学家决心证明他们可以与之竞争。2023年,中国许多公司发布了自己的大型语言模型,这是ChatGPT等聊天机器人的基础技术。

但是,制造先进模型需要使用大量芯片,这将花费数亿美元。

高瓴资本也在花钱。到2021年,它成为少数几家能够储备超过10,000个先进的Nvidia A100芯片的中国公司之一。

然而,深势科技的研究给它带来了令人惊讶的优势。去年,它大幅降低了使用其模型构建应用程序的开发人员的收费,从而引发了与大型竞争对手的价格战。

曾在深势科技工作的工程师王先生说,他们所构建的技术很少讨论商业应用。相反,他说,该公司专注于创建一个可供各种人用于多种用途的人工智能系统。

“我在那里的时候,我们没有过多谈论如何赚钱,”王先生说。“他们只是专注于创建一个伟大的基础模型。”

深势科技受欢迎的一个关键部分是它公开了其开发人员的工作。这种信息共享(称为开源)一直是计算机软件、互联网以及现在人工智能发展的基石。

在美国,人工智能研究人员和企业家长期以来一直关注深势科技的技术进展。去年,该公司发布了旨在生成自己计算机程序的系统,引起了人们的关注。

该公司的新挑战可能来自其新的高调。就在上周发布其新聊天机器人背后的模型R1的同一天,梁先生出席了与中国总理李强举行的圆桌讨论会。

联邦资助的智库兰德公司(RAND Corporation)的技术分析高级顾问吉米·古德里奇说,深势科技的突然流行使其成为中国共产党刺激创新努力的中心,这可能难以管理。“这对深势科技来说是一个巨大的困境。我敢肯定他们不在政府的五年计划中,”他说。

“当党和全世界都在关注时,他们能否保持这种混乱的、无忧无虑的愿景?”


分析大模型:gemma2
得分:60
原因:

文章主要以正面视角报道了中国人工智能公司深势科技的崛起,突出了其技术创新、研究投入和取得的成就,以及其在人工智能领域对美国竞争对手的挑战,整体基调是积极和赞赏的。

原文地址:How DeepSeek Went From Stock Trader to A.I. Star
新闻日期:2025-01-28

Verified by MonsterInsights