中国量化奇才在对冲基金溃败阴影下创建了DeepSeek。
三年前,一家量化对冲基金公司在动荡的中国股市中亏损,向投资者深表歉意。对于浙江高飞资产管理公司来说,这是一个令人惊讶的挫折,该公司利用人工智能选股,并迅速发展成为中国最大的量化基金之一。当该公司经历这段时期,其资产从超过120亿美元的峰值缩水超过三分之一时,梁先生在幕后为一家新的AI初创公司奠定了基础,该公司名为DeepSeek。DeepSeek从高飞公司发展而来,现在正威胁着颠覆全球人工智能供应链,并挑战美国在关键前沿人工智能技术领域看似不可动摇的领先地位。
这家成立仅20个月的公司突破性技术及其同名应用程序的突然出现,引发了周一美国和欧洲股市的大规模抛售,芯片巨头英伟达和其他同行公司的市值总计蒸发了近万亿美元。这也让人们对梁先生如何完成如此壮举感到震惊和敬畏,他是一位工程学毕业生,从未在中国大陆以外学习或工作过。他证明了,凭借本土人工智能工程师、有限的半导体技术和有限的资源,有可能匹敌甚至超越该领域最优秀的人。
旧金山人工智能初创公司Reken的联合创始人兼首席执行官表示:“如果他们能够获得人才并能够投入工作,世界上的每个国家都可能开展类似的项目。其余的行业将从中学习。”现在困扰投资者、公司和政策制定者的问题是,人工智能是否需要数百亿美元的资本支出才能推出最新的创新和前沿人工智能模型,以及出口管制是否能够阻止中国竞争。
梁先生被比作OpenAI创始人山姆·奥特曼,但这位中国公民保持着低调的姿态,很少公开露面。“OpenAI不是神,不可能永远处于最前沿,”梁先生在2024年7月告诉中国媒体36氪。前一年,梁先生表示,更多的投资不一定会带来更多的创新。他还表达了中国企业长期以来大多是追随者而非技术创新者的看法。他说,问题在于“缺乏信心,不知道如何组织高密度人才来实现有效的创新”。
梁先生于1985年出生于中国南部广东省经济落后的湛江市。他的父亲是一名小学教师。他曾在杭州一所著名大学学习电子工程,并在那里获得了信息与通信工程硕士学位。高飞公司在中国量化行业中是一个异类,而DeepSeek在全球人工智能行业中也是如此。梁先生和他的两位大学同学在2008年开始涉足国内股市。与大多数中国量化基金的创始人不同,他们都没有海外或机构交易经验。三人尝试了从自主交易到套利的不同策略,然后在2015年开始采用系统性方法来实施交易理念,并在同一年成立了高飞公司。他们最初建立了一个基于价格和成交量因素的模型,然后在2016年尝试机器学习。其首席执行官西蒙·陆在2020年的一次采访中表示,新工具使该公司能够更深入地挖掘,找到新的因素,并识别因素之间的“非线性”联系。
创始人于2018年将机器学习整合到高飞公司的产品中。根据该公司2020年的一份宣传册,人工智能使高飞公司实现了“大量创新”,并开发了一种多策略、多周期的投资模式,以“积累”来自不同回报来源的回报。其以沪深500指数为基准的旗舰产品整合了日内交易等低风险策略,使其在过去三年中跑赢该指数120个百分点。
高飞公司的资产因此迅速增长,在2021年达到900多亿元人民币,之后在当年晚些时候遭遇挫折。2021年12月,在高飞公司的一些基金经历了创纪录的回撤后,该公司表示,其人工智能在某些交易中时机不佳,并且在股市大幅波动期间表现不佳。“我们感到非常抱歉,”该公司告诉投资者。该公司还停止接受新的资金流入,并表示将减少其资产管理规模并调整其策略。三个月后,其营销主管警告说,某些对波动敏感的客户应该撤回他们的资金,这是一个非常不寻常的举动。去年,高飞公司表示,将逐步停止那些对市场进行双向押注的产品,并将重点转向“仅做多”策略,即只对股票采取看涨头寸。其资产管理规模已降至约600亿元人民币。
梁先生此前曾表示,DeepSeek的研究是由高飞公司的研发预算资助的。它从这家量化基金中获得了计算资源,该公司在2021年美国禁止出口先进的英伟达芯片和其他图形处理单元之前,积累了10000个英伟达GPU。梁先生几乎完全从中国招聘工程人才。许多人是顶尖大学的应届毕业生、博士学位的最后阶段实习生和奥林匹克奖牌获得者。“他是一个书呆子,但在这个语境下,书呆子并不是一个贬义词,”在2024年在DeepSeek实习了六个月的博士生王紫涵说。王紫涵说,梁先生自己做了很多实验,DeepSeek的运作方式很像一个研究实验室。“它起初很小,但随着他们取得真正的进展,他们开始兴奋起来,”他说。
这家初创公司开始定期发布模型,似乎不受美国禁止出口尖端人工智能加速器芯片的影响,甚至受到了刺激。DeepSeek于1月20日发布了其R1高级人工智能推理模型,同一天,唐纳德·特朗普宣誓就任美国第47任总统。在那周一早些时候,梁先生在北京参加了由中国国务院总理李强主持的闭门商务研讨会。据官方新华社报道,技术、科学、教育和其他领域的专家在那里为一份政府工作报告草案提供了他们的意见和建议。YouTube上的视频显示,梁先生坐在李强对面讲话,中国领导人认真地听着。值得注意的是,DeepSeek开源了其R1模型,允许研究人员和开发人员自由使用、修改和商业化该模型。这发出一个信号,表明它希望与全球人工智能社区中的其他人合作和创新。
马萨诸塞州梅德福塔夫茨大学技术政策助理教授曹启桐表示,梁先生在中国企业家中脱颖而出,因为他具有非商业目标,专注于研究和实现通用人工智能。根据彭博亿万富翁指数的比较分析,假设梁先生拥有高飞公司51%的股份,这将使他持有价值7100万美元的股份。如果DeepSeek达到与OpenAI相同的潜力(估值约为1500亿美元),那么这位创始人可能会获得巨额财富。
有些人质疑梁先生的DeepSeek是否像看起来那样有前途。缺点包括该初创公司的基础设施是否能够处理等待尝试其服务的全球流量,或者该应用程序如何处理敏感主题,例如1989年天安门广场的抗议活动以及有关中国领导人习近平的查询。专家们还质疑DeepSeek是否使用了10000个A100英伟达芯片进行构建的假设,例如Dylan Patel等分析师推测,DeepSeek至少需要50000个英伟达功能更强大的芯片H100。例如,Meta运营着相当于600000个英伟达H100。
尽管如此,梁先生正在促使全球人工智能生态系统进行反思和重新校准。数据分析和人工智能平台Databricks的首席执行官Ali Ghodsi表示,很明显,“人工智能竞赛的胜利者不会是创造最复杂模型的人,而是将人工智能嵌入到业务系统中以产生切实经济价值的人。”
分析大模型:gemma2
得分:60
原因:
文章主要描述了中国工程师梁先生如何克服困难,创建了DeepSeek这家具有全球竞争力的AI公司,并对美国科技公司的领先地位发起了挑战,同时强调了中国在人工智能领域的创新能力,整体基调积极向上,对中国持正面态度。
原文地址:Chinese Quant Whiz Built DeepSeek In The Shadow Of a Hedge Fund Rout
新闻日期:2025-01-28