**DeepSeek神秘创始人梁文锋:中国AI崛起的幕后推手**

尽管中国人工智能初创公司DeepSeek在全球范围内引起了广泛关注,但其背后的关键人物——梁文锋却鲜为人知。在彭博社《亚洲商业评论》的最新一期播客中,主持人与彭博社记者Saritha Rai深入探讨了这位带领DeepSeek走向人工智能前沿的科技创始人,以及该公司的崛起对中美人工智能竞争格局的影响。

**梁文锋:神秘的AI领军人物**

今年早些时候,DeepSeek推出的一款新产品震惊了全球,并引发了华尔街的震动。然而,尽管DeepSeek备受瞩目,但关于其创始人梁文锋的信息却十分有限。Saritha Rai表示,梁文锋是一位极其低调且难以接近的科技企业家。为了了解他的真实面貌,记者们查阅了大量资料,甚至在其公司网站上都难以找到他的照片。最终,梁文锋在一次与中国国家主席习近平的高调会面中公开露面,才得以让外界一窥真容。

据Saritha Rai描述,梁文锋身材偏瘦,戴着眼镜,不善言辞,略显稚气。DeepSeek公司很少回应有关梁文锋的提问,理由是保护其隐私。但Saritha和她的同事们对这位颠覆科技界的神秘人物充满了好奇,因此他们采访了数十位熟悉他工作的人,包括前员工、研究人员、投资者和业内人士。

通过这些采访,记者们了解到梁文锋虽然低调内向,但极富才华和激情,并肩负着让中国在人工智能领域占据领先地位的使命。他希望确保中国在人工智能领域拥有一席之地,改变中国长期以来被指责为“山寨”的形象。

**从量化金融到人工智能**

梁文锋现年约40岁,出生于广东省的一个小村庄。他的父母都是小学教师。他从小就展现出过人的天赋,并先后在浙江大学完成了本科和硕士学业。在浙江大学期间,梁文锋和他的朋友们沉浸在科技的世界里,学习机器学习、信号处理和电子工程等技术。他们甚至开发了用于在金融危机期间进行股票交易的程序。毕业后,梁文锋与两位同学共同创立了一家名为“高频量化”的对冲基金。

据Saritha Rai介绍,量化基金主要利用数学模型和统计分析进行股票交易,无需人工干预决策。高频量化在其鼎盛时期管理着约140亿美元的资产,规模相当可观。该公司表现出色,年化回报率平均达到35%。

据前员工透露,高频量化拥有极客般的创业文化。早期的招聘广告声称,该公司吸引了来自谷歌和Facebook的顶尖人才,并寻找具有“古怪才华”的数学和编程“极客”。早期的招聘信息还提到了美剧《生活大爆炸》中的主角谢尔顿,该公司希望能够营造出一种极客、书呆子的文化氛围。

在公司里,员工可以享用免费零食,参加扑克游戏之夜,穿着T恤和拖鞋上班。这种非传统的创业文化与阿里巴巴和腾讯等中国大型科技公司截然不同。

在OpenAI推出ChatGPT后不久,梁文锋宣布成立DeepSeek,并在其早期宣言中表达了拒绝平庸、挑战人工智能领域重大难题的决心,最终目标是破解通用人工智能。该宣言还阐述了DeepSeek的雄心壮志——将中国定位为尖端技术的领导者。梁文锋在为数不多的两次采访中都曾表示,他希望将中国的人工智能生态系统推向世界前沿,改变中国长期以来被指责为“山寨”的形象,走出一条不同寻常的道路。

**DeepSeek的突破与挑战**

DeepSeek发展迅速。自2023年以来,该公司已发布了六款以上的人工智能模型,并率先采用了一种名为“稀疏性”的技术,使这些模型能够以更高的效率进行训练和运行。开发人员开始注意到DeepSeek的实力。今年早些时候,DeepSeek发布了其推理模型R1,在业界引起了巨大的轰动,并导致了价值数万亿美元的股市暴跌。这时,全球开始关注这位来自中国的神秘人工智能企业家。

Saritha Rai表示,DeepSeek的R1模型具有开创性的意义。长期以来,人工智能行业一直需要投入数十亿美元来构建基础设施、数据中心和用于训练模型的数据中心图形处理单元。但DeepSeek证明,其模型在某些基准测试中可以与OpenAI或Anthropic的最新模型相媲美,甚至超越它们,而且所需的计算能力、资源和资金都更少。

在芯片出口管制的大背景下,DeepSeek的成功也迫使中国的开发者们开发替代方案。Saritha Rai认为,需求是创新的动力之母。中国的人工智能开发者们已经证明了这一点。尽管面临出口限制,他们仍然构建了可以与世界上最好的模型相媲美的优秀模型。

DeepSeek最具创新性的方法之一是前面提到的稀疏性技术。稀疏性是指在不具备高端计算能力的情况下构建模型。这意味着大型语言模型不必完全被利用来回答查询。相反,梁文锋和他的同事们试图将模型的专业知识分配到更小的专家组中,然后只利用那些需要使用的组。通过这种方式,他们提高了计算效率,也提高了成本效益。

DeepSeek表示,其V3模型的训练成本仅为560万美元,远低于OpenAI在其最先进的ChatGPT版本上花费的估计1亿美元。尽管如此,DeepSeek的创新和开源模式也引发了关于人工智能发展方向以及中美科技竞争的深刻思考。

DeepSeek的成功无疑为中国人工智能的发展注入了新的活力,但也面临着诸多挑战。未来,DeepSeek将如何保持其领先地位,又将如何应对来自国内外竞争对手的挑战?这些问题都值得我们拭目以待。


分析大模型:gemma2
得分:60
原因:

文章主要介绍了中国AI公司DeepSeek及其创始人梁文锋的崛起,以及该公司在技术创新和推动中国AI发展方面所做的努力。文章强调了DeepSeek在AI模型训练成本方面的优势,以及其开源模式对全球AI生态系统的积极影响。作者对DeepSeek的技术实力和发展前景持乐观态度。

原文地址:Who Is the Mysterious Founder of ChatGPT Rival DeepSeek?: Podcast
新闻日期:2025-05-21

Verified by MonsterInsights