蒙古国AI创业公司崛起,打破中美垄断
欢迎阅读彭博社记者在全球各地带来的深度科技报道。今天,我们将关注蒙古国一家小型人工智能创业公司及其令人惊讶的本土大型语言模型开发。
《华盛顿邮报》遭遇黑客攻击:《华盛顿邮报》遭遇针对部分记者电子邮件账户的网络攻击,促使该报加强了在线安全。
WhatsApp推出广告:Meta将在其WhatsApp消息服务中开始展示广告,开辟新的收入来源,同时该公司在人工智能和其他长期项目上投入巨资。
三星的健康雄心:三星推出一个中心,供用户在就诊间隙直接与医生分享健康数据,从而加剧了技术驱动型医疗保健领域的竞争。
风险投资公司软件提供商Juniper Square融资1.3亿美元,公司估值达到11亿美元。这笔资金将用于扩张和构建该创业公司的人工智能能力。
蒙古国,一个拥有广袤草原、丰富矿产和游牧传统的国家,大胆进入了人工智能竞赛。这个小国的一家新兴创业公司已经建立了一个本土的大型语言模型,完全用其母语进行训练——这对于这个国家的技术发展来说是一个里程碑。蒙古国的人工智能新贵Egune已经跃居该国科技领域的顶峰,在一个由全球巨头主导的领域开发了基础模型。虽然公司估值3850万美元,但其崛起更多的是依靠发展势头。这家创业公司是一个异类,是少数几个能够打破生存几率、构建能够维护国家认同和主权的模型的小国人工智能企业之一,而世界正由硅谷以及最近的北京所主导。
因此,Egune上个月从该国顶级贷款机构之一的Golomt银行筹集到的350万美元意义重大。正如创始人兼首席执行官巴德拉尔·桑利格告诉我的那样,尽管蒙古国拥有蓬勃发展的创业环境,但99%的创业公司都会倒闭。
在OpenAI于2022年11月发布ChatGPT引发了全球开发和部署生成式人工智能模型和产品的竞赛几周后,Egune开始致力于一个基于蒙古语数据集训练的基础LLM。基础模型用途广泛,允许开发人员针对特定应用对其进行微调,例如编码、医学分析或客户服务。
蒙古国拥有350万人口(大约是全球开发者平台Stack Overflow上印度开发者人数的五分之一),令人惊讶地加入了主权LLM联盟。去年,该国在188个国家的网络准备指数中排名第98位,而这还是在前一年上升了11位之后。像许多其他国家一样,蒙古国已经宣布了一项国家人工智能战略,今年2月宣布其目标是到2030年成为人工智能领域的区域领导者。未来五年,该国希望培养250名人工智能专家。
在人才极度匮乏的情况下,由在德国受过培训的企业家桑利格领导的11位人工智能专家在Egune工作,他们大多是在国外受过教育的蒙古人。桑利格回到蒙古国,着手解决复杂的问题,在低资源蒙古语的自动语音识别系统和该国95%人口使用的语言的语法检查算法方面实现了96%的准确率。这些数据集在构建Egune时派上了用场。
Egune AI于2023年首次公开亮相,其模型部分使用合成数据(模仿真实世界信息的人工生成数据)进行训练,以使其更强大。去年,这家创业公司发布了一个拥有300亿参数的模型(相比之下,据估计OpenAI拥有超过1万亿个参数),该模型仅用96个图形处理单元(GPU,驱动人工智能工作负载的关键芯片)训练了8周的时间。
几周前,这家创业公司发布了最新的通用LLM,拥有700亿个参数,通过添加公开的国际数据集构建而成。该模型在蒙古语的语法和语义方面优于ChatGPT,在广泛的任务中提供了更好的准确性。
Egune的崛起并非没有障碍,其中最主要的是GPU的稀缺——这是人工智能训练的命脉。该公司拥有128个令人垂涎的Nvidia Corp. H100芯片,拥有蒙古国最大的此类计算集群,但这只是Alphabet Inc.的Google和OpenAI等公司所拥有的容量的一小部分。蒙古国只有两个数据中心——另一个规模较小的集群位于桑利格的母校蒙古科技大学内。
Egune仍然需要说服公众它确实建立了一个本土模型。许多人认为它的努力只是OpenAI的GPT或Meta Platform Inc.的开源Llama的修改版本。具有讽刺意味的是,该团队发现,为蒙古语微调经过英语训练的Llama比从头开始更难——进展缓慢,数据需求飙升,计算成本增加。事实证明,通往真正本土人工智能的道路绝非捷径。
然而,最近的融资增强了Egune的可信度。它现在正在构建各种产品,并拥有数千名付费用户,包括政府组织。该模型为占总人口95%的人口所说的Khalkha语中的语言聊天机器人Eva提供支持,从而实现了电信运营商Mobicom和领先贷款机构Golomt Bank的客户支持自动化。所有这一切都发生在主权人工智能作为人工智能行业的一个主要主题出现之际,这已成为全球各国的一个国家优先事项,这些国家的政府希望医疗保健和金融服务等关键行业由其境内的AI系统控制和运营。随着美国和中国在人工智能领域的主导地位的后果越来越明显,各国希望控制数据、叙事和关键基础设施。
最近发生的事件凸显了这些风险。OpenAI切断了中国和俄罗斯等国家对其模型的访问。中国利用国家控制的人工智能模型来审查信息,例如删除对天安门广场的提及,这引起了人们对嵌入式控制的警惕。当中国人工智能巨头阿里巴巴集团控股有限公司、字节跳动有限公司和腾讯控股有限公司采取措施防止中国竞争激烈的“高考”期间出现违规行为时,非洲的许多人工智能工具停止运行,引发了对主权人工智能的呼吁。
Egune和蒙古国的未来道路是艰难的。基础系统需要强大的数字基础设施才能扩展。例如,Egune已经达到了其推理能力(人工智能模型的运行)的上限,客户正在等待名单中。本土模型必须解决实际应用问题,例如通过人工智能监控来改变传统的畜牧方式,以及构建预测性人工智能模型,以提高气候适应能力,同时维持游牧传统。
桑利格认为每个国家都应该拥有主权人工智能。他说,否则,我们将生活在一个充满不平等的世界里。因此,他主动提出帮助像邻国哈萨克斯坦这样的国家建立自己的模型。
科技和娱乐领域当天阅读次数最多的故事:唐纳德·特朗普的家人推出了一项特朗普品牌的移动电话服务,该服务将依赖于“美国制造”的无线网络和硬件。目前尚不清楚他们将从哪里采购大量完全在美国制造的硬件。世界上主要的手机制造商中,很少有(如果有的话)完全在该国大规模组装设备。
1X Technologies首席执行官Bernt Børnich加入了彭博科技,讨论该公司的新模拟器,以帮助其人形机器人Eve在物理世界中学习运动。以及更多彭博科技新闻通讯。
分析大模型:gemma2
得分:10
原因:
文章报道蒙古国AI公司在打破中美垄断方面取得的进展,并提及中国AI公司在非洲引发的问题,侧面衬托了中国AI发展的一些挑战,略带正面情绪。
原文地址:Tiny Startup Brings Homegrown AI to Mongolia, Avoiding China-US Dominance
新闻日期:2025-06-17