我曾对新一代人工智能图像编辑工具寄予厚望,希望能让故人重焕光彩。我的祖父在家族中以英俊著称,被誉为“冲绳的詹姆斯·迪恩”。我仅有几张他年轻时的黑白照片,希望能够借助AI技术恢复它们的昔日风采。
早期备受关注的AI图像工具主要是文本生成图像模型,用户输入提示语,如“外太空的虎斑猫”,即可获得超现实的合成图像。但最近的技术更新显著提升了各种AI应用处理现有图像的能力,避免将对象扭曲成奇怪的模样。AI的真正突破口可能不是聊天机器人,而是这些能够改变我们珍藏图像的工具。如果你曾有不满意的照片,它们承诺可以立即修复,无需重拍。它们的功能远不止美化自拍:错失团聚的家人可以被添加进来,甚至是你最喜欢的名人。品牌也可以替换模特展示的产品。
我有幸提前体验了北京生数科技(源自清华大学)的Vidu平台推出的一款“参考图像”编辑工具。遗憾的是,它仍然未能成功修复我祖父的照片,导致背景文字扭曲,甚至改变了我希望保留和增强的面部特征。但其易用性令人震惊。几秒钟内,我通过合成两张在线照片,创建了一张特朗普总统手持镶钻Labubu娃娃的图像(我要求生成习近平主席做同样动作的图像被拒绝)。该工具最多支持七张不同的参考图像,延迟出乎意料地低。即使仍有不足,其在广告和消费者领域的应用潜力也不容忽视。
Vidu并非孤例,竞争正在加剧。Alphabet Inc.的谷歌的Gemini更新引发了互联网风暴。阿里巴巴集团的Qwen平台最近也扩展了其图像编辑功能。字节跳动本周也面向国内用户推出了Doubao应用。
在我的小实验中,阿里巴巴的模型在恢复我试图修复的图像方面表现最佳。消费者需求是真实存在的。风险投资公司Andreessen Horowitz上月发布的一份报告显示,按月活跃用户计算,排名前50的生成式AI移动应用中,近一半是照片或视频编辑平台。快手科技在上月表示,预计其Kling AI视频编辑器(Vidu的竞争对手)的年度收入目标将翻一番以上。
对于长期寻求AI盈利途径的中国科技平台而言,面向消费者的图像编辑器可能证明是难以捉摸的杀手级应用,并提供最快的变现途径。然而,风险同样巨大。这些工具在执行移除照片炸弹或改变光线等良性任务时令人兴奋,但它们也具有很高的滥用潜力。我们已经进入了一个“眼见不再为实”的数字时代。但即使在六个月前,也很容易发现AI生成图像的破绽,比如多余的第六根手指。潜在的危害远不止不法分子大规模传播虚假信息或试图破坏公众对官员的信任。这项技术使得任何人的肖像,包括儿童的面孔,都无法免受令人信服的数字操纵。
中国正试图抢占先机。网络监管部门已开始颁布一项新法律,强制要求对所有在线AI生成内容进行明确的、基于元数据的标记。在一个受到严格控制的数字环境中,此类政策更容易执行,但批评人士表示,在全球互联网上监管合成内容是不可能的。在全球范围内的执行仍然是一个悬而未决的问题,对数字媒体日益增长的不信任可能在其他地方引发更严格的干预。政策制定者和科技公司有必要实施更严格的保障措施。他们可以从要求对更敏感的领域(如误导性政治内容)保持透明开始,然后在此基础上制定法规。具有强大消费者吸引力的多模态AI平台正在成为最有希望的收入驱动因素。然而,实现盈利的窗口将由监管和信任以及产品创新来定义。
不幸的是,“冲绳的詹姆斯·迪恩”的形象可能永远无法完全还原。就我而言,这些工具还不够好,无法恢复过去。但它们已经证明完全有能力扭曲现在。
分析大模型:gemma2
得分:20
原因:
文章肯定了中国AI公司在图像编辑领域的进展和潜力,以及中国在监管方面做出的努力,但同时也指出了风险。
原文地址:AI Image Editors Could Be the Killer App for China AI Firms
新闻日期:2025-09-11