责编:陈凯欣
2025-03-25
近期,蚂蚁集团在AI领域持续发力。此前,阿里巴巴宣布全面向AI转型后,作为阿里生态的重要组成部分,蚂蚁集团也在AI技术研发方面动作频频。
针对近日有关蚂蚁百灵大模型训练成本的讨论,蚂蚁集团表示已通过多种芯片调优显著降低了AI应用的成本,并计划将相关技术开源共享。其最新研究论文显示,公司推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)和百灵增强版(Ling-Plus)。其中,轻量版模型参数规模为168亿,而增强版则高达2900亿。实验数据显示,3000亿参数的MoE大模型能在国产GPU等低性能设备上实现高效训练,其性能表现与英伟达芯片支持下的同类型模型持平。
尽管包括DeepSeek、阿里通义千问在内的多款AI模型在特定任务中表现出色,但MoE模型普遍需要高性能计算资源支持。而蚂蚁团队选择了一条不同的技术路线——不依赖高级GPU进行模型扩展。通过在训练环境优化、硬件适配等多维度的技术攻关,成功将低规格硬件的训练成本降低了20%,使原本635万元的1万亿token预训练成本降至约508万元。
目前,蚂蚁百灵大模型已在生活服务、金融服务和医疗健康等多个场景实现应用落地。其开发团队计划通过开源的方式开放Ling-Plus和Ling-Lite两款模型的技术能力。
在AI技术的商业化落地方面,蚂蚁集团近期动作频频。3月21日,公司对外发布了全新的AI产品体系升级方案,重点围绕医疗机构、医生和用户三个端点展开布局。面向医疗机构,推出了"蚂蚁医疗大模型一体机";针对好大夫在线平台上的29万注册医生群体,提供了AI医生助手工具;同时,面向终端用户推出的"AI健康管家"也增加了十余项智能服务功能。
此外,蚂蚁集团还在积极探索具身智能和AI眼镜等前沿技术领域。招聘信息显示,公司正在招募具备相关经验的AI眼镜产品专家。这些举措表明,蚂蚁集团正在加速布局消费级AI硬件市场。
值得一提的是,蚂蚁集团已在上海设立专门从事具身智能和机器人业务的研发实体——上海蚂蚁灵波科技有限公司。该公司将重点围绕家庭、养老、医疗健康等场景,推动人形机器人和具身智能技术的创新发展,助力上海浦东新区打造具有行业影响力的创新产业生态。