大模型决赛,砰,枪响了

智谷趋势Trend 2025-01-20 15:44+-

2025年,大模型领域传来第一声枪响!

1月15日,科大讯飞发布了国内首个基于全国产算力平台训练的深度推理大模型——讯飞星火X1,在中文数学能力达到国内第一,并落地教育、医疗等刚需场景;

讯飞星火的底座能力也再次升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。

此外,作为国内智能翻译领域的佼佼者,科大讯飞还发布了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒。

去年12月至今,科技大厂密集更新模型,竞争也向头部收敛:更多选手退出基础大模型,转向垂直领域、AI应用。

大模型在进入“决赛圈”。这次拼的远不止是“刷榜跑分”,技术、商业化、资金等全方位较量才刚刚开始!

大模型决赛圈:90%已被淘汰

当“造神”的惊艳感泡沫般消退,大模型竞赛,显露出残酷一面。

据统计,2024年4月,国内发布的大模型产品就超过了300个。而到今天,有机会冲进决赛圈的,只有十几家。

进入决赛圈的标准是:模型具备竞争力,能支撑长期迭代,具备商业化活力。可以断言,“百模大战”画上句号,超90%模型已Game Over。

目前,决赛圈里剩下三股力量:一是阿里巴巴、字节跳动代表的互联网大厂、云服务商,介入大模型;二是科大讯飞代表的人工智能国家队,以G/B/C联动的方式,既做解决方案又做硬件产品;三是智谱、DeepSeek等AI创业公司,少数还在坚持基础模型创新。

即便“AI六小虎”,也面临道路分化。例如,百川智能已转向医疗等行业大模型;零一万物将超级大模型训练交给阿里;月之暗面和MiniMax专注做C端应用和产品。

去年底,开源模型DeepSeek V3横空出世,凭借不到600万美元训练成本、不俗的性能,被称为“AI界拼多多”。在全球火出圈并引发讨论:下一阶段的大模型,是卷性价比还是卷性能?

2025年,大模型决赛圈的选手,还能在基础大模型层创新的企业,会进一步减少。选手们要直面两道“大过滤器”:

1.能否支撑下一代基础大模型开发

下一代大模型,参数规模、算力需求量级增加,训练成本从千万美金级上升到亿美金级。抛开技术本身难度,要长期高强度投入资金、算力就是一道大过滤器。

2.能否跑出商业化模式,自我造血能力

“在商言商”,AI大模型的投入和回报目前还处于失衡,要看谁能跑出成熟、规模化盈利的模式。

李开复说,当前只有大厂能“烧”超大模型;MiniMax创世闫俊杰说,未来全球只会剩下5家大模型企业。

两道大过滤器,考验企业的实力和决心,筛出能“跑赢”竞争的选手。

科大讯飞打响的2025第一枪

这轮大模型,和之前AI技术周期截然不同。

像科大讯飞成立于1999年,是国内最早一批人工智能企业;商汤、旷视、云从、依图“AI四小龙”也已超过10年,经历过几次AI发展起落。

而从2022年底ChatGPT发布,到行业all in大模型,时间窗口只有几个月。百川智能、月之暗面、零一万物、阶跃星辰都是在2023年3-5月成立。

庞大的资金、算力、数据和人才,压缩进最短时间,转化为“超级智能”。速度,是一道生死线。大约每100天至150天,大模型就会有一次版本更新,旧模型如果失去竞争力,马上就会淘汰。

1月15日,科大讯飞发布星火深度推理模型X1,这是目前唯一在全国产算力平台上的推理模型;同时科大讯飞也升级了底座模型讯飞星火4.0 Turbo。这更新速度,距离上一次发布星火4.0 Turbo,仅用不到3个月。

在决赛圈里,科大讯飞代表的是“人工智能国家队”,肩负着与众不同的使命:

既要做到“技术顶天”,坚持大模型持续创新升级;又要“应用立地”,让AI扎根千行百业,企业用得上、用得起;还要“自主可控”,探索国产替代的第二种发展路线。

从技术角度来看,这波发布最受关注的是星火深度推理模型X1。

深度推理大模型具备深度思考和推理能力,能够进行更长链条的逻辑思考和推理。与基础模型相比,深度推理模型在解决复杂问题时,会形成更长的思维链条,从而大幅提升能力和准确度。OpenAI的o1和o3都是这个赛道的选手。

科大讯飞基于强化学习和思维链技术,来让推理模型学会“慢思考”。什么意思呢?处理复杂问题时,X1对问题进行思考、拆解、推理和反思验证,并不断重复这一链路,优化最终答案。这也更符合人类学习和思考的路径。

大模型决赛,砰,枪响了!

科大讯飞让X1参加了AIME(美国数学竞赛)、MATH 500,以及大学、中学、小升初竞赛等数学测试,并最终实现了用更少的算力,做到多项指标国内第一。

大模型决赛,砰,枪响了!

星火深度推理模型X1的快速推出,不是一蹴而就的。

科大讯飞作为国内最早布局人工智能的企业,对AI核心技术有长期积累。在ChatGPT上线仅半个月,科大讯飞就全力押入大模型,在2023年5月就发布讯飞星火大模型,并以每几个月的高频进行模型更新。

成本太高、落地有限,是目前推理模型的一大困境,而讯飞已经将X1模型结合医疗循证推理技术,落地医疗行业辅助诊断等场景。

这次全新升级的讯飞星火4.0 Turbo,全面对标OpenAI最新版的GPT-4o,在文本生成、语言理解、数学等7大核心能力全面提升,并优化长文本和图文能力,并首发了混域知识搜索技术。

大模型决赛,砰,枪响了!

讯飞星火4.0 Turo的更新,是源于不同行业龙头企业的落地诉求以及端用户的真实反馈,面向金融、能源、钢铁等企业痛点进行能力升级。

大模型决赛,砰,枪响了!

再说星火语音同传大模型,这是国内首个端到端语音同传大模型,做到最快5秒内的同传时延,达到人类专家译员水平。智能语音是科大讯飞的绝对主场,讯飞在该领域深耕20余年,2024年其牵头的“多语种智能语音关键技术及产业化”获得了国家科学技术进步奖一等奖。这是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域首个国家科学技术进步奖一等奖。

值得一提的是,从一开始发展大模型,科大讯飞就坚持源头技术的自主可控。

最近半个月,美国密集更新了AI和芯片的禁令,要彻底封堵国内获取先进算力,而科大讯飞在国产算力早已布局:

2023年10月24日,科大讯飞联合华为,发布国内首个全国产算力平台“飞星一号”;2024年10月24日,科大讯飞联合华为、合肥市大数据资产运营有限公司,打造超大规模智算平台“飞星二号”。    

这是全国产技术平台的一个典型方案。目前,讯飞星火大模型和AI产品,都是在这一全国产算力平台上进行训练,并支撑接下来AI普及后推理需求的增长。

科技领域的技术进步,过去更多的是技术开发跑在前、应用在后。而科大讯飞则是技术升级、应用落地“并跑”,与产业融合创新。

决赛圈的竞争,是从战略规划、底层技术到应用落地综合层面的竞争。科大讯飞给了业界一个“新发布范式”,抢先进入更高的维度。

谁能取胜决赛圈?

在2024年,“大模型向产业中”的浪潮里,AI已经完成了初步应用,并开始涌现规模化、深度化的趋势。

近日,国际咨询机构弗若斯特沙利文发布《2024年中国大模型行业应用优秀案例白皮书》。

报告显示,2024 年大模型在中国的产业落地明显加快,中国AI大模型市场规模已从2023年的105亿元增长至2024年的165亿元,同比增长57%,预计到2028年市场规模将达到624亿元,复合增长率为40%。  

中国拥有庞大的产业纵深、完整的供应链、丰富的应用场景,AI技术普惠落地后能推动产业升级、创新创业形态、实体经济的发展进程,带动万亿级增长。美国不断用AI、芯片等出口管制,也是试图放缓转型步调。

在去年底中央经济工作会议上,已明确提出2025的重点任务之一,就是以科技创新引领新质生产力发展,建设现代化产业体系;开展“人工智能+”行动,培育未来产业。

在2025年,AI必将深入到各行各业,我们至少会看到:一,大模型不再是大企业的专属,更多中小企业也会抓住技术红利;二,一个人靠AI开公司就能创业挣钱的超级个体也会迎来一波爆发。

市场数据显示:科大讯飞已摘得第一批果实,经受住了市场检验。

据统计,2024全年大模型相关中标项目1520个,较2023年增长了15.5倍;已披露的中标项目金额达到64.67亿元,是2023年的7.2倍。

央国企和传统行业龙头企业,如金融、政务、运营商、能源等行业,是大模型招标市场的主力军,对于技术供应商和合作伙伴的筛选标准也很严格。

中标厂商里,科大讯飞中标项目达到91个,披露中标金额84780.8万元,排名第一。从项目来看,科大讯飞是央国企的首选,在通信、金融、能源、教科、政务、医疗等行业,均取得不俗成绩,同时积累了行业经验和解决方案。

科大讯飞打造了“建算力、理数据、训模型、落场景、保安全、精运营”的全套解决方案,帮助各行各业更好落地大模型。

科大讯飞董事长刘庆峰曾表示:“为什么我们中标数量第一,而且中标比例越来越高?因为很多企业只能做到第三步即训练模型,后面的几步与我们差距很大,即使能做到,他们实际上整理数据和训练模型的能力,与我们差距也很大。”    

比如,科大讯飞跟中国海油的合作,不是说开放工具,或是调用API就好,那要怎么做?要扎根到能源生产的一线,对海上油田的安全钻井、海工制造、设备维护这些实际应用场景进行深度学习,并量身定制出“海能”人工智能模型,包含5个专业场景模型和6个通用场景模型,实现海油生产和管理的提效、增收、安全等效果。

发现了吗?这其实是抓住了企业的核心诉求:不是单纯要获取模型、算力,而是要交付解决问题的“能力”;是要真正懂行业的痛点,定制场景应用,伴随企业一起共同成长。

科大讯飞还为不同体量的企业设计了“通专结合、端云联动、软硬一体”的路径,让行业企业都能找到适合自己的大模型落地方式。

在算力和底层技术上,刘庆峰早期就提出:绝不能把大楼建在别人的院子里,全国产化的飞星一号、飞星二号平台、全栈自研的核心技术,构建了长期发展的坚实底座。

大模型决赛,砰,枪响了!

与产业共生,让科大讯飞打造出最懂行业的大模型。

奇瑞、广汽、长城、长安等七大车企,都选择应用科大讯飞进行“汽车+大模型”创新;讯飞星火大模型是交通银行、中国人保等多家银行、保险、证券机构的数字金融底座;同时,还是我们国家在代码大模型、汽车大模型、医疗大模型、金融大模型等8个行业大模型标准的联合制定单位。

大模型决赛,砰,枪响了!

示意图

目前,科大讯飞已经与央国企及20多个行业的头部企业共同研发行业大模型,覆盖300多个应用场景;在C端,打造AI助手、学习机、办公本等软硬一体的产品生态,服务超2亿用户。

科大讯飞在兑现自己的承诺:成为一个从底层算力、模型服务、工具平台、AI应用的全国产化生态;一个产业突破、科研教育、标准制定的“产学研用”一体的新质创新体。

结语

2025年,大模型竞赛围绕两条主线展开:基础模型的跃迁升级、商业化落地竞赛。

头部企业会继续洗牌,大模型落地产业孕育生态,AI应用和超级个体开始爆发。这是更加激烈,更加务实的阶段,革新与挑战并存,中国大模型“狂飙”又一年,或将在2025年迎来更为激烈的“生死战”。

很显然,在大模型决赛圈里,科大讯飞正冲向C位。