大模型竞争激烈,企业用户如果没有练就一双“火眼金睛”,很有可能踩坑,从而造成项目烂尾的后果。

国外GPT-3.5发布不到一年,国内文心一言发布不到半年,国内已经快进到“百模大战”。入局者既有大厂,也有大量初创公司。然而,大模型竞争激烈,企业用户如果没有练就一双“火眼金睛”,很有可能踩坑,从而造成项目烂尾的后果。

一些大厂的大模型,例如文心大模型、通义千问、盘古大模型等,正在逐渐拉开差距。SuperCLUE最新测评榜单显示,文心一言已经超越GPT-3.5turbo,GLM-130B等国产大模型也在榜单前列。国内大模型从数量来看已成世界重要一极,从质量来看也在迅速追上最先进的GPT-4。

“百模大战”的背后,业界均看好大模型技术创新推动产业数字化,创造万亿级的市场价值。从当下来看,以文心一言、通义千问为代表的“大厂出品”大模型,在技术层面占据着优势地位,在市场层面也通过构建产业生态,赢得了更多项目合作。

为何相比初创公司,大厂出品的大模型更加强大、更受客户青睐?在笔者看来,主要有三个原因:

首先,大模型最终要落地到行业场景应用,不是简单的“一锤子买卖”。大厂作为更加稳定、安全、可靠的象征,普遍在AI技术底座方面有着充足的积累。企业客户往往聚焦于应用层面,不一定具备很强的底层AI技术积累。百度、阿里巴巴、华为等大厂已经打造了备受实战考验的AI底座,反观初创公司,不乏技术创新的亮点于突破,但从全栈AI技术底座积累和长期、稳定服务客户角度来看,综合能力于续航水平尚且存疑。

其次,大厂有更强的综合实力投资大模型技术迭代开发。例如百度能够调动全集团之力开发文心一言,最新迭代的文心大模型3.5,相比3.0版本,推理速度提升17倍,模型效果提升超过50%。反观风头最劲的初创公司光年之外,不到半年就选择了“卖身”美团。一些基于开源技术开发的大模型,缺乏足够的底层技术积累和自主演进能力。

据市场研究公司IDC最新发布的《AI大模型技术能力评估报告,2023》报告显示,百度文心大模型3.5拿下12项指标的7个满分,包括“算法模型”、“行业覆盖”两个关键指标,综合评分第一;排名第二的阿里巴巴通义大模型则在11项指标中获得6项满分,是唯一一家“服务能力”满分的厂商。

第三,大模型落地行业场景,后续的服务交付、运维等,对大厂而言是“驾轻就熟”,对初创公司则是艰难挑战。大厂则能够对垂直行业、重点客户配备专属服务团队,免除客户拥抱新技术的后顾之忧,而初创公司往往缺乏服务政企客户的经验积累,基于开源技术开发的大模型产品应用,要做好全流程服务是勉为其难。

综上,大模型不仅看各种技术参数,更在于行业落地应用,看行业“Know-how”和成功经验。大厂出品无论是技术开发、行业应用和服务,当下都占据着优势地位。当然,“百模大战”也许不是十几年前的“百团大战”,最后只有2个胜利者。大模型还在发展初期,后续还有更多可能性,包括超越GPT-4以及更多欧美竞品的可能性。

Loading

作者 yinhua