CNBC报道称,中国想在AI领域成为统治者,这种尝试可能已经获得回报。一些美国AI业内人士和科技分析人士认为,中国AI模型已经相当流行,从性能角度看,中国的一些模型与美国产品齐头并进,甚至超越。
由于无法采购美国先进AI芯片,中国只能寻找其它办法增强AI模型性能,比如依赖开源技术,开发自主软件和芯片。
OpenAI ChatGPT是基于闭源模型开发的,但中国的许多企业选择了开源LLM。查看Hugging Face平台,下载最多的LLM有许多来自中国企业,其中阿里巴巴Qwen(通义千问)热度最高,深度求索的DeepSeek也备受推崇。
阿里Qwen、DeepSeek等中国大模型受追捧
Hugging Face机器学习工程师Tiezhen Wang告诉CNBC:“从评测基准看,Qwen的性能极为出色,这是它快速流行的主要原因。”还有,Qwen的授权模式比较友好,企业使用时法律评估没有那么复杂。
阿里巴巴给Qwen分了级,有的参数很多,更强大,但算力要求高,运行成本也高,如果是参数少的小模型,运行成本更低。
Tiezhen Wang说:“不管你选择什么规模的模型,Qwen都可能是现今性能最棒的模型之一。”
DeepSeek也成为耀眼明星,它不久前刚刚推出DeepSeek-R1模型。上个月DeepSeek发布消息称,R1模型可以与OpenAI o1模型竞争。
中国企业宣称,它们的模型可以与Meta Llama开源模型竞争,也与OpenAI等闭源模型一样好。
Lux Capital合伙人Grace Isford说:“2023年,我观察到中国对开源AI的贡献不断增加,中国模型的性能很强,成本低,吞吐量高。”
不只是中国企业支持开源LLM,Meta和欧洲创业公司Mistral也有开源版AI模型。随着中美科技竞争加剧,开源模型还有一个优势:中国企业可以将自己的模型推向全球。
全球咨询公司DGA Group的合伙人Paul Triolo说:“中国企业当然希望自己的模型能在中国之外使用,所以中国企业看重开源模型,希望借开源成为AI领域的全球性玩家。”
中国企业认为LLM会是未来科技生态系统的核心
虽然全球都在热炒AI模型,但是到底应该在模型之上开发什么应用?未来谁会主导全球互联网版图?现在还充满争论。
Grace Isford说:“如果你认为前沿基本AI模型是必需,那就应该思考这些模型的用途,比如用于前沿科学、工程技术。”
乐观者将AI模型比作操作系统,它和Windows、Android、iOS一样重要,有可能会主导市场,就像科技企业主导手机和PC一样。
英国伦敦大学国王学院学者Xin Sun认为:“中国企业认为LLM会是未来科技生态系统的核心。”
Xin Sun还说:“未来的商业模型有赖于开发者加入生态系统,要基于LLM开发新的应用,要通过各种手段吸引用户、数据并获得利润,远不只是引导用户使用云服务那么简单。”
中国构建独立于英伟达高性能AI芯片之外的基础设施
训练AI模型需要海量数据,运行时需要强大算力。英伟达已经成为AI芯片的垄断者,许多头部AI企业也用英伟达芯片训练模型,但中国是个例外。
虽然美国百般阻挠,禁止英伟达高端AI芯片流入中国,但中国企业仍然不断推出先进AI模型。
Paul Triolo说:“目前大多中国科技平台都拥有充足的算力,完全可以继续优化模型。首先,中国企业囤积了大量英伟达GPU;其次,中国有自己的GPU,它们来自华为等企业。”
实际上,中国科技企业正在开发英伟达芯片的替代品,华为是领导者,百度、阿里巴巴也在投资半导体设计。
Paul Triolo认为:“在未来的日子里,中国与美国先进硬件的差距还会拉大,特别是明年,因为明年英伟达将会推出Blackwell系统,美国会严格禁止Blackwell流向中国。”
Grace Isford认为,中国一直在向本国AI基础设施进行投资,它独立于英伟达高性能AI芯片之外。“不管美国有没有禁止英伟达AI芯片在中国销售,中国都会继续投资,继续打造自己的基础设施,继续开发、训练AI模型。”
文章来自:51CTO