展望2024,AI领域会有哪些发展和变化?
据说Stability AI将会倒闭?而「情同父子」的微软和OpenAI将会出现裂痕?
还有新的职位——Chief AI Officer即将出现?
另外,2024会不会出现足以取代Transformer的新架构呢?
最近,福布斯发布了2024年的10大AI预测。
英伟达将成为云服务商
虽然全球都在进行争夺GPU的战争,但大多数组织并不会直接向英伟达购买GPU,而是会选择云服务。
他们通过亚马逊、微软或者谷歌的云平台访问GPU,而这些大型云服务厂商又从英伟达批量购买芯片。
但这个关系将会变得复杂,因为所有人都认识到了GPU的价值,所有的云供应商都在大力开发自己的AI芯片。
这也意味着亚马逊、微软和谷歌等,将从英伟达最大的客户转变为竞争对手。
相应的,英伟达也将朝着相反的方向发展:开始提供自己的云服务,运营自己的数据中心,以减少对云公司分销的依赖。
今年早些时候,英伟达推出了名为DGX Cloud的新云服务。而在2024.我们将会看到更多类似的举措。
Stability AI将会倒闭
作为曾经高歌猛进的初创公司,Stability AI几乎已经成为了缓慢移动的火车残骸。
首先是人才的流失:最近几个月离职的包括首席运营官、首席人事官、工程副总裁、产品副总裁、应用机器学习副总裁、通信副总裁、研究主管、音频主管和总法律顾问。
其次,去年领导Stability AI 1亿美元融资的两家公司Coatue和Lightspeed,最近几个月都因与Stability AI首席执行官Emad Mostaque发生纠纷,而退出了公司董事会。
今年早些时候,Stability AI试图以40亿美元的估值筹集额外资金,但失败了。
虽然最近获得了英特尔投资的5000万美元,但 Stability 的烧钱率是出了名的高。据报道,在10月份英特尔投资时,Stability AI每月花费800万美元(同时收入很少)。按照这个速度,这5000万美元也撑不了多久。
据报道,在投资者的压力下,Stability AI已开始寻找收购者。
LLM这个词将会越来越少见
目前的生成式AI大模型基本都是纯文本模型,所以大语言模型(LLM)用来指代几乎所有的高级人工智能模型。
但随着人工智能模型类型的激增,以及人工智能变得越来越多模态,这个术语将变得越来越不精确。
多模态人工智能的出现是2023年人工智能的决定性主题之一。当今许多领先的生成式AI模型都包含文本、图像、3D、音频、视频、音乐、物理动作等。它们不仅仅是语言模型。
比如在机器人技术中使用的基础模型:将视觉和语言输入与一般互联网规模的知识相结合,以便在现实世界中采取行动(控制机械臂)。
对于此类模型,应该使用比「语言模型」更丰富的术语来形容,比如「视觉-语言-行动」(VLA)模型。
DeepMind最近发布的FunSearch模型也类似,虽然作者自己将其称为LLM,但它处理的是数学而不是自然语言。
2024年,随着模型变得越来越多维,我们用来描述它们的术语也将变得越来越多维。
闭源模型将继续保持领先
开源闭源之争,是当今AI领域的一个重要话题。
OpenAI、Google DeepMind、Anthropic、Cohere等选择了闭源,而Meta和最近的新秀Mistral等少数公司选择了开源。
如今,表现最好的基础模型是闭源的(比如GPT-4)。但许多开源倡导者认为,封闭模型和开放模型之间的性能差距正在缩小,开放模型有望在性能上超过封闭模型,比如下图中的预测:
图片
但福布斯的预测认为,在2024年及以后,对比表现最好的模型,闭源模型将继续优于开源。
基础模型性能的发展是非常迅速的。尽管Mistral表示,自己将在2024年的某个时候开源一个GPT-4级别的模型,但相比于2023年初发布的GPT-4,已经落后了一年多。
而在2024年,我们也许能看到GPT-4.5甚至GPT-5。
开发一种先进的新模型所需的投资是巨大的,并且会随着模型能力的每一次阶跃式增长而继续膨胀。据估计,OpenAI将花费约20亿美元来开发GPT-5。
相比之下,Llama 2的建造成本约为2000万美元,考虑到战略利益,即使没有任何相关的收入增长,这种投资水平对于Meta来说也是合理的。
但Meta作为一家上市公司,最终要对股东负责。它真的会投入近20亿美元来构建一个性能最优的AI模型,然后只是为了开源,而不期望获得具体的投资回报吗?
也许,随着像Mistral这样的公司,投入越来越多的资金来构建更强大的AI模型,他们最终可能会放松对开源的立场,并保留自己最先进的模型用来盈利。
Chief AI Officer
今年,人工智能已成为财富500强公司的优先事项,各行各业的董事会和管理团队,都想尽快弄清楚AI对于自己的业务有什么影响。
所以福布斯预计,明年的大型企业将任命一名「首席人工智能官」(Chief AI Officer)来领导公司的人工智能计划。
十年前,在云计算兴起之时,许多组织聘请了「首席云官」来帮助他们了解云的战略意义。
任命Chief AI Officer(小编不知道这个怎么缩写)将成为一种流行趋势,用来表明公司对待人工智能的态度。
至于从长远来看,这个Chief AI Officer到底有多大作用,那就是另外的问题了
替代Transformer的全新架构
谷歌在2017年提出的Transformer主导了当今的AI大模型,ChatGPT、Midjourney、GitHub Copilot等都是基于Transformer构建的。
但是,没有任何技术可以永远占据主导地位。
研究人员一直在努力开发下一代人工智能架构,比如斯坦福大学实验室提出的新架构。相比于Transformer,新架构的计算密集度更低,并且能够更好地处理长序列。
迄今为止最有前途的架构是Mamba。上个月,介绍Mamba的文章在AI研究界引起了巨大的轰动,甚至有人称它为「Transformer的终结」。
图片
另外,麻省理工学院开发的液体神经网络(liquid neural networks)等新架构也对Transformer提出了挑战。
明年,也许会有挑战者真正脱颖而出,并被应用到生产中。
对于投资的监管
今年,一波资金从大型科技公司流向人工智能初创公司。
微软在1月份向OpenAI 投资了100亿美元,然后在6月份领投了Inflection的13亿美元融资。
今年秋天,亚马逊宣布将向Anthropic投资40亿美元。Alphabet也不甘示弱,几周后宣布将向Anthropic投资20亿美元。
与此同时,英伟达向数十家使用其GPU的人工智能初创公司投入资金,包括Cohere、Inflection、Hugging Face、Mistral、CoreWeave、Inceptive、AI21 Labs和Imbue。
此类投资可能涉及会计规则中的一个灰色地带。
假设一家云供应商向一家人工智能初创企业投资1亿美元,并保证该初创企业会将这1亿美元用于云供应商的服务。从概念上讲,这对云供应商来说并不是真正的正常收入,实际上,供应商是在利用投资将自己资产负债表上的现金人为地转化为收入。
这种交易通常被称为「往返」(round-tripping),因为钱出去了又回来了。
到目前为止,这种交易几乎没有受到监管审查,但在2024年就不一定了。
微软OpenAI或将「决裂」
迄今为止,微软已向OpenAI投入了超过100亿美元,两家正值蜜月。
OpenAI的模型为微软的关键产品提供支持,比如Bing,GitHub Copilot和Office 365 Copilot。
然而,微软和OpenAI是截然不同的组织,有着不同的愿景。
随着OpenAI寻求积极扩大其企业业务,它将越来越频繁地与微软直接竞争客户。而微软也在实现多元化,成为顶尖AI模型的供应商。
微软最近宣布与OpenAI竞争对手Cohere合作;面对大规模运行OpenAI模型的高昂成本,微软还投资研究了Phi-2等较小的语言模型。
从更大的角度来看,随着人工智能变得越来越强大,有关人工智能安全、风险、监管和公共问责制的重要问题将成为焦点。
鉴于不同的文化、价值观和历史,这两个组织在处理这些问题的理念和方法上将不可避免地会出现分歧。
人工智能炒作转向其他方向
虽然风险投资家和技术领导者都被AI深深吸引,但一年是很长的时间,风险投资人的「信念」可以非常迅速地改变。
人工智能与版权
如今,整个生成式人工智能领域都面临着一个重大且被低估的法律风险:大语言模型已经在大量受版权保护的内容上进行了训练。
无论是来自GPT-4或Claude 2的诗歌,来自DALL-E 3或Midjourney的图像,还是来自Pika或Runway的视频,生成式AI模型都能够产生令人叹为观止的复杂输出,因为它们经过了大量数据的训练。
在大多数情况下,人工智能公司免费从互联网上获取这些数据,并随意使用来开发他们的模型。
但是,这些数据的原作者们对此有发言权吗?他们是否有权从中获得一部分收益?
这些问题的答案取决于法院对「合理使用」(Fair use)这一关键法律概念的解释。
将合理使用原则应用于生成式人工智能将是一项复杂的工作,但大量的诉讼已经到来。
参考资料:
https://www.forbes.com/sites/robtoews/2023/12/21/10-ai-predictions-for-2024/?sh=7295b6f54898