我们知道,迈向通用AI——可以做任何事情的AI——是开发者OpenAI计划的一部分。当谈到实现这个雄心勃勃的目标时,视觉以及说和听的能力是相当重要的。因此,在我们即将迎来ChatGPT向所有人开放的一周年之际,它获得了这些功能,这是有道理的。

ChatGPT新的更新和添加的功能总是很有趣,其最新的更新尤其发人深省。

我们知道,迈向通用AI——可以做任何事情的AI——是开发者OpenAI计划的一部分。当谈到实现这个雄心勃勃的目标时,视觉以及说和听的能力是相当重要的。因此,在我们即将迎来ChatGPT向所有人开放的一周年之际,它获得了这些功能,这是有道理的。

这将如何影响我们与新的数字朋友的关系呢?它将增加它进入我们生活并帮助我们应对日常挑战的能力,它对围绕ChatGPT(以及通用AI)在社会中的地位的大问题意味着什么?

新的ChatGPT更新的功能有哪些?

首先,通过获得从图像中分析和提取语言信息的能力,ChatGPT有效地获得了视觉能力。你可以简单地上传一张图片,让它描述显示的内容,还可以用它来执行复杂得多的任务,比如诊断如何修复自行车或割草机等损坏的机械。

这意味着,理论上,ChatGPT不仅可以分析照片,还可以分析图表和可视化、笔迹以及来自我们周围世界的各种非结构化数据。

显然,它有很多日常用途,从为你想要出售的商品创建Facebook Marketplace列表,到将白板上的涂鸦变成易于阅读的笔记。

OpenAI自己给出了如何使用它的例子,包括在冰箱里抓拍物品,问它晚餐可以做什么,以及就照片进行现场对话。

然而,根据《纽约时报》的报道,ChatGPT中部署的功能有一些局限性,其中一些是设计上的——例如,它在分析人脸方面受到限制。这样做是为了防止它被用来侵犯隐私,也符合OpenAI之前限制其产品的方式。

另一个可能产生深远影响的变化是,ChatGPT现在可以说话和听,至少如果你正在使用这款移动应用程序的话。

因此,语音革命使如今与Siri和Alexa这样的机器交谈变得非常正常。我们都很习惯这样一个事实,他们只能以有限的几种方式回应我们,一般来说,他们能做的最有用的事情就是打开和关闭其他设备。

这就是为什么与ChatGPT交谈是一个如此耐人寻味的想法。ChatGPT可能会进行更自然、更流畅的对话,很容易就会给人一种与真人交谈的错觉。

除了进行来回对话外,它还可以模拟它听到的声音,例如,可以用来为AI头像配音。以及其他一些更险恶的目的。

我之所以说有可能,是因为当我在发布后直接试用它时,不得不说它还没有完全到位。

ChatGPT有几次听不懂我说的话。更奇怪的是,它的训练数据似乎没有更新,让它知道自己会说话。当我向它寻求使用其语音功能的帮助时,它坚定地告诉我,它没有语音功能(用完美合成的人类声音)。我还看到报告说,它可能听不懂各种口音和方言。

这意味着什么?

进入一个机器不仅可以思考,还可以看、听和说话的时代,显然是一件非常重要的事情。我相信有很多人准备说,它还不能真正做好任何一件事。但很明显,事情才刚刚开始。

视觉和语音功能意味着我们很可能会看到ChatGPT技术出现在越来越多的便携技术中。我们已经有一副眼镜可以在你的眼前叠加ChatGPT,所以你永远不会被问题的解决方案所困扰。这些帮助你进行随意的闲聊。

其中一些人已经可以听和说了——尽管这些人使用第三方扩展来添加功能,而且OpenAI自己的集成技术应该(潜在地)提供更流畅的体验。

但是,无论我们身在何处,拥有实时的、由AI支持的图像分析都可以即时提供给我们,这可能会真正改变许多领域的游戏规则。

不过,这确实引发了一些伦理考量。最紧迫的是,值得记住的是,尽管ChatGPT推出了一系列行为限制,本应防止其被用于不道德目的,但这些限制很快就被绕过了,在某些情况下,甚至完全被删除了。

如果这是利用ChatGPT的视觉能力完成的,潜在的后果可能会更加严重,特别是如果不道德的演员找到了绕过面部识别障碍的方法。

在ChatGPT发布后不久,与其功能相似但没有限制的仿制版本开始出现。有时,它们的创造者专门将它们作为违反法律的工具出售。我们能在视觉或声音模仿能力上看到同样的情况吗?我认为,认为它不会发生的想法将是相当愚蠢的。

对通用AI的探索

然而,有可能有一些事情应该让我们更担心。

随着最新的一系列更新,ChatGPT正变得越来越多模式。这意味着它可以理解各种形式的输入并与之互动,比如图片和声音,而不仅仅是文字。

这一点很重要,因为AI发展的目标不可避免地是通用AI(AGI)。这是一个术语,指的是只要拥有必要的数据,就可以执行任何任务的机器,就像我们人类一样。多式联运可以很容易地被描述为朝着这一目标迈出了一大步。

或许可以肯定地说,AGI还有很长的路要走。谷歌工程总监雷·库兹韦尔预计我们将在2045年左右实现这一目标,DeepMind的CEO戴米斯·哈萨比斯也相信这将在未来几十年内完成。

然而,哲学家尼克·博斯特罗姆认为,“超智能”将在下个世纪初到来。AI先驱斯图尔特·罗素教授表示,距离这一目标还有一段路要走,还有一些重大问题我们还无法解决。

当它真的到来时,AGI可能会产生相当巨大的影响。在机器创造我们所需的一切的同时,它是否会让我们过上奢侈的生活,还是会带来更黑暗的命运,对于这一问题,各方仍存在分歧。

那现在怎么办?

无论是好是坏,政府或那些有能力做出决定的人似乎没有听取那些签署了暂停巨人AI实验请愿书的人的建议。

这意味着我们很可能会看到AI的发展继续并加速。像ChatGPT添加的功能将成为日常生活的一部分。它还将变得更可靠、更强大,并提供不断改进的用户体验。这意味着更多内置了该技术的应用程序和设备,以及越来越多的社交和工业使用案例。

ChatGPT现在可以看和听了,所以我认为用不了多久就会有人想出如何让它触摸、闻和尝的方法。然后,它将配备所有与我们相同的感官功能,从理论上讲,它能够完全理解我们感知环境的方式。

这将使它有可能帮助我们挖掘出大量的洞察力——关于世界的信息以及我们与世界的互动,这些信息超出了我们的有机大脑的范围。它将以它知道的方式向我们提供这些信息,由于它对我们自己的能力的理解,我们可以使用它。

有了AI,我们就踏上了一段目的地远未确定的旅程。

Loading

作者 yinhua

发表回复