腾讯科技讯,生成式人工智能模型正以创作文本、图像甚至视频的能力吸引用户,但生成这些内容所需的计算资源相当庞大,因此它们目前只能在云端或高性能计算机上运行。不过,将爆火聊天机器人 ChatGPT 背后的技术带到移动设备上的竞赛已经开始。从这项技术惊人的发展速度来看,它可能会以超出人们想象的速度改变移动通信和计算领域。
利用手机上冗余的处理能力分担成本
随着科技公司急于将生成式人工智能嵌入其软件和服务中,它们面临着计算成本大幅上升的问题。这种担忧对谷歌的影响尤其大,华尔街分析师警告称,如果互联网搜索用户开始期望在标准搜索结果中出现人工智能生成的内容,谷歌的利润率可能会受到挤压。
在移动设备上运行生成式人工智能,而不是通过大型科技公司运营的服务器上的云计算系统,有望解决最新人工智能技术潮流中一个最大的成本问题。
谷歌上周表示,该公司已经成功在三星 Galaxy 手机上运行了其最新大语言模型 PaLM 2。尽管该公司没有公开展示这种被称为 Gecko 的缩小模型,但此举堪称是一个最新迹象,表明一种只需要数据中心计算资源支持的人工智能正迅速开始进入更多地方。
这一转变可能会使聊天机器人等服务的运行成本大大降低,并为使用生成性人工智能的更具变革性的应用程序铺平道路。
移动芯片公司高通首席执行官克里斯蒂亚诺·阿蒙(Cristiano Amon)表示:“你需要开发人工智能混合技术,让它能同时在数据中心和本地运行,否则成本太高。”他补充说,利用手机上未使用的处理能力是分担成本的最佳方式。
小模型爆发式增长拉近愿景
去年年底,当 ChatGPT 的推出引起了人们对生成式人工智能的广泛关注时,将其带到移动设备上的愿景似乎还很遥远。除了对这类服务背后的所谓大语言模型进行培训外,推理(或运行模型以产生结果)的工作也需要计算。手机缺乏足够的内存来容纳像 ChatGPT 这样的大型模型,也缺乏运行这些模型所需的处理能力。
在移动设备上生成对查询的响应,而不是等待远程数据中心产生结果,可以减少使用应用程序的延迟。当用户的个人数据被用来提炼生成性反应时,将所有处理过程保留在手机上也可以增强隐私保护。
最重要的是,生成性人工智能可以让在智能手机上进行的常见活动变得更容易,例如涉及到生成文本的事宜。阿蒙解释称:“你可以将人工智能嵌入到每个办公应用程序中:你会收到一封电子邮件,它会建议你做出回应,但你将需要在本地和数据中心运行这些东西的能力。”
有些基础模型的快速发展已经改变了这一平衡。最大和最先进的模型总是占据头条的位置,如谷歌的 PaLM 2 和 OpenAI 的 GPT-4。但随着较小模型的爆炸式增长,有些同样的功能可以以技术要求较低的方式获得。它们部分受益于新技术,这些技术基于对语言模型进行更仔细的培训来微调,从而减少了语言模型需要保存的信息量。
IBM 首席执行官阿尔温德·克里希纳(Arvind Krishna)表示,大多数希望在自己的服务中使用生成式人工智能的公司,将通过组合许多这样的小型模型来满足自己的需求。上周,IBM 宣布推出专门的技术平台,以帮助其客户利用生成式人工智能。克里希纳称,许多公司会选择使用开源模型。这种模型的代码更透明,同时使用他们自己的数据对技术进行微调会更容易。
有些较小的模型已经展示了令人惊讶的能力,其中包括由 Facebook 母公司 Meta 发布的开源语言模型 LLaMa,据称它与大型系统的许多功能相媲美。
LLaMa 有各种各样的规模,其中最小的只有 70 亿个参数,远远少于 OpenAI 在 2020 年发布的突破性语言模型 GPT-3 的 1750 亿个参数,更不用说今年发布的 GPT-4,后者的参数数量尚未披露。斯坦福大学基于 LLaMa 开发的研究模型已经在谷歌的 Pixel 6 手机上运行。
除了规模更小外,这类模型的开源特性也使研究人员和开发人员更容易适应不同的计算环境。高通今年早些时候展示了据称是首款运行 Stable Diffusion 图像生成模型的安卓手机,该模型拥有约 10 亿个参数。高通高级副总裁齐亚德·阿斯加尔(Ziad Asghar)表示,这家芯片制造商“量化”了这款模型,即缩小了它的尺寸,以便更容易在手机上运行,同时又不会失去任何准确性。
平台转移将为苹果带来机会?
Creative Strategies 的分析师本·巴加林(Ben Bajarin)说,由于针对手机定制的大部分功能仍处于试验阶段,现在评估这些努力是否会带来真正有用的移动应用还为时过早。他预测,从第一波拥有 10 亿至 100 亿个参数的移动模型中,会出现相对初级的应用程序,比如语音控制的照片编辑功能和简单的问答功能。
谷歌旗下人工智能研究部门 DeepMind 副总裁佐宾·加赫拉马尼(Zoubin Ghahramani)表示,其 Gecko 移动模型每秒可以处理 16 个令牌。令牌是大型语言模型处理的短文本单位数量。大多数大型模型每生成一个单词使用 1-2 个令牌,这表明 Gecko 在手机上每秒可以生成 10-15 个单词,这可能使它适合于提示短信或简短的电子邮件回复。
高通的阿斯加尔表示,移动手机的特殊要求意味着,人们的注意力可能会迅速转向所谓的多模态模型,这种模型可以处理一系列图像、文本和其他输入。他补充说,移动应用程序可能会非常依赖语音和图像,而不是个人电脑上更常见的大量文本应用程序。
与此同时,生成式人工智能开始以惊人的速度向智能手机等移动平台上转移,这将增加人们对苹果的关注。尽管迄今为止,苹果始终没有就这波人工智能浪潮做出动作。
巴加林说,生成式人工智能存在众所周知的缺陷,比如大型模型容易产生“幻觉”,或者聊天机器人会用捏造的信息做出反应。这意味着,苹果在一段时间内不太可能将这项技术嵌入 iPhone 的操作系统中。相反,他预测该公司将寻找方法,让应用开发者更容易在自己的服务中测试这项技术。
巴加林表示:“这也是微软和谷歌的态度:他们都希望为开发者提供工具,让他们能够与生成式人工智能应用竞争。”
苹果的全球开发者大会将于 6 月 5 日召开,在此之前,微软也将举行名为 Build 的开发者大会,争夺开发者注意力的斗争将变得更加激烈。生成式人工智能可能仍处于起步阶段,但进入更多用户移动设备的赛道已经启动超速行驶状态。(金鹿)