文心一言来了,移动互联网的所有生意都值得重做一遍

文 | 魅影 编辑 | 嘉欣 出品 | 数智界 长久以来,任何一项革命性的技术/产品在推进初期,都同时存在两股核心力量:
摘要

出品 | 数智界

长久以来,任何一项革命性的技术/产品在推进初期,都同时存在两股核心力量:

其一是大胆创新的创业公司;其二是那些有着坚定战略目标和无畏投入勇气的大型科技公司。

现在,在生成式AI领域,这两家代表性的公司都出现了。

OpenAI去年底发布了ChatGPT,引爆了这个行业,日前它又发布了多模态预训练大模型GPT-4,被视为是里程碑式的进步。

3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。这是全球范围内第一个由大厂做出来的、直接对标ChatGPT甚至GPT-4的产品。

过去数月,OpenAI引发了关于AI最激烈的讨论,向外界证明了自己的能力。现在,这些同样类型的讨论、对比、质疑,来到了百度这里。

在发布会现场,李彦宏坦诚,大语言模型并非能在几个月内突击完成,深度学习、自然语言处理,都需要多年的坚持和积累。

数智界观察到,文心一言目前展现出了不俗的交互能力。比如在文学创作、数理推算等方面,它能够为用户提供与ChatGPT不相上下的交流体验,在中文理解和多模态生成等方面,表现则比后者要更加优秀。

在这一基础上,更值得关注的问题有两个:

1、为什么百度会成为走在大厂最前列的那个玩家?

2、文心一言未来的想象力会来自于哪里?

一、文心一言实力几何?

发布会上,百度创始人、董事长兼首席执行官李彦宏介绍,目前文心一言的使用场景主要包含文学创作、商业文案创作、数理推算、中文理解和多模态生成。

基于以上这几大使用场景,李彦宏在现场播放并讲解了文心一言的演示视频。数智界选取了其中几个比较有代表性的问题,让我们来看看文心一言的表现。

文学创作能力上。在回答“可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发”这一问题时,文心一言都做出了令人惊喜的回答。

尤其是在“续写”上,文心一言给出了四个角度,分别是角色塑造、情节设计、文化背景、哲学思考——这体现出了一定程度上的思考能力。

商业文案创作上。文心一言顺利完成了给公司起名、写Slogan、写新闻稿等创作任务。

数理推算上。“鸡兔同笼”的数学题面前,在第一轮题目出错的情况下,文心一言没有急着给出答案,而是首先意识到“题是不是出错了”,紧接着第二轮问答,文心一言快速给出了准确答案,还给出了详细的解题思路和步骤。

我们看到,虽然题目本身难度并不大,但文心一言已经具备了一定程度上的质疑能力、逻辑推算能力。

有意思的是,如果你用以上类似的问题与ChatGPT对谈,多半也能得到很好的解答,但如果是下面这两个场景,文心一言的表现,会比ChatGPT更好。

第一是中文理解场景。

发布会现场的演示视频中,文心一言能正确解释成语“洛阳纸贵”含义、准确描述典故由来,能讲出这个成语背后对应的经济学理论,甚至还能在极短的时间里创作藏头诗。

ChatGPT在这一层面则略逊一筹。比如有媒体用“关羽和秦琼谁更厉害”同时问ChatGPT和文心一言时,二者的回答区别不小:

文心一言会从战绩、历史地位和贡献等多个维度进行比较;ChatGPT的回答则是简单的“都是著名的武将、都在各自的时代展现出了战斗技能和领导才能、成就和贡献都不可忽视、都值得尊重和学习。”——乍一看没错,但是是正确的废话。

第二是多模态生成场景。

文心一言有一个能力,用户输入文字描述后,它能够生成图片、语言、文字三种模态的内容。

做个简单对比,OpenAI最新推出的GPT-4,目前支持输入图片和文字,但只能生成文字。

理性来看,在当前阶段,简单地将ChatGPT与文心一言做直接对比并不客观。

一来双方诞生的土壤不一样,比如百度扎根中国市场,更理解中国文化,文心一言具备中文领域最先进的自然语言处理能力,但是李彦宏也坦言,“目前文心一言对英文语种、代码场景的训练还不够多,表现还有待提升。”

二来,基于他们当前所表现出来的能力下结论,也值得商榷。

因为随着数据规模越来越大,在参数达到千亿级别甚至更高后,大模型就可能发生“智能涌现”,涌现出更强的知识和逻辑推理能力。

换言之,无论是OpenAI还是文心一言,最应该被期待的,并不是当前表现出来的能力,而是接下来的进步空间。

二、文心一言能带来什么?

前段时间,ChatGPT掀起生成式AI热潮之后,对于它对潜在领域颠覆性的讨论中,争论最多的是搜索领域。

原因是,ChatGPT拥有基于对话形式接收输入指令并输出结果的能力,与传统的搜索引擎功能具有一定的重合。

这给海内外传统的搜索巨头带来了压力。比如谷歌管理层甚至发布了“红色代码”警报,在硅谷这意味着拉响了“火警”。

但是被颠覆的真的只有搜索业吗?能够被赋能的也真的只有搜索业吗?

百度文心一言的发布会上,李彦宏透露了一则数据: