文心一言的首秀与疑问

一切都透露着不寻常,从多场预热沟通会、规模化披露生态伙伴,到严格的内测范围。3月16日,多年不到现场站台的百度创始人李彦宏,亲自演示了百度最新的生成式AI产品——文心一言。

一天前,各大科技媒体的版面也属于AI,主角是OpenAI的GPT-4。不过,OpenAI的创始人和一些学者仍在提醒不要过分神化 GPT-4。艾伦人工智能研究院院长、华盛顿大学教授奥伦·埃齐奥尼也提醒,“离放心让任何 GPT 运营一座核电厂,还有很长的路要走”。正因如此,生成式人工智能的竞争不会囿于一款产品,百度、微软、谷歌,以及或高调或谨慎的科技同行们已经听到哨声。

“逼”出来的产品


(资料图)

“文心一言还有很多不完美的地方。”

李彦宏向所有媒体重复这句话,就像前一日OpenAI联合创始人格雷格·布罗克曼演示GPT-4时强调的那样。

3月16日下午2:00,李彦宏准时出现在百度科技园K6报告厅的舞台中央。一开场,他就直言不讳地回应了外界对文心一言推出时间的疑问,“为什么是今天,你们真的准备好了吗?”

“其实我们已经为此准备了十几年,百度2019年就推出了文心大语言模型,但也不能说我们完全准备好了,文心一言对标ChatGPT甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。我自己测试感觉还是有很多不完美的地方。”李彦宏说。

从分析、总结到推理,文心一言展示了文学创作能力。它的类似能力还包括给一家用大模型服务中小企业数字化升级的科技起名、提炼Slogan、撰写新闻稿等。

要说和GPT-4功能演示的不同,做数学题算一个,那是ChatGPT刚上线时频繁翻车的部分。在这个环节,文心一言辨别出第一道题目有误,对第二道正确的问题,给出了准确结果和解题步骤。

和ChatGPT相比,“文心一言的优势是中文,这是ChatGPT的短板,但差距有限。所以文心一言能不能在中文领域给予大家惊喜,拭目以待。但也不宜期待过高,毕竟两者在算力、算法、数据上的差异摆在那里”。浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林向北京商报记者表示。

不是单品竞争

遗憾的是,李彦宏演示的文心一言略显文科气。ChatGPT常被点赞的编程方面能力,文心一言没有展示。

这种有意无意的差异化,让外界对文心一言和ChatGPT的优劣更加好奇,尤其在两者几乎同时“上新”的节骨眼上。

3月10日,微软德国CTO Andreas Braun宣布,“我们将在下周推出GPT-4,会是多模态模型”。

让热度升温的还有同是搜索出身的谷歌,GPT-4发布前几个小时,谷歌推出一系列生成式AI功能,用于其各种办公软件中,包括谷歌Gmail、Docs(文档)、Sheets(表格)和 Slides(幻灯片)。几天之内,微软、谷歌、百度的交集似乎越来越大。

真正的PK从3月15日开始,OpenAI发布GPT-4后,不少国内用户不顾时差与GPT-4交互,杭州电子科技大学副教授徐伟栋就是其中一员,“大清早我周围的人就在测GPT-4,小学算术还是不会算”。对于3月16日百度的表现,他认为符合预期,更期待亲自试用。

谈到生成式AI大模型未来的商业化,易观合伙人、企业数字化中心总经理张澄宇告诉北京商报记者,“虽然OpenAI已经占据了先机,但生成式AI的竞争还远没有结束。尤其对于中文互联网世界来说,企业在模型层面的领先不足以确保获得最终的商业成功,对用户需求的把握、对产品体验的打磨、对产业生态的塑造,甚至来自国家政策、法律、监管等层面的变化都会给市场格局带来巨大的不确定性”。

中央财经大学数字经济融合创新发展中心主任陈端也提出了此类观点,她告诉北京商报记者:“这不是一个单品竞争的问题,是各个大厂如何积累优势和生态的问题,一点是渗透市场,另一点是跟垂直行业去结合,形成一个融合创新题,这不是一蹴而就的。”

这种融合,也是百度发布会后半场强调的重点。自2月官宣“文心一言”以来,超过650家企业接入文心一言生态。

李彦宏预测,大语言模型将带来三大产业机会:新型云计算(Mass即服务);工业、金融、交通等行业模型精调;文字、图像、音视频生成等应用开发。在行业模型精调方面,百度文心大模型在电力、金融、媒体等领域,发布了10多个行业大模型。

回看国内大厂,腾讯自研的AI超大规模预训练模型“混元大模型”,融合TNN开源推理框架之后,可向客户输出数据处理、模型训练、应用及推理加速等服务,能降低AI开发门槛、提升研发精度和效率。阿里达摩院“通义”大模型系列已应用于电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等场景。

宽泛点讲,OpenAI面向商业用户推出的ChatGPT和Whisper语音转文字API,微软对GPT大模型植入的开发态度,也是同样的考量。北京商报记者 魏蔚

关键词: