理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。
作者|皮爷
出品|产业家
沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下,雪白的坡道在给人质感的同时,也更多了几分厚重——这里是刚刚过去的冬季奥运会自由滑板大跳台和单人滑板大跳台项目的举办地,伫立在首钢园的它也是当今全世界唯一一个永久保留的滑雪大跳台。
今天,这里是百度的主场。
关于百度,在过去的一年里很难有人忽视掉这家老牌中国互联网企业。不论是在大模型浪潮里代表中国的“率先出战”,还是其大模型产品在技术参数和落地上的一个个动作,再或者是百度在自身各个产品线上的AI重构,每一个事件和节点都在成为着中国大模型舞台上的核心事件之一。
这些成绩在展示着中国AI企业的特殊加速度背后,也更在让外界重新认识和理解百度——在All in AI多年后,有一身“极客”气质的百度终于站在了自己的专属舞台上。
不过如今,和它一起出现再次出现在“百度世界大会”舞台上的,不仅是大模型本身,还有百度各个“换上新装”的一众明星产品:百度文库、百度文档、百度网盘等等……
现在的百度,是一个怎样的百度?又或者说,伴随着AI大模型浪潮蜂拥而来的,除了文心大模型,百度在发生的改变还有什么?
理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。
一、大模型潮水里的百度时刻
“我们是全球科技大厂里最先发布大模型的公司。”在今年的3月16日,始终身穿一身白衬衫出现在公众面前的李彦宏向外界发布了百度文心大模型。
而在7个月过后的今天,这个被率先发布的互联网大厂大模型有了新的成绩单——文心大模型4.0版本正式发布。客观来看,这是目前国内唯一一个可以对标GPT-4的大模型产品。
这意味着什么?
过去几个月的时间里,大模型浪潮蜂拥而来。根据中国新一代人工智能发展战略研究院发布的《2023中国新一代人工智能科技产业发展报告》数据显示,目前国内大模型数量超过200家,其中参数量级超过10亿的模型数接近80个。
这些模型不仅是基础模型,更多的则是产业模型,比如面向金融、教育、工业、农业等不同的产业方向,它们都在成为着大模型的价值自证地和新机会市场。
但在其中,百度文心大模型仍然是尤为特殊的一个。
能力本身是大模型绕不开的必考卷。从时间线来看,在百度推出文心一言模型后的2个月后,百度正式宣布文心大模型正式从 3.0 升级到3.5,文心大模型 3.5 的模型效果累计提升超过 50%,训练速度提升了 2 倍,推理速度提升了 30 倍。
这个升级在IDC发布的《AI大模型技术能力评估报告,2023》中有足够清晰的例证。即百度文心大模型3.5在12项相关指标测试中,拿下了7个满分,包括综合评分、算法模型、行业覆盖等均取得了第一名。
而如今的4.0版本尽管被社会层面的验证仍然在路上。但根据官网数据显示,文心大模型4.0,相比3.5版本,逻辑和记忆能力有显著的提升,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。此外,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。
此外,能力之外,场景更是当下大模型被检验的核心指标。在面向产业端的市场中,百度智能云发布了千帆平台,为企业提供“大模型超级工厂”服务。而这个方案的数据是,从今年3月份以来,它已经服务了超过17000家客户,在超过400个场景中实现了落地。
而在这些之外,百度的更特殊之处在于对自身的重新重塑,在在这次大会上重磅亮相的百度文库、百度文档、百度网盘等产品背后,对应的是百度自身对于AI的深度应用和理解,即基于文心大模型,百度真正肉眼可见的进入AI-native时代。
实际上,在过去的几个月时间里,人们对于大模型的讨论始终不绝于耳。从最开始单纯追求参数,到后来的重视场景,再到如今的AI原生应用,对应的一方面是人们对于大模型技术愈发趋向理性和冷静的观察,另一方面也更是大模型本身在实际发展不同阶段的不同核心命题——从技术到场景到AI应用。
而伴随着这些不同的命题,对应的是舞台中央不断轮换的企业,比如技术至上的极客公司,比如有专有产业数据的产业模型企业,再比如具备产品开发能力的产品模型创业者等等。但在舞台中央,在不同的阶段,百度却始终都在聚光灯下。
不论是芯片算力、还是场景落地,再或者是生态开放和AI原生应用等等,在每一个大模型的棱面上,百度始终会是那个率先出击的企业,最终也恰构成了这次百度世界大会给外界展示出的大模型“多面体”。
或者可以说,百度在成为引领者、亲历者的同时,也更在成为一面中国大模型企业出击的“时刻”标签。
二、谁在推动AI奇点?
2019年,在小说《三体》出版后,刘慈欣还写了一篇名为《技术奇点》的文章,在文章中他写到,“什么是技术奇点?是技术的进步可能由量变产生突然的质变,在极短的时间里彻底改变人类世界的状态。”
而这个词,在如今的大模型时代更是被再次提及。即在大模型时代里,什么才是真正的奇点?又或者说,什么才是真正的推动大模型普惠的最直接路径?
如果说从技术到场景,对应的是大模型缓慢前行的过程。那么,在此之外一个更为直接的答案则是应用,更具体来说,则是基于大模型技术的应用。
“应用的最关键价值在于,它能让技术变得可见、可用和可感。”一位观察大模型的投资人告诉产业家,“它能强化大模型的普惠效应。”
这也正是百度的思考。以这次大会为例,百度内部诸多应用都在成为AI驱动的应用,比如百度文库,其升级为“一站式智能文档平台”,接下来其将不仅具备之前的信息查阅功能,更具备”PPT智能生成、文档智能生成、智能编辑、智能辅助阅读”等核心AI能力。
再比如百度网盘,其主打的网盘智能助理“云一朵”是国内首个网盘智能助理,用户只需要一句话,就能对网盘内的文件、图片、视频等进行操作,方便用户在网盘里、视频里“找东西”。同样还有百度地图,基于文心大模型进行重构的百度地图V19,将上线全新“AI向导”,它将具备多轮自然语言交互能力,更接近“真人交流”体验。
可以理解为,百度正在将固有的产品界面基于大模型进行重新解构,这种解构不再是之前的产品功能优化,而是基于新的交互方式和强大的中文知识图谱做支撑,进行更为彻底的从交互到产品功能的重构。
实际上,这也恰是当下大模型强化技术标签的最强社会信号。
即伴随着大模型的技术推进,越来越多的共识是这项技术将会率先在产业侧落地,其基于大模型本身对数据的重新训练和表达可以转化为更先进的生产力,帮助企业实现更快速的数字化转型。
这种思考诚然如此,但在这之外,更关键的点在于对于C端人群语法凸显的一个问题是——“大模型是什么?”。在单纯的一问一答之外,大模型的更多元表达会是什么?
这个问题知易行难。对于中国互联网市场的一众产品而言,需要被重新架设的不仅是固有的产品思维,也更是在其上需要被重点强化的领域知识图谱和数据,以及足够强大的能支撑C端人群的算力底层。
可以理解为,百度的这些应用重构,恰是这个难题的答案。即作为兼备明星产品和坚实模型能力的互联网企业,百度是为数不多的可以将两者进行加法的科技厂商,这些最中文语义最强的知识图谱被拆解成具体的模块,经过特殊的微调和强化,和不同的产品形态进行特殊的加法,或乘法。
不过,从某种层面来看,这些应用也恰构成着百度或者说大模型企业在当下数字化时代的特殊飞轮,即通过应用可以对大模型进行更广和更深的数据训练和加持,基于现象级落地实现大模型自身的优化升级。
这是百度锚定的奇点,也更是一个大模型进化的必然奇点。
三、中国大模型拼图里,重新理解百度
实际上,在一众的节点之中,百度正在成为一个不同的百度。如果说百度之前的标签是搜索、是营销,那么如今百度更核心的标签恰是AI大模型。
这种变化足够鲜明。从整个产品矩阵来看,不论是百度最核心的搜索,还是百度文库、百度网盘、百度地图、百度营销,乃至其他板块的小度科技、度小满金融等等,都已然基于大模型构建出自己的新形态。
恰如李彦宏在会上所说,
就当下而言,在整个中国大模型的版图里,百度更可以看作是一个足够清晰的AI样板间。基于文心大模型,这家企业的产品、商业模式都在发生肉眼可见的变化,这些变化也恰在给市场和用户提供一种特殊的大模型普惠的使用方式——大模型被具象为更加专用的产品场景,帮助人们更好地解构数据和获取知识。
而在这种变化背后,对应的是如今百度文心大模型4.0更为强大的理解和逻辑能力,以及底层充分的算力支撑。
这些构成的是如今的新百度。在这个新的百度身上,看到的是新智能化的产品矩阵,新被拓宽的商业空间天花板和新的愈发广阔的新想象力。
当然,也更有对技术的始终专注和坚持。根据财报数据显示,百度核心研发费用占百度核心收入比例已连续7个季度超过20%,而这些研发的数字在如今的大模型时代,恰在从质变走到量变,转化成一个个百度重新出发的原点。
实际上,百度的变化也更在被市场所看见。在刚刚过去的9月7日晚,《时代》周刊发布了首届全球百大AI人物,百度创始人、董事长兼首席执行官李彦宏、特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等被评为全球AI领袖。《时代》给李彦宏的评语是,“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。
更客观的表达是,在当下的AI时代,百度多年的默默坚持正在被转化为加速出发的动力。在这一轮的大模型潮水里,“百度时刻”在加速到来,属于百度的中央舞台也正在缓缓驶来。
仍记得一组数据——8 月 31 日,文心一言率先向全社会全面开放,从0 点至 24 点,文心一言共计回复网友超 3342 万个问题。
或许,多年之后再看这个时间点,它是许多人在大模型时代推开的第一扇大门,也更是新百度的推开的第一扇窗。