百度文心大模型产业落地加速
在2021百度认知AI创意赛“AI创意派”决赛现场,百度集团副总裁吴甜介绍了百度文心大模型的发展情况。(百度供图)
□本报记者 王晓涛
“海鸥掠过蔚蓝的天空它告诉我这个夏季有一种思念无法释怀”,透过《海浪的呼吸》的歌词,你能在空旷的恬静中隐约感到一丝忧伤。不过,歌词的作者并非是人,而是百度文心大模型基于“海滩”“闺蜜”“欢乐”三个词自动生成的。
随着数据井喷、算法进步和算力突破,效果好、泛化能力强、通用性强的预训练大模型(以下简称“大模型”),成为人工智能(AI)发展的关键方向与AI产业应用的基础底座。4月16日,2021百度认知AI创意赛“AI创意派”决赛正式举行,这是业内首次将先进的AI大模型能力开放给公众使用。
当天,在位于北京市海淀区的百度科技园,百度集团副总裁吴甜在接受媒体采访时断言:“今年会是文心大模型产业落地关键年。”她说,大模型已成为AI发展的新方向,百度文心大模型源于产业、服务于产业,是真正的产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展,打造了自主创新的AI底座,真正发挥大模型驱动AI规模化应用的产业价值。
让更多人发挥创造力
“创意在民间。AI和大模型要面向公众开放,只有门槛低到了所有人都可方便地用起来,才能真正大规模爆发出各种创意。这是文心大模型的努力方向。”吴甜在比赛现场表示,文心源于产业实践,也将在产业中广泛落地。本次创意赛中,选手展现了基于文心大模型的丰富创意,让人们看到了大模型广泛应用的前景。
大模型相当于解决AI模型的通识教育。以前的模型训练需要标注数据,由于AI落地场景很多,每个场景都要采数据、标数据,在标注的数量和质量上,存在很大的瓶颈问题。吴甜认为,有了大模型的机制之后,很多无标注数据都可以用来学习,模型学习的数据越来越多,同时模型也越来越大。
吴甜强调,现在AI落地,已经不再局限于只是面向一些技术人员和开发人员,而是要面向公众了。她解释说:“世界上有技术背景的人中开发人员只是少数,AI跟场景结合空间巨大,各个场景的相关人群非常广泛。”
深耕产业级大模型
大模型的出现,大幅降低了人工智能的应用门槛。其通过集中提供通用算法模型,打造技术底座,让大多数企业能够“站在巨人的肩膀上”,使标注数据更少、开发效率更高、应用成本更低。
据了解,负责百度AI技术平台与生态建设的吴甜,同时兼任深度学习技术及应用国家工程实验室副主任,实验室主任则是百度首席技术官王海峰。这个由百度公司牵头的实验室,2017年初由国家发展改革委正式批复。2021年7月,实验室通过了专家验收。同年12月,ERNIE3.0升级为全球首个知识增强千亿大模型鹏程-百度·文心。
超大规模模型的训练和推理,给深度学习框架带来很大考验。依托百度飞桨平台,文心大模型解决了大模型训练过程中多个世界性难题,使大模型训练速度提升、模型效果更优。
基于百度飞桨平台与百舸集群,文心大模型在算法、框架、算力层面实现完全自主创新,百度通过大模型与国产深度学习框架融合发展,为我国产业智能化转型打造AI大底座。
力促产业规模化应用
随着大模型的价值凸显,国内外科技巨头主导开发的大模型正在大量涌现。吴甜认为,大模型未来的发展趋势,一方面会继续出现技术创新,另一方面会在产业实用上有更多价值产生。
文心大模型作为产业级知识增强大模型,核心价值在于驱动AI的规模化应用。而对于其产业级的定位,吴甜解释说:“这有两重含义:一方面是模型产生的过程,跟产业应用紧密相关;另一方面是模型使用的时候,要有面向产业应用的配套工具和平台。”据介绍,为进一步降低AI应用难度,文心大模型为开发者提供了工具平台,配套易上手的大模型开发、轻量化部署工具,通过降低门槛,让各行各业的开发者都能实现AI的应用。
文心大模型坚持一边做技术创新,一边做落地应用。目前,文心大模型已大规模应用于百度内部的各类产品,包括搜索、信息流、小度智能屏、百度地图等,显著提升了产品智能化体验。基于文心的开放能力,对外的日调量也超过了5000万次。
吴甜阐释了百度推进企业AI商业化的基本思路,即三个“赋能”:平台赋能、场景赋能和人才赋能。例如,在百度AI开放平台上,现在已经有近1400项AI能力开放给中小企业使用。以飞桨为代表的平台积累了大量的案例和示范,可以帮助企业进行场景挖掘。
据了解,文心大模型已通过飞桨平台、百度智能云等赋能工业、能源、金融、通信、媒体、教育等行业,个人、企业开发者数量超过6万。
而对于智能制造,吴甜表示,大模型应用的场景主要有两大类:一是视觉场景,二是自然语言处理场景。前者主要是以计算机视觉技术为主的质检、巡检场景应用,后者主要是在数据积累和设备运维场景中要用到对语义的理解。
吴甜表示,从AI核心技术到AI基础平台,百度将继续坚持技术创新及开放生态,不断降低AI技术开发和应用的门槛,并通过云平台、AI框架、大模型的融合发展,为各行各业的数字化、智能化转型打造厚实的基础设施。