您的位置:
文学城
» 听播
» AI 十年浮沉,与改变命运的大模型
AI 十年浮沉,与改变命运的大模型
文章来源: 远川研究所 于
2023-04-20 20:58:20
- 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
2019 年,前谷歌 CEO 埃里克 · 施密特向白宫递交了一份颇为 " 诡谲 " 的报告。这份长达 750
页的文件,核心观点其实只有一句话:若美国再不加大投资,中国将彻底主导 AI 领域 [ 1 ] 。
施密特此举其实有 " 骗经费 " 之嫌:一年前,谷歌曾迫于舆论压力退出了一个政府 AI
项目,他一直对此耿耿于怀。但报告本身却并非胡诌。同年,美国数据创新中心也发布了一份报告,声称中国 AI
实力全球第二,且在数据等层面比美国更具优势 [ 2 ] 。
在全民追赶 GPT 的今天,这则旧闻读起来颇有几分 " 魔幻感 "。
报告甚至上升到了 " 国家安全 " 的高度
然而,施密特口中的 AI ,与如今人们谈论的 GPT 并非一个东西。
以 GPT 为代表的
AI,指的其实是大模型。它拥有生成图像、音频、视频等内容的能力,像是个文艺青年。但彼时让美国人深感威胁的,多指识别型
AI(小模型)。它擅长各类数据分析工作,如同一个木得感情的运算机器。
大模型走红前,识别型 AI 曾被寄予了太多改变世界的厚望,在中国催生了一段群雄并起、热钱涌动的黄金岁月。巅峰时期,中国 AI
初创企业的融资金额甚至超过了美国——李开复将其形容为 " 有三个 AI 专家就能估值 7 亿、靠 AI 概念就能忽悠投资人
",也不怪美国人感到焦虑。
只是好景不长:后来 VC 陆陆续续退出,曾经风头无两的独角兽也褪去了身上的光环,残暴的欢愉最终以残暴终结。
对此,百度集团执行副总裁、百度智能云事业群总裁沈抖曾打过这么一个比方:大模型出现前的 AI 像是氧气——本身很有价值,但自己不会燃烧,必须找到可燃物才能把价值给发挥出来。这里的
" 可燃物 ",指的是落地场景。
AI 起起落落这十年,成也场景,败也场景。
旧范式的困境
2016 年,谷歌 AlphaGO 不仅彻底颠覆了围棋,也改变了当时的 AI
创业。一时间,VC、科学家、大学教授,乃到各路乡镇企业家,无一不在谈论着 AI 商业化的可能性。短短一年时间,国内诞生了 528 家
AI 企业,催生 371 起 AI 投融资,同比涨幅达到了 38.9%;同一时间,中国 AI 企业申请了 9000 多项 AI
专利,几乎是美国新增专利数的两倍有余 [ 3 ] 。
不过,整个行业闭眼狂奔的同时,鲜有人会注意到初冬的号角已经悄悄吹响。2019 年,繁荣戛然而止。
首先是融资遇冷:这一年的 AI 融资金额仅有 186 亿元,相比 2018 年直接腰斩了一个 0。受此影响,AI
初创企业的数量也大幅缩水,仅有鼎盛时期的 1/20。至于那些从竞争中幸存、成功 " 上岸 " 的 AI
企业,其财务状况仍旧惨不忍睹。据不完全统计,近九成 AI 企业都处于严重亏损的状态 [ 4 ] 。
大起大落背后,是 AI 长期以来的产业化困境。
2021 年之前,业界三大主流 AI 技术分别是计算机视觉、语音识别、自然语言识别,本质都属于识别型
AI。单从技术层面来看,上述技术都具备着充分的下游应用空间,想象力充足。
例如在 "AI+ 安防 " 领域,2020 年时已有 453 亿元的市场,且增速可观,预计到 2025 年时市场规模将再翻一番
[ 6 ] 。
可下游需求不断扩大,并无法拯救亏钱的 AI 企业。识别型 AI
的技术特点,决定了它是一门技术、投入与产出不成正比的生意。
识别型 AI 采用的是小模型——这是一种专为特定任务而生的技术。在实际训练小模型时,研究员只需给 AI
灌入标注过的特定数据,便能让 AI 获得对应的能力。如果想要一个能抓 " 闯红灯 " 的
AI,那么无需教它语文数学,只要让它从小学习各种闯红灯的视频即可。
小模型的优点在于简单、高效,专用向的 AI 能够很好地完成对应任务。但其缺点同样明显:由于没学过其他知识,一个 AI
只能解决一个问题。譬如一个抓闯红灯的 AI,显然不会具备识别超速、违规变道的能力。
识别不同元素需要不同的标注数据
由于小模型不具备通用性,导致识别型 AI 只能成为一门类手工作坊的定制生意。
且具体到实际应用中,一个需求有时还需要定制不止一个 AI。例如在工业领域,在制造冶金钢卷时有缺陷检测这一步骤。如果将这项工作交由
AI,定制起来其实相当麻烦。因为钢卷分为冷轧、热轧,所以 AI 企业需要同时用 " 冷轧 - 合格 "" 冷轧 - 缺陷 "" 热轧
- 合格 "" 热轧 - 缺陷 " 四组数据训练四遍 [ 7 ] 。其繁琐程度,与 " 五彩斑斓的黑 " 有的一拼。
定制需求繁琐的同时,对人力要求还不低——这活儿可不是月薪三千的大学生能干的。
出于业务需要,头部 AI 企业都聘请了大批科学家、博士生与教授作为研究员,而 AI 研究员又是出了名的 " 高薪岗位
"。2015 年,谷歌为了不让知名研究员伊利亚(Ilya Sutskever)跳槽,曾开出过 200 万美元 /
年的高薪——后来桑达尔 · 皮查伊继任谷歌 CEO 时,其基本工资是同一个数字。
财新曾对国内 AI 企业招股书做过一笔测算,发现:它们每挣 1 块钱,就要花掉 0.75 元的人力成本。再算上定制 AI
的算力、数据开销、以及其他成本,几乎做一单亏一单。
人们这才惊奇地发现,AI 这门生意似乎远不如想象中那么性感。
陷入死局后,AI 企业们只能寄希望于一场 " 推翻重来 " 式变革。幸运的是,没过几年,暴风雨真的来了。
通用性的价值
红杉资本率先嗅到了风雨欲来的气息。2022 年 9 月,红杉发表了文章《Generative AI: A Creative
New World》,预言一场全新的科技竞赛即将来临。投资人同行很快闻风而动,一度冷清的 AI 圈再度人声鼎沸。
这篇文章发布仅半年,有头有脸的科技公司们几乎全部一头扎进了 AI 浪潮之中,要用人工智能把每个行业都重新做一遍。
例如当下火热的直播行业,大模型应用的空间就相当广阔。对于那些养不起专业直播团队的商家,如今只需输入商品信息,百度的文心一言能够自动生成话术、配音以及数字人主播,直接包揽了整个流程。
企业无需再花钱雇主播、想话术、搞培训,能轻松实现 7*24 小时直播,对中小企业而言无疑是个重大利好。
在沈抖看来,大模型创业带来的众多机会,将带动数字化经济更进一步,有机会在全球范围内掀起一股产业再造的浪潮。
他认为,随着大模型深入数字经济,更多产业会出现新的改变。智能化不仅让整个生产流程大幅提效,也改变了很多原有的生产关系,包括人和人、人和设备、人和系统的关系。以前没有智能时,很多工作实际上是靠人来操作;有了智能以后,机器、设备、系统都可以按照人的思想去学习。
未来的工作模式,很有可能是一个聪明的人去指导一堆机器人。这些机器人执行人类的决定,重塑整个生产线。沈抖说道," 生成式 AI
已经形成全球性的‘ AI 再造业务’趋势,企业迎来‘智能化跃迁’的历史机遇。"
AI 产业能够二度迎来春天,背后其实是大模型技术迈向成熟。
这场变革的起点发生在 2017 年:彼时,谷歌几位研究员公开了深度学习模型 Transformer。以此为基础,OpenAI
等机构开始尝试研究大模型,一种不同于识别型 AI 的全新技术。
其研究成果,正是如今备受关注的 GPT,即 Generative Pre-trained Transformer(生成式预训练
Transformer)。
众所周知,一个 AI 由模型、数据、算力三要素构成。相比于传统的识别型 AI(小模型),以 GPT
为代表大模型在数据、模型等方面均有不同程度的革新,赋予了大模型更强的通用性。 这恰好改善了小模型时代的产业化痛点,AI
实现即插即用。AI 企业终于能摆脱手工作坊般的生产模式,有机会变成一门好生意。
大模型的这一价值,几乎吸引了全球所有的目光。连早已退休、专心搞慈善的比尔盖茨,都为此兴奋不已。他在一篇文章中写道,自己有幸亲历了人类可能最重要的两场革命的开端:第一次发生在
Windows 萌芽、PC 市场刚刚兴起的 80 年代,而第二次正是去年——大模型刚刚开始涌现的时候。
而沈抖认为,作为 " 通才 " 的大模型还催生一种全新的产业化路径:MaaS(Model as a
Service),模型即服务。"
根据我们提供的文心一言的大模型服务,企业能够以此为基础,结合他们所在行业去微调出一个行业大模型,再用这个行业大模型去服务整个行业。"
未来,大模型可能会成为一个类似于安卓的 " 超级底座 ",
每个行业都迎来 AI 再造的机会,并给应用端带来大量的机会。
而在美国,已经诞生了依托于大模型开展业务的独角兽。在德克萨斯州,一家初创企业凭借微调后的 AI 应用,在短短 18
个月时间做到了 15 亿美元估值,年收入已有 3000 万美元,比直接做大模型的企业还赚钱 [ 10 ] 。
不过,产业化潜力仅仅是大模型价值的一个方面。不同于过去两年流行的元宇宙、Web3
等概念,大模型带来了实打实的生产力提升。
例如长安汽车在参与百度文心一言的邀测时,就体验了一回大模型的生成 PPT 功能。过去,制作一份 PPT
通常要花费半天甚至一天时间;如今,只需三分钟即可做出一份内容齐全、格式精美的 PPT。未来,机械的重复性工作将完全可以交给
AI,员工可以集中于创造更大价值的工作,企业竞争力增加同时增加社会财富。
百度智能云举行的闭门沟通会上,现场演示文心一言生成 PPT
毫无疑问,大模型将是未来十年科技圈最重要的叙事之一。
百模大战
" 百模大战 " 来了,一如当年的 " 百团大战 "。
国内大公司纷纷扎堆推出大模型,百度文心一言最先,360、腾讯、阿里、商汤、科大讯飞、字节等纷纷紧追。大模型产品大多同时兼具对话问答、文章创作、代码写作等多项技能。市场上供给多了,但这些产品的
" 智力 " 水平却参差不齐,如何挑选成为了一个难题。
目前主流观点认为,可以有以下两个标准:
第一,从芯片到框架、模型再到应用的全链路环节都具备极为优秀的性能。
芯片决定了算力,这是 AI 训练的基础。OpenAI 曾做过一笔测算:2012 年开始,全球 AI 训练所用的计算量平均每
3.43 个月便会翻一倍,远超摩尔定律。在肉眼可见的未来," 算力不足 " 都将会是制约 AI
发展的最大因素。因此,芯片要做到性能过硬。
只有制造出算力极强的高端芯片,才能满足智算时代的计算需求,让云好用,这是基础条件。
而在框架和模型层面,软件适配程度要更高,算法积累足够,大模型能力要更强。深度学习框架需要做到全栈自主可控,推动大模型不断迭代升级。在此基础上,推出多样云服务使得大模型适应各产业的数字、智能化需求,做好模型即服务(MaaS)。
第二,能为大家提供全链路的服务保障。
服务商不仅要具备多元的能力,还需要将它们有机地结合起来:如此一来不仅能带来更高的可靠性、帮助企业降本增效,还降低 AI
使用门槛,既易用,又好用。
好的智算基础设施,就是要高效解决算力、算法、数据处理等多维度的问题,而且这些维度之间不是独立存在的,而是互相依赖,相互优化、紧密耦合,从而提升整体基础设施效能。
比如芯片解决算力问题,框架解决算法开发问题,大模型解决模型泛化问题,他们三者就犹如三人四足比赛中的团队合伙人,只有彼此心有灵犀、协调互补,才能打出完美的团队配合,赢得比赛胜利。
百度的解决方案,是将文心一言大模型与百度智能云服务结合起来,提供一种更便捷的一站式服务,即 " 云智一体 "。
该方案同时提供了算力与大模型服务,企业只需提供自身行业的数据做微调,即可快速生产出符合市场需求的 AI
产品。不过,百度智能云能做的还不止微调一项,它还额外集成了推理与托管服务。
推理是大模型所具备的一项能力,指利用训练好的 AI
去进行结论推导的过程。如果说微调是将已有的房子重新装修一遍,那么推理则相当于给你空地和材料,搭建一个全新的房子。虽然推理的成本高于微调,但能让大模型新增更多原本不具备的能力,满足企业更深层次的开发需求。
至于托管,则能帮助较为早期的大模型创业者解决搭建团队的难题。高薪的 AI
研究员一直是市场上最抢手的资源之一,初创企业不仅资金有限,且很难在人才竞争中获得太多优势。相比之下,托管服务则会提供一支高度专业的团队,帮助第三方企业管理他们的
AI 解决方案。
由此可见,微调、推理、托管三大服务的功能各不相同,能够满足不同阶段企业的需求。
如今,上述 " 云智一体 " 服务已成为一种行业共识。百度智能云作为这一概念的提出者,具备一些独有的优势。
2022 年,百度副总裁沈抖升级了原有的架构,正式对外官宣了 " 云智一体 3.0"。该架构的优势在于,形成了 " 芯片 -
框架 - 大模型 - 行业应用 "
的智能化闭环路径,百度是全球唯一在每一层都有自研产品的公司。比如芯片层有昆仑芯,框架有中国市场份额第一的飞桨。
沈抖认为,四层架构的高效协同,能实现更高的运转效率," 我们能在同等算力投入下,把某个应用的性能提高
100%,相当于让算力需求降低了 50%。" 这是百度智能云非常独特的优势,也使得百度智能云成为国内第一个训练出大模型的云。
如今," 云智一体 " 不仅仅只是一项服务,更有可能成为数字时代的一种新基建。经济学博士任泽平曾在 2023
年跨年演讲中预测,智能云将成为数字经济的重要技术支撑,并在未来 20 年成为支撑中国经济繁荣发展的新型基础设施。
对当今社会而言,这些变化既是将来时,也是进行时—— AI
正在以肉眼可见的速度重塑这个社会。对此,舆论上充斥着许多不安的声音。不过,当时代的浪潮扑面而来,企业、个体最好的选择,只有拥抱它。
尾声
不论是红杉资本还是黄仁勋,都喜欢将当下称为 "AI 的 IPhone 时刻 "。
初代 IPhone 发布于 2007 年。彼时,摩托罗拉、诺基亚才是手机市场的霸主,张小龙还在忙着做 QQ
邮箱,百度搜索的网页访问量每天都在增长,没人知道世界上第一款智能手机到底会带来些什么。
然而,当乔布斯讲出那句 " 今天,苹果将重新发明手机 " 时,世界依旧为之沸腾,变革的伏笔已经埋下。相比于市面上的其他产品,初代
IPhone
的革新之处其实只有两个方面:一是取消了键盘,改用触屏设计;二是借鉴了电脑的设计,尝试在手机中加入浏览器、股票、天气等应用。
10 年之后,初代 IPhone 的这两大设计已然成为了智能手机的设计标准,以此构建的移动互联网改写了数十亿人的生活。
沈抖曾在采访时提到,初代 IPhone
的出现,将手机分成了两类:智能手机与非智能手机,而非智能手机最终被淘汰了。大模型出来后,同样会把企业分成两类:一类是智能企业,一类是非智能企业——类似的故事有可能会再次上演。
关于大模型的未来,如今看来仍有些模糊,但唯有一点是确信的——新时代的序幕正缓缓拉开,一场重新定义时代的比赛已经开始。