两万字拆解硅谷投资AI的15条关键洞察

文章来源: - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数



生成式AI,作为当今最具颠覆性的技术之一,正在引领各行业进入全新的发展阶段。

2025年伊始,围绕生成式人工智能的竞赛愈发激烈。美国总统特朗普上任第二天,白宫宣布启动名为“星际之门”(Stargate)的人工智能项目,由美国甲骨文公司、OpenAI与日本软银集团联合出资打造。

1月14日,OpenAI推出了名为Tasks的测试版功能,标志着ChatGPT正式迈入AI智能体(AI Agent)阶段。春节期间,中国大模型DeepSeek凭借其推理模型DeepSeek-R1引起了广泛关注,该模型以OpenAI十分之一的成本达到了GPT-o1的同级别表现。同时,DeepSeek在1月26日登顶苹果App Store和谷歌Play Store全球下载榜首,上线18天内下载量突破1600万。

紧接着,OpenAI继续推动创新,发布动作不断:1月24日发布了一款代号为“Operator”的全新AI Agent产品;随后2月1日推出o3-mini,专注于STEM领域,支持函数调用、流式传输、结构化输出和搜索结合等功能;2月3日又推出面向深度研究领域的智能体产品,进一步拓展了其在专业领域的应用。谷歌也不甘示弱,在2月6日凌晨发布了性能更强的Gemini 2.0系列模型,包括Pro、Flash和Flash-Lite三个版本。

如今,生成式AI正迎来类似的历史时刻,这不仅是科技革命,更是商业重塑的契机,我们正站在这一变革的起点。每一次平台级机会的背后,都会催生出一批市值百亿、千亿美金的公司。从互联网到移动互联网,再到云计算和区块链,每一次基础设施的创新都激发了无数新的应用场景,推动科技巨头的崛起。

回顾这些历史周期,我们发现,基础设施的完善往往会催生应用公司的黄金发展期。生成式AI作为新型基础设施,正处于这一发展轨道的起点。未来,这些公司将通过创新的商业模式和智能化产品,重新定义我们的工作和生活方式,迎来属于自己的千亿市值时代。展望2025年,大语言模型将会走向何方?在这份报告中,我们将从行业变化、技术进展和应用趋势三方面,对大模型的发展进行深入前瞻。

两万字拆解硅谷投资AI的15条关键洞察

AI疯狂吸金,千亿独角兽冉冉升起

2024年,最为人们印象深刻的,便是生成式AI公司——OpenAI高达65亿美元的融资。这笔融资让这位生成式AI的弄潮儿估值达到约1500亿美元——一只大型千亿独角兽正在硅谷茁壮成长,而这只是2024年中最具代表性的一个。生成式AI所创造出的“造富神话”,多次让人们情绪高涨,AI就像一个庞大的“吸金兽”,以飓风般的速度吸走了大部分的风投资金。

涌入AI赛道的大量资金和顶尖创业者,正在催生出了一批新晋独角兽公司。根据硅兔君复盘,在过去18个月新增的73家独角兽中,有28家是AI公司,占到了新增独角兽的大约三分之一。例如特斯拉创始人埃隆·马斯克在2023年7月创立的xAI,2024年3月发布了首款AI聊天机器人Grok-1,随后发布了Grok-1.5V大模型,其在最新一轮融资中,估值达到240亿美元;Xaira Therapeutics,作为AI+生物技术领域的公司,其联合创始人David Baker在“AI+蛋白质”领域颇有造诣,其团队研发出AI大模型RFdiffusion,用扩散模型构建的创新型生成式AI系统,并且可以按需构建AI分子,估值为27亿美元;Cognition AI是一家由三位华人创业者创立的公司,2024年3月,其推出了世界上第一位完全自主的AI软件工程师,在最新一轮融资后估值达到20亿美元。





制图:硅兔赛跑,数据来源pitchbook

这些AI独角兽的成长速度远快于非AI独角兽,前25%的AI公司在不到2.5年内就已经达到独角兽估值。同时,最大规模的交易也流向了AI的初创企业。

另一个趋势是——融资额正在变大,头部效应更加明显。根据第三方数据分析机构Pitchbook的数据,2024年,光是北美的风险投资总金额达到了2164亿美金,较2023年增长了28%。其中2024年四季度,北美地区的融资额达到了771亿美金,创下了2年以来的新高,光是人工智能相关项目的投融资额达到了991亿美金,占到了总额的45.8%,达到了历史最高水平。过去美国最大的10笔风险投资交易每年通常占总融资额的9%左右,而自2023年以来,这一比例升至20%。

过去一年,我们在硅谷,这个北美将近50%投融资发生的地区以及最能够代表北美创投发展的地方,捕捉到最新的一些变化并试图梳理出最前沿的趋势:

首先,针对人工智能创投领域,有四大行业趋势值得关注:

1、如果说2023年的AI Agent,只是停留在诸如斯坦福小镇这样的虚拟世界;2024年,AI Agent的商业化条件逐渐成熟;2025年则是Agent AI商业化的元年,资本的关注和注入加速,会加剧各大科技公司和初创企业在Agent AI 领域的竞争,推动技术创新和产业应用的落地。

2、一方面围绕生成式AI基础设施的投资规模空前,带动了一系列产业链公司;另一方面,业界正在尝试一些低成本、性价比高的做法,减少训练的投入却能达到与GPT-4/4o等同的效果;

3、专有AI模型正在释放AI潜力,他们正在解决通用大模型不能解决的问题,逐步具备较高的商业化潜力。

4、生成式界面将迎重大发展,用户能够有更好的互动体验,将带来新的商业模式和市场机会。

其次,在人工智能的技术方面,我们总结了八大趋势:

1、2025年,大模型将更加关注多模态的融合与交互,其训练方法正在不断优化;

2、一直以来,尽管大模型能力在不断增强,但仍无法解决人工智能的“黑箱”问题。2024年,许多公司陆续推出了更透明的模型架构和解释工具以缓解“黑箱”带来的麻烦。2025年,可解释性工具将进一步普及;

3、2024年,大模型的长期记忆能力迎来了一系列技术突破。2025年,随着多模态技术的进步,跨模态记忆融合将在视频、文本、触觉和嗅觉数据的编码上取得突破,进一步提升模型的记忆能力。

4、合成数据作为加速大模型训练的方法,将在2025年进一步发挥潜能。

5、2025年,随着更强大的计算资源的普及和优化,规模定律将继续提升,这使得更多的中小型企业可以进入AI领域,加速了大模型的普及,效率跃迁曲线下,大模型的成本更低了。

6、2025年,强化学习(RL)与大语言模型的结合有望进一步提升模型的泛化能力,并使得从预训练到后训练和推理迁移的转变成为可能。

7、随着AI应用场景的多样化,简化算法架构将成为AI发展的重要方向。2025年,更多优化算法将被用于强化学习等领域,以减少计算资源的消耗。

8、随着AI蒸馏技术的普及,相关的法律和监管框架也需要不断加强,以确保在模型开发和应用过程中不会侵犯知识产权或数据隐私。

另外,在人工智能的应用方面,2025年也有了一些新的变化:

1、2025年,企业级AI应用迎来深入发展,越来越多企业将从人工智能中获利。AI Agent成为行业颠覆性力量,生成式AI推动传统行业进入智能化时代。随着企业在生成式AI上盈利,商业模式转变为按工作成果收费,取代传统的SaaS席位收费。

2、2025年对于AI应用来说,下一个重大事件将属于消费。我们期待一个“杀手级”AI消费应用的诞生。

3、在AI应用端,企业不再依赖单一模型,而是会根据不同的应用需求和场景,将不同模型模块进行组合,定制出符合自己业务需求的模型。

趋势一 :2025年,AI Agent元年拉开序幕

人工智能未来学家雷·库兹韦尔 (Ray Kurzweil)表示,2025年,我们将开始看到从聊天机器人和图像生成器向“代理”系统的转变,这些系统可以自主完成任务,而不仅仅是回答问题。人工智能系统正在从单一的交互模式,走向专门且相互关联的代理。

AI Agent,也称为人工智能代理,通常是指能够感知环境、进行自主理解、决策和执行动作的智能体。根据咨询公司来觅PEVC的统计,自2024年以来,全球AI Agent赛道的融资金额已突破665亿元人民币。从整体来看,这些资金主要流向了在技术与市场潜力方面处于领先地位的头部企业。

科技巨头纷纷布局AI Agent,以抢占未来智能交互的制高点:

  2024年,OpenAI凭借其强大的技术实力和广泛的市场应用,官宣65亿美元新融资,成为万亿独角兽,也成为全球AI Agent领域的主要资金流之一。

  埃隆·马斯克创立的xAI,希望将AI Agent与人类深度整合,创建全球首个AI Agent与人类共存的社交平台,xAI在2024年12月完成60亿美元融资,估值达到了近500亿美元。

  谷歌也全力推广商用AI Agent,发布了全球为数不多的商用AI Agent市场,为企业提供一站式 开发、部署和应用生态。

  微软在2024年11月的Ignite大会上宣布已建立全球规模最大的企业级AI Agent生态系统,企业用户可通过Azure AI目录访问超过1800个AI模型。此外,微软的Copilot Studio平台已支持用户创建自主Agent,并正式进入预览阶段。

  苹果也在开发者大会上展示了其最新的AI成果Apple Intelligence。

2025年,OpenAI推出的智能体功能(AI Agent)以及一系列基于生成式AI的智能系统,它们开始具备真正的自主学习和推理能力,1月24日,OpenAI发布了一款代号为“Operator”的全新AI Agent产品,与其他各家Agent相比,它会通过自有的CUA(电脑控制Agent)系统进行复杂的思维链反思和步骤规划,可以大大提高其完成任务的精度和复杂性。Operator的创新之处在于其成功实现了从认知到执行的完整闭环。这一能力的拓展不仅是技术上的突破,更是AI技术迈向更高层次发展的关键一步。

AI Agent不再是单一的辅助工具,而是可以独立进行深度学习、理解和推理的智能系统,赋能企业和个人高效完成复杂任务,推动生产力的大幅提升。2025年,AI智能体的全面普及将不仅改变技术产业的格局,还将在各个领域深刻影响人类的生活方式,从而使这一年成为AI Agent真正崭露头角的元年。

趋势二:基础设施军备竞赛:投资空前,低成本做法渐成趋势

一年多以前,基础大模型制造商OpenAI,在芯片制造商英伟达生产的25000个最新进GPU集群上训练了GPT-4。随后,马斯克表示他在一个数据中心有100000个GPU,并计划购买200000个。

头部公司通过大规模资金投入,抢占人工智能基础设施的制高点,而以英伟达为代表的硬件厂商也在以前所未有的速度上不断突破技术极限。例如,英伟达的顶级芯片性能相当于300部高端iPhone的处理能力。

在这场基础设施竞争中,埃隆·马斯克的X平台部分业务——xAI的“Colossus”训练集群,成为世界上最强大的人工智能训练集群之一。这个集群仅用122天便建成,预算高达30亿至40亿美元,成为人工智能基础设施建设的里程碑。目前,xAI计划将集群容量翻倍,进一步增强处理能力。Meta也在大规模投资硬件,近期公布了其24000个GPU数据中心规模集群的两个版本,旨在支持其下一代人工智能模型。

虽然目前GPU集群比传统数据中心小,但对人工智能计算不断增长的需求将需要大规模的基础设施扩展。包括Meta、亚马逊、Alphabet和微软在内的主要科技公司正在推动对人工智能基础设施的空前投资。超大规模数据中心运营商预计2024年资本支出(CapEx)将超过 2000 亿美元,到2025年这一数字预计将接近2500亿美元。尽管并非所有支出都直接与人工智能相关,但很大一部分都分配给了人工智能,并且这个份额在不断增加。微软和OpenAI已讨论推出一个专门用于人工智能工作负载的5千兆瓦数据中心,可能耗资超过1000亿美元,甚至可以买得下一艘最新型核动力航空母舰。

在这场人工智能基础建设中受益的,是这个产业链中的组成部分。

第一类就是数据中心的托管服务提供商——也就是向大公司提供数据中心租赁容量的公司,他们是数据中心市场的重要组成部分。这批数据中心的托管服务提供商如今也在拓展其以人工智能为重点的基础设施服务。例如,超大规模托管领域的领导者 Equinix 已获得近 150 亿美元的资金用于在美国建设人工智能数据中心,主要为客户提供基础设施,以训练和部署大规模私有人工智能模型,这些客户往往是科技行业以外的财富 500 强公司。

另一类受益者则是人工智能数据中心建设中的辅助产品,例如低功耗CPU、内存、存储系统、网络组件以及冷却和电源管理设备。冷却产品供应商 Vertiv在2024年7月至9月的三个月内实现了19%的同比收入增长,并提高了未来12个月的业绩指引。

第三类则是围绕数据中心能源生产、热管理和电源管理解决方案的公司。Alphabet董事长在2023年2月表示,与LLM互动可能比标准关键字搜索的花费高出10倍。另外,根据谷歌研究员Urs Hölzle的文章提及,标准Google搜索使用的电力为0.3Wh,这意味着每次LLM互动的耗电量约为3Wh。这个数字与SemiAnalysis在2023年初对ChatGPT运营成本的评估一致,该评估估计ChatGPT每次请求耗电量为2.9Wh,如果每天响应1.95亿个请求,估计平均每天耗电量为564MWh。

《纽约客》报道称,ChatGPT每天用电量相当于1.7万个美国家庭的用电量。如果基于当前模型和技术,让每个标准Google搜索都变成 LLM 交互,对 Google总用电量的潜在影响巨大。第三方分析机构SemiAnalysis估计,带有大模型交互功能的谷歌搜索单次请求的用电量达到将近9Wh,谷歌每天搜索大约需要90亿次,则需要81000MWh。

这一趋势促使人们对位于数据中心设施附近的核能和能源生产等技术以及热管理和电源管理解决方案进行投资。

不过,如今科学家和业界正在寻找更聪明并且资源密集度更低的方法来解决训练人工智能模型所需要的算力和能源问题。例如通过蒸馏技术,这项技术的践行者——DeepSeek,这家国产大模型也给美国硅谷提供了更多低成本的训练参考。

DeepSeek大模型性能在多个方面比肩OpenAI,其中DeepSeek V3,整个训练过程仅用了约2000张二流芯片进行训练,官方称成本仅占用约550万美元,而Meta的模型则使用了16000个性能最强的一流芯片。并且,DeepSeek-R1通过重新设计训练流程、以“少量SFT数据+多轮强化学习”的办法,在提高了模型准确性的同时,也显著降低内存占用和计算开销,每百万输出tokens16元,大约是OpenAI o1运行成本的三十分之一。

在这样的竞争压力下,0penAI推出了其成本更低的o3-mini,比o1-mini便宜63%,比完整的o1模型便宜93%,每百万tokens的进出费用分别为1.10美元/4.40美元(享有50%的缓存折扣)。谷歌发布的Gemini 2.0 Flash-Lite是Gemini 2.0系列的新变体,每百万tokens0.3美元,是谷歌目前最便宜的模型。

可以窥见,在AI产业的竞争中,降低训练成本、提高计算效率和优化模型性能已成为企业的主要竞争策略。尤其是训练流程的优化,成为了公司在大模型市场中占据竞争优势的关键能力之一。2025年,低成本做法也将成为行业的主流趋势。

此外,一些大公司也在开发专用人工智能芯片。例如谷歌、苹果、微软和OpenAI,这些专业芯片可以比英伟达这样通用处理器运行更高效;或是采用一些方法提高芯片的使用效率,例如用多种模型,通过每种模型针对处理不同的问题,以此来缩短芯片的处理时间等。还有AI推理芯片制造商Groq ,2024年估值达到28亿美元,在Blackrock领投的新一轮中融资6.4亿美元,其专为AI推理任务设计的芯片“语言计算单元(LPU)”能以现有解决方案1/10的价格、10倍的速度运行与ChatGPT、GPT-4o相似的模型。目前,在Groq开发的、对标英伟达CUDA的软件开发平台GroqCloud平台上,约有40万开发者。

趋势三:专有模型有望释放AI的应用潜力

大模型就像一位“通才”,但在一些专业领域往往缺乏针对性和操作性。为了突破这一瓶颈,越来越多的公司开始专注于开发专有模型,通过在特定领域数据上微调模型,实现更高效的工作流程自动化,提供更具操作性和任务导向的工具。这一趋势正在逐步升温,并在多个行业展现出巨大的应用潜力。以下为一些具体的案例:

金融服务领域,提升决策效率与洞察力:摩根大通和彭博社等机构正在利用其庞大的内部数据集开发大语言模型,以提升运营效率和决策能力。这些模型能够提供独特的市场洞察、风险分析和报告生成。比如彭博社于2023年开发了BloombergGPT,专注于金融领域的数据分析和预测,通过微调金融数据,能够更高效地处理复杂的金融任务,如市场趋势分析和投资策略制定。

网络安全领域,精准检测与应对威胁:美国网络安全解决方案提供商Palo Alto Networks正在训练自有的大语言模型,这些模型能够帮助安全专家更好地检测和应对网络威胁。该公司在2024财年四季度披露了超过2亿美元的AI相关经常性收入,同比增幅近四倍。AI大模型通过模拟复杂攻击场景,帮助安全团队快速发现系统漏洞并提供修复建议,显著提升了网络安全的实时预警和用户行为分析能力。

国防领域,用于军事与情报分析:美国数据分析和软件公司Palantir近期获得了一系列合同,用于支持AI的服务,包括加速部署适用于国防和军事领域的AI模型。这些模型能够提升情报分析、目标识别和决策支持能力。例如,AI训练平台可以创建逼真的战斗场景,帮助士兵在安全环境下进行战术训练。此外,AI技术在军事领域的应用还包括无人化作战系统和沉浸式训练模拟。

生命科学领域:2024年,科研人员使用AI的比例快速增加,AI对科学研究方法和流程的变革效应也开始显现。比如,AlphaFold 3.0在2024年发布,不仅提高了蛋白质结构预测的准确率,还扩展到了DNA和RNA等生物分子的研究,这项技术帮助科学家快速预测药物分子与目标蛋白质的结合情况,大大提高了药物研发的效率。2025年,多模态大模型将进一步融入科学研究,赋能多维数据的复杂结构挖掘,辅助科研问题的综合理解与全局分析,为生物医学、气象、材料发现、生命模拟、能源等基础与应用科学的研究开辟新方向。

除了上述领域,专有模型还在其他行业展现出广泛的应用前景。例如,Two Sigma在量化投资中使用AI Agent进行选股策略,通过分析财务数据和宏观经济指标,识别潜在的投资机会。Shopify Sidekick则利用LLama 2生成产品描述、回应客户查询和创建营销内容,帮助小企业主提升运营效率。

这种专有模型通过在特定领域的数据上进行微调,能够提供更具针对性和操作性的解决方案。随着AI技术的不断发展,未来专有模型将在更多领域得到应用,成为推动行业创新的重要力量。

趋势四:推动动态自适应界面,实现高度个性化的交互体验

生成式界面(Generative Interface)是指利用生成式模型,如生成对抗网络(GANs)或变分自编码器(VAEs),自动创建用户界面元素或交互流程。这种界面不是通过传统设计方法人工制作,而是通过机器学习算法根据输入的数据、需求或上下文生成。

在2024年,生成式用户界面(Generative UI)在动态和自适应界面、AI与算法融合、个性化体验等方面取得了显著进展。大规模生成式预训练模型(如GPT系列、DALL·E等)已被广泛应用于自动化界面设计。开发者借助这些模型,可以快速生成和调整界面元素,如按钮、布局、色彩搭配等,甚至可以根据用户反馈实时调整界面的外观和功能。

此外,生成式界面逐步在增强现实(AR)和虚拟现实(VR)环境中得到应用,尤其是在需要复杂交互的沉浸式体验中,AI帮助生成自适应、动态变化的虚拟界面。

例如,英伟达在2024年SIGGRAPH大会上展示了利用实时生成式AI创建沉浸式沙漠世界的研究成果。英伟达还通过Holoscan技术赋能手术机器人,加速AI技术在医疗实践中的应用。这些突破都展示了生成式AI在动态生成虚拟界面方面的潜力。

可以说,随着用户需求变得更加多样化和复杂,传统的固定界面无法满足个性化的交互需求。动态自适应界面能够根据用户的行为、偏好和环境变化实时调整显示内容和功能,提供更加定制化的体验。

2025年,生成式界面将迎来重大发展,成为推动用户体验变革的关键力量。越来越多的应用将采用基于用户交互和逻辑工作流程自适应的动态用户界面,生成式UI将使应用能够自动生成表单、仪表板或可视化等界面元素,并且,这些元素将根据用户的具体需求和操作量身定制。例如,Web开发平台Vercel和Bolt.new等公司正在开发能够创建高度适应性和个性化用户体验的平台,提供实时演进的界面,以满足不断变化的需求,从而简化工作流程。



八大技术趋势,推动AI泛化能力

趋势一:多模态能力的增强和集成

2024年,多模态AI取得了显著进展。OpenAI、Google DeepMind等机构推出了更强大的多模态模型,如视频生成模型Sora的诞生、OpenAI多模态AI大模型GPT-4o的到来、CLIP模型通过跨模态表示实现图文搜索,用户可以通过输入文本搜索相关图像或视频。此外,文本到图像生成(如DALL·E、Stable Diffusion)和视频生成模型也取得了显著进展,进一步拓展了AI的交互体验。

在谷歌云发布的《2025年AI商业趋势》报告中,多模态AI被放在首位。谷歌云预测,2025年将成为企业采用AI技术的关键一年,这一趋势主要由多模态学习及其实现的情境感知所驱动的,并预计2025年全球多模态AI市场规模将达到24亿美元。

2025年,大模型将更加关注多模态融合与交互,能力的提升与增强。AI不仅能够生成文本,理解图像、视频中的上下文,甚至在多模态环境中进行决策。比如,结合视觉与语音的能力,模型能够更好地理解复杂的场景,并做出合适的反应。

此外,多模态模型的训练方法也在不断优化,例如采用分阶段训练策略,先固定大语言模型的权重参数,对图像编码器和桥接组件进行初步训练,再进行整体训练,从而提升模型性能。

趋势二:大模型的可解释性表现更强

可解释人工智能 (xAI) 是人工智能领域的一个新兴领域。随着人们对人工智能决策过程透明度和问责制的需求增长,尤其是在一些人工智能系统变得越来越复杂并部署在金融、法律或医疗保健等高风险领域。例如,考虑医院用于筛查患者X光片的肿瘤检测 CNN(卷积神经网络) 模型的情况。但是,当技术人员或患者不知道其工作原理时,他们如何能相信其结果?这正是我们需要方法来了解影响任何深度学习模型决策的因素的原因。

另外,AI的安全性问题是一个不可忽视的关键挑战。尤其是大模型在做出决策时的“思考过程”对于用户和开发者来说变得不透明,它就像一个“黑箱”,决策过程难以解释和追踪。若这些模型未经过严格的审查和验证,它们可能会做出无法被察觉的有害决策,甚至加剧社会偏见和不公。因此,加强对大模型的监控、审查和可解释性要求是提升AI系统安全性的重要一步。

2024年,大模型的可解释性取得了重要进展。OpenAI、Google DeepMind等机构推出了更透明的模型架构和解释工具,如GPT-4的可解释性增强版本和Gemini的跨模态解释功能。同时,自监督学习和符号AI的结合提升了模型的内在可解释性,减少了“黑箱”问题。行业也开始重视可解释性的标准化,例如欧盟推出《人工智能法案》,要求高风险AI系统提供清晰的决策解释。

2025年,可解释性工具将进一步普及,模型将内置更强大的解释能力,实时生成决策依据,并支持多模态数据的跨模态解释,帮助用户理解复杂AI模型的决策过程。

以DeepSeek为例,通过纯算法自主进化的Zero模式与仅需数千条人工标注数据的R1模式组合,既保留模型自主进化能力又保障人类可解释性——Zero模式使得模型能够自我进化和发现数据中的规律,而R1模式通过引入人工标注数据为模型提供了一个监督和解释的框架。这种结合确保了模型在保持自主学习能力的同时,也能够被人类理解和控制,从而提升了可解释性。

此外,伦理和隐私保护将深度融入可解释性设计,确保AI系统既透明又安全,推动大模型在高风险场景中的广泛应用。以下是一些提升的方向和工具:

○ 自监督学习与模型可解释性:通过自监督学习,AI系统可以在缺乏大量标注数据的情况下,通过理解数据的内在结构来进行学习,这种方法有助于提升模型的透明度,使得我们能够更好地理解其学习过程。

○ 生成对抗网络(GANs)和模型蒸馏:通过生成对抗网络和蒸馏技术,开发者能够简化复杂模型,同时保持高效性和准确性,这种方法使得大规模深度学习模型更加易于解释。

○ 增强推理框架和可视化工具:新一代的AI推理框架将更注重可视化,帮助用户以更直观的方式理解模型决策的依据。例如,基于图像或文本的AI系统,新的可视化工具可以清晰展示模型如何关注不同的输入特征,从而提升其可解释性。

需要一提的是,AI的安全不光需要提升可解释性,还需要着重于法律合规性、安全审计和滥用防范等方面,推动AI技术的负责任应用。

趋势三:大模型长期记忆能力迎来深层次变革

许多大模型(如基于Transformer架构的模型)在处理长文本或复杂上下文时,常常会面临信息丢失等问题。传统模型一般有固定的“记忆窗口”,当文本或输入信息过长时,模型往往会忘记最初的信息,或者在处理过程中只关注较近的上下文。因此,长期记忆的核心需求是让模型能跨越多个时刻、任务和场景记住信息,并能在合适的时机提取和利用这些信息。

目前,大模型的长期记忆能力迎来了一系列技术突破。首先,在上下文窗口的扩展上,比如2024年,Google Gemini 1.5 Pro突破性地实现了最高可达1000万token的处理能力。到2025年2月发布的Gemini 2.0全家桶,最强Pro版本可支持到2M上下文。

其次,外部记忆系统的引入推动了大模型记忆能力的发展。如IBM WatsonX的实时知识图谱更新功能使得在医学诊断等特定领域的记忆准确率获得了大幅度提高。持续学习机制方面,Meta的LoRA-X架构通过参数隔离技术降低了多任务干扰,OpenAI则部署了分布式记忆训练系统,使百万设备协同进化,提升了记忆系统表现。在记忆检索方面,Anthropic的ContextRouter模块和微软的MAVEx系统分别通过动态记忆权重分配和跨模态联合检索,优化了记忆检索的准确性与效率。

第三,隐私与安全问题也得到了关注,Google推出的Memory Provenance框架增强了记忆的透明度和可控性,而HuggingFace的SafeMemory工具包通过差分隐私技术将隐私泄露的风险大幅度降低。这些技术突破使大模型的长期记忆能力得到了显著提升,推动了多个领域的应用发展。

2025年,大模型的长期记忆技术将迎来新的发展趋势。比如,混合窗口架构或将成为上下文处理的新范式,能够根据任务需求动态调整局部和全局注意力的范围,提升处理效率。

此外,随着用户对个性化和定制化的需求不断提升。个性化记忆系统能够根据用户的特定需求、偏好和行为习惯构建专属的记忆图谱。例如,AI助手可以记住用户的兴趣、常用的命令、偏好的回答风格等,从而提供更加精准和符合需求的回复。

不过需要注意的是,尽管大模型在长期记忆方面取得显著进展,但仍面临技术挑战,包括记忆冲突解决、多来源记忆的置信度评估体系、能耗瓶颈和认知偏差防控问题。

趋势四:合成数据或加速大模型训练

2025年,合成数据作为加速大模型训练的一种重要方法,正在成为AI发展的关键趋势。马斯克在2025年CES(消费电子展会)的访谈中提到,随着人类累积的知识几乎被AI训练完毕,未来的AI系统将不得不依赖合成数据进行自我生成和学习。这一观点突显了合成数据在未来AI技术发展中的潜力。

目前,多个科技巨头已经开始在AI模型训练中广泛应用合成数据。微软、Meta、OpenAI和Anthropic等公司纷纷将合成数据作为增强模型训练效率和拓宽训练数据源的有效手段。例如,2024年下半年发布的Llama 3.1、o1、DeepSeekV3和Phi-4等模型均报告了使用合成数据进行训练。

根据科技市场研究机构Gartner的预测,到2024年,AI及分析项目中使用的数据中,60%以上将来自合成数据。合成数据能够帮助AI系统在真实数据难以获得或标注成本过高的情况下,生成具有代表性且符合特定任务需求的数据,大幅降低了对实际数据的依赖。

然而,合成数据的使用仍然面临诸多挑战与争议。2024年7月,《Nature》期刊刊登的论文指出,LLM生成的合成数据可能会污染下一代模型的训练集,导致模型性能下降,甚至发生“崩溃”。这一风险类似于“数据中毒”问题,严重时可能让模型无法做出有效的推理和判断。英伟达也发布了其Nemotron-4 340B开源模型,声称使用了98%的合成数据,但同时也强调需要加强合成数据的质量控制,以避免潜在的负面影响。

尽管面临风险,但合成数据在加速大模型训练方面的潜力仍然巨大。尤其在高性能计算和多模态数据融合等领域,合成数据可以快速扩展训练集的规模,并提供更多样化的训练情境。

因此,为了应对合成数据带来的挑战,AI研究者们也在不断优化生成数据的质量和多样性,例如通过强化学习算法对合成数据进行校正,或者结合人类监督和自动化评估机制来减少“数据污染”风险。

趋势五:大模型普及加速,效率跃迁曲线下成本更低了

在2025年1月,Anthropic的CEO-Dario Amodei 发表了一篇长达万字的深度分析报告。肯定了DeepSeek的技术突破:其最新模型在特定基准测试中已逼近美国顶尖水平,并尝试从三个维度将中国的AI进步纳入全球技术演进坐标系进行定位:算力规模定律、效率跃迁曲线、范式革新动能。

这些维度的选择反映了他对国产AI评估方面的理解:关注硬件和计算能力的提升(算力规模定律),技术的效率提升(效率跃迁曲线),以及新技术范式的创新和推动力(范式革新动能)。这种全方位的定位方式,能够精准捕捉到AI大模型在全球技术演进中的角色及潜力。具体我们解释下这三方面的重要性和趋势:

首先,规模定律是推动大模型发展的基础。随着硬件技术不断进步(如更强大的GPU、TPU和专用AI芯片),训练超大规模模型已变得越来越可行,同时也驱动了云计算和分布式计算的发展,进一步降低了成本。随着更强大的计算资源的普及和优化,规模定律将继续提升,这是2025年AI大模型的关键能力趋势之一。

其次,关于效率跃迁曲线,曲线偏移指的是技术创新带来成本曲线的变化,使得原本高昂的训练成本能够通过硬件优化、模型架构改进等手段大幅降低。这不仅能够降低AI研发的门槛,还能加速技术迭代。比如2024年,硬件创新如量子计算、专用AI加速芯片推动AI训练成本的快速降低。同时,AI框架的优化(如更高效的深度学习框架)和算法改进帮助实现了更少计算资源的更高效训练。

在前文中我们也提到了,目前对于AI基础设施方面军备竞赛激烈,低成本做法渐成趋势,尤其是DeepSeek通过采用OpenAI等先进模型,利用蒸馏技术将其知识转移。这一过程使得DeepSeek能够在保持较高性能的同时,显著减少训练所需的计算资源和时间。通过模仿OpenAI模型的输出,“学生模型”能够快速学习复杂的模式和推理能力,加速模型的优化过程。2025年,随着硬件和算法的进一步突破,AI开发成本将大幅下降,这也使得更多的中小型企业可以进入AI领域。

此外,新的训练范式(如强化学习、无监督学习等)正在改变AI的学习方式。2020到2023年,AI主要依赖预训练模型,使用大量互联网文本进行训练,并通过少量额外训练进行微调。然而,到了2024年,强化学习(RL)成为新的重点,通过强化学习生成思维链,AI在数学、编程和推理等任务上的表现显著提升。初期阶段投入较少,但效果显著。还有强化学习和自监督学习等新兴范式逐渐在机器人、自动化和多模态学习领域得到应用。

到2025年,这些新训练范式预计将成为AI发展的主流,尤其在复杂任务处理上(接下来趋势六我们会进一步解释)。

趋势六:预训练到后期训练和推理迁移转变

2024年是AI技术飞速发展的一年,尤其是在大语言模型(LLM)和多模态技术方面取得了显著突破。这一年,AI从单一模态向多模态融合迈进,大语言模型通过扩展上下文窗口和采用混合专家架构(MoE)等技术,提升了推理和生成能力。同时,强化学习(RL)开始与大语言模型结合,为模型的泛化能力提升提供了新的方向。然而,随着模型规模的扩大,预训练阶段的性能提升逐渐放缓,行业开始探索后训练和推理迁移的新模式。

2025年,AI技术将进入一个新的发展阶段,Scaling Law的扩展将成为关键趋势之一。强化学习与大语言模型的结合(RL+LLMs)将进一步推动模型泛化能力,从预训练向后训练和推理迁移转变。

这种模式将使AI在特定场景下的表现得到显著提升,同时也降低了训练成本,提高模型的适应性和灵活性。

此外,AI将在更多领域实现落地应用,如智能驾驶、具身智能等,这些领域将迎来技术突破和商业化的加速,但也与此同时会带来更多的安全和风险管理挑战。因此,AI安全和治理将成为行业关注的重点。

需要强调的是,大规模语言模型(LLM)的预训练阶段已经接近瓶颈,主要受到数据、计算资源和模型规模增长的限制,且在通用性提升上边际效益递减。部分研究人员和行业专家担心,对于大规模语言模型而言,传统扩展方式已接近极限。据外媒报道,像OpenAI这样的公司在扩大技术应用时也发现困难重重,其他前沿实验室也面临更严重的挑战。知名数据科学家Yam Peleg透露,一些实验室试图通过延长训练时间和增加数据量来提升模型表现,但结果却遭遇了“收益递减墙”,且情况比公开报道的更为严重。

不过尽管如此,预训练依然为模型奠定了基础,后续的优化潜力是巨大的。在后训练阶段(如微调、强化学习、多模态对齐等)依然存在许多优化机会。比如通过领域特化、任务指令优化、模型压缩等技术,可以提升模型在特定任务上的表现,同时提高其在资源受限环境中的部署效率和安全性。

趋势七:更多优化算法将被用于强化学习等领域

目前,深度强化学习(DRL)的优化算法在多个行业取得了应用突破。为了解决传统强化学习在高维度问题上训练困难的问题,研究者采用了更加高效的算法,如模仿学习和分层强化学习,来提升模型的学习效率和训练速度。比如Google DeepMind 推出的AlphaDev系统由两个核心组成部分构成:学习算法和表示函数。学习算法是在先进的 AlphaZero 算法基础上进行扩展,结合了深度强化学习 (DRL) 和随机搜索优化算法,以执行大规模的指令搜索任务。

此外,RLHF(强化学习与人类反馈结合)的应用开始更加深入和精细。AI大模型开始通过更精确的人类反馈进行训练,从而能够更好地理解复杂任务,并且在人机交互中表现出更高的自适应能力。例如,OpenAI的ChatGPT通过用户的实时反馈不断优化对话能力,以提供个性化和上下文相关的回答。由于RLHF能显著减少对大规模标注数据的依赖,更多AI系统开始通过少量高质量的人工反馈来进行高效训练,从而降低了模型开发和训练的成本。

还有近期处于话题焦点的DeepSeek,R1模型通过强化学习(RL)和基于人类反馈的强化学习(RLHF)进行训练,并针对核心算法模块做了大量的优化处理:比如改造 Attention 模块,通过低秩压缩,让KV Cache的效率达到最优。以及通过训练架构瘦身—例如GRPO算法通过省去传统强化学习中必须的Critic模型(即"双引擎"设计),将复杂算法简化为可落地执行的工程方案。一般传统的强化学习模型通常采用这双引擎”设计——Actor和Critic,Actor负责执行决策,Critic评估Actor的决策效果,二者需要同时进行训练,这增加了计算量和训练复杂度。通过去除Critic模型,GRPO算法能够简化模型结构,降低计算资源的消耗。

随着AI应用场景的多样化,简化算法架构将成为AI发展的重要方向。2025年,更多优化算法(如GRPO等)将被用于强化学习等领域,以减少计算资源的消耗,同时提高模型的执行效率和实时响应能力。

随着硬件资源的不断提升和算法的进一步优化,像GRPO这样的轻量级强化学习算法将被广泛应用于边缘计算和低资源设备上。例如,智能设备、物联网设备和机器人等领域,都会受益于这种简化的算法,实现在硬件条件有限的环境中高效运行。

趋势八:低成本训练与AI伦理,知识产权成为核心议题

春节期间,DeepSeek的DeepSeek-R1震撼了全球科技圈和资本市场,其基于知识蒸馏技术,成功将大型复杂模型的知识迁移到较小模型,实现高效部署。2月6日,斯坦福大学李飞飞团队和华盛顿大学研究人员以不到50美元云计算费用,成功蒸馏出一个名为s1的新推理模型,表现与OpenAI的o1和DeepSeek的R1相似,展示了蒸馏技术的强大潜力。基于竞争压力,2月7日,OpenAI公开了o3-mini的推理思维链,但该推理思维链并非原始数据,OpenAI产品官Kevin Weil表示会找到平衡方式以避免被竞争对手蒸馏。

Kevin Weil的考虑出发点在于,蒸馏通常依赖于将一个较大模型的知识提取出来,并将其迁移到一个更小的模型。如果目标模型能够有效地从源模型中获取有用的知识,且没有太大的性能损失,那么理论上,很多模型都可以通过蒸馏技术进行简化和优化。因此,随着AI蒸馏技术的普及,相关的法律和监管框架也需要不断加强,以确保在模型开发和应用过程中不会侵犯知识产权或数据隐私。

这种低成本训练的模式也引发了业界关于AI模型知识产权和伦理问题的讨论。随着越来越多的研究依赖于现有基座模型进行微调,是否应当给予这些基座模型开发者相应的回报成为一个重要议题。同时,如何确保AI技术的公平使用和共享,也亟待业界深入探讨和解决。



下一个杀手级应用,可能在消费领域

趋势一:越来越多企业从人工智能上挣到钱

过去的2024年,是生成式AI的落地之年。而2025年,则是这些企业级AI应用在已有的落地场景中深入发展的一年。

美国风险投资机构Menlo Ventures在统计了600家美国企业的IT支出(包括模型支出、训练&部署支出、AI应用支出,不包括芯片、云计算等支出)情况后发现,2024年企业的AI相关支出达到了138亿美元,相比2023年的23亿美元增长了超过6倍。在这其中,应用支出的增速最快,6亿美元增长到了2024年的46亿美元。



数据来源:Menlo Ventures

企业AI相关支出的提高,让不同的行业间接获益。第一个受益的是咨询公司。2024年,埃森哲和IBM等咨询公司正在实现大幅的收入增长,其中,与人工智能相关的服务对其营收增长贡献显著,客户希望通过咨询,了解实施人工智能能够获得的竞争优势。根据埃森哲披露,截至 2024 年 9 月,其生成式人工智能咨询预订额近 30 亿美元。

第二个从人工智能中获益的行业是云计算和软件公司。软件公司ServiceNow自推出 “Now Assist” 以来,报告了强劲的生成式人工智能预订量,其首席财务官表示,在新产品系列中,最大新增年度合同价值贡献,来自于人工智能的采用。另外,软件巨头甲骨文的基础设施即服务(IaaS)部门实现了强劲增长,这在很大程度上归因于人工智能工作负载的增加。数据中心的领导者Equinix也因为人工智能基础设施需求获得了大量新合同。

另外,广告行业也从人工智能使用中获益。根据Meta Platforms最近报告,在人工智能的加持下,其广告展示量增长了7% ,每广告的平均价格增长了 11%,季度收入同比增长了19%。

亚马逊集成了基于生成式人工智能的产品图像生成工具,导致某些广告活动的广告展示量显著增加。我们预计,随着人工智能服务需求的扩大,具有独特市场定位、强大分销渠道和特权数据访问权限的云计算、软件应用和基础设施公司将成为主要受益者。随着人工智能市场的成熟,这些科技巨头可能在 2025 年实现加速增长。

我们尝试总结了生成式AI渗透率最高的几个应用场景:AI代码、AI客服支持和企业级搜索。

○ 最高的是AI代码应用,企业对AI代码应用的采用率达到了51%,比如,头部产品 Github Copilot 的ARR(年度经常性收入,是指企业每年从客户那里获得的或期望从客户那里获得的服务或产品回报的收入计算)达到了3亿美金也真实的反映了用户的需求。Cursor、Cognition 等新兴工具在迎来用户快速增长的同时,也获得了资本市场的火热追捧。

○ 其次是AI客户支持,其采用率达到了31%,产品为内部员工或外部用户提供基于产品知识的客户支持。Sierra、Decagon 等初创借力生成式AI的智能,为用户提供符合品牌调性和消费者画像的定制化客服体验,挑战低效、无趣的传统客服。

○ 第三是AI数据检索,其采用率达到了28%,这类应用帮助企业解锁和利用分散在各组织中的数据,将数据孤岛中的宝贵知识管理利用。例如一家初创企业Glean,其业务是企业级搜索,旨在为企业打造内部的Google,核心产品 Glean Assistant 的用户每天平均查询 14 次,远超Google的日均查询次数。在过去一年ARR(年经常性收入,Annual Recurring Revenue)达到了5500万美金。



数据来源:Menlo Ventures

2024年,企业60%的AI应用支出来自企业创新业务的预算,说明企业使用这些应用的态度以尝试和探索为主,生成式AI在企业应用场景中的落地尚处于早期阶段。接下来,随着企业未来各个部门对于生成式AI应用的预算持续增长,哪些生成式AI应用能为企业带来实实在在的回报率,哪些或将分得持续性更长、规模更大的预算,从而支持生成式AI应用生根发芽、斩获1亿美金甚至更多ARR。

① AI Agent正在给企业带来效益2025年,生成式AI应用正在生根、发芽,给企业带来实实在在的现金回报,基于这样的趋势,AI Agent将是这个商业环节闭环的关键。

AI Agent从学术走向商业落地,仅花了三年时间。

AI Agent的第一波高潮来自2023年年初,AutoGPT的火爆,所谓AutoGPT,其实是把学术圈很多的Agent idea简单呈现出来,尽管其让开发者感受到大模型的强大,但很快大家便发现,AutoGPT的实验性强于实用性,难以解决大部分的实际问题。第二波高潮来自2023年9月,AgentGen,通过构建不同职能的Agent,分工协作。

到了2024年,AI Agent开始从实验走向现实。

2024年末,OpenAI首席执行官Sam Altman提出了AGI(通用人工智能)的五层框架:

Lv1 - Chatbot,具备基础的对话能力,能够理解和回应简单的文本输入

Lv2 - Reasoner,具备基本的逻辑推理能力,能够分析复杂信息并进行推断

Lv3 - Agent,具备理解复杂指令的能力

Lv4 - Innovator,具备创新和创造的能力

Lv5 - Organizer,具备协调和管理庞大系统、资源和团队的能力

他提出,如今我们正处于第二个阶段并非常接近第三个阶段的状态。

Lv3的Agent智能体能够自主与环境交互、收集信息,具备持续规划并执行多步骤、长时间任务的能力。要达成这个阶段,需要一个推理能力、逻辑能力更强的模型(可能是o1的下一个版本、也可能是对标o1的开源模型)。同时,服务AI Agent应用的基础设施也必不可少。

当下,企业出于安全性、准确性、稳定性等因素的考量,更倾向于使用 AI Copilot (人在回路中参与)增加人在工作流中的效率,而不是直接采用端到端自动化 AI Agent。随着底层模型能力和Agent框架开发的持续升级,Agent应用将为企业提供更智能高效的数字员工。人与AI的协作关系将从AI赋能人工作,逐渐转变到人监督指导AI完成工作,最终达到AI自主完成工作。这个转变会在未来几年迅速发生。

至于适合AI Agent最先产生价值的应用场景,2025年大概将延续现阶段生成式AI渗透率高的场景,例如代码编程、客服、销售、营销等。

根据第三方机构Menlo Ventures的调查数据显示,企业内各部门的生成式AI预算划分中,IT部分独占鳌头(22%)、产品和工程开发次之(19%),客服(9%)、销售(8%)和营销(7%)紧随其后。

 

数据来源:Menlo Ventures, UpHonest Capital

根据硅兔赛跑的观察,一些企业的确正在从这几个场景中赚钱:

IT部门选择之一的初创公司Glean,在2024年9月份完成新一轮融资,估值达到46亿美元,其旨在优化企业内部数据检索和问题答复。

在产品和工程开发部门依赖的AI编程应用中,初创公司Cognition在2024年3月推出了首个AI程序员Devin,成立仅6个月就达到了20亿美金估值。同年12月其Agent产品Devin正式上线,区别于普通的代码补全应用,Devin能够无需人类参与进行自主编码,完成需要人类工程师参与的项目开发。目前 Devin拥有诸多头部客户:例如Ramp 使用Devin 编写测试代码并清理死亡代码,MongoDB使用 Devin 更新过时的代码架构。

硅谷投资机构UpHonest Capital早期投资的Cosine,正在打造全自动的AI软件开发助理Genie,曾在SWE-Bench测试中获得全球最高分数。Cosine 研发了独有的数据管道,能够生成具有人类工程师开发逻辑、增量知识、支持搜索的高质量数据集。同时,Cosine是OpenAI最大的模型微调合作伙伴,拥有其前沿模型的早期使用权限。结合数据和模型优势,Cosine已经与多家世界500强公司和明星初创公司达成合作。

客服作为人力密集型工作,也将成为AI Agent最先颠覆的环节。比如UpHonest Capital早期投资的Proactive AI 正在为零售品牌打造具有高情感智能语言能力的客服助理,主要帮助企业向其用户提供契合品牌调性和个性化需求的客服服务,目前已与餐饮、健身、沙龙等行业多家头部企业达成深度合作。

销售和营销作为企业开源的重要入口,企业利用最新技术提高获客效率的意愿也非常高。美国的人工智能初创公司11x,打造AI驱动的“数字工作者”以取代传统的销售团队,其Agent能够自主执行GTM工作流程。11x不通过软件帮助企业降本增效,而是直接提供实在的工作成果,数字员工能够自主实现完成的收入闭环。11x成立6个月就达到了200万美金的ARR,目前ARR已经达到了1,000万美金。Flashintel正在打造AI驱动的GTM平台并向企业提供AI驱动的销售助理(SDR)。Flashintel在G2 2024冬季报告中总计获得了189枚徽章,其中FlashRev被评为最佳销售产品,最佳营销和数字广告产品,以及最高满意度产品。

② 在数字化渗透率低的传统行业有隐藏的“金矿”曾经,传统行业的玩家对AI嗤之以鼻,过高的投入成本和微不足道的效果,让他们难以对AI押注过多。

不过这一次,传统行业的生成式AI之路,有可能跳过软件阶段,直接进入AI阶段,类似新兴市场从使用现金直接转向移动支付。

这些行业本身对于科技的采用速度较慢,生成式AI的出现带来了直接交付结果而非交付软件的模式,减少了前期投入成本、肉眼可见的提升了投资回报率,使得恐惧新技术的决策者更容易被说服。比如医疗领域的病例记录、法律领域的案件报告生成、金融行业的合规风险筛查等等。

2024年12月,美国家政垂直软件巨头ServiceTitan上市,上市当天股价涨幅超过40%,在2024年上市公司中,该涨幅仅次于社交平台Reddit和芯片公司Astera Labs两家。

要知道,ServiceTitan 2012年成立,历经12年发展,在仅拿下家政行业1%市场份额的情况下,其市值一度达到90亿美元。由此可见,美国垂直行业,数字化渗透速率之低,垂直行业AI化的价值之高。ServiceTitan之成功,自然使我们关注到美国传统行业的机会,数字化渗透率低的传统行业。

美国初创公司Sameday为美国家庭服务行业(除虫、HVAC、家庭维修等)提供AI销售代理,通过自动化的语音客服接听来电并安排服务预约,提高电话接听率,从而提高转换率,现在已经与ServiceTitan集成。Sameday的创始人曾在美国增长最快的家庭服务行头部公司担任CMO,拥有极深的行业认知和丰富的行业资源。2024年,Sameday的ARR预计将增长5倍以上,月度客户留存率达98.5%。

建筑行业的AI解决方案提供商Pantheon,能够生成高精度且可编辑的 3D 建筑模型,通过AI实现更快的设计迭代周期可以显著降低项目成本。Pantheon AI不向建筑师出售软件许可证,而是直接向房地产开发商和业主出售其设计服务。2024年10月,Pantheon AI完成了由a16z领投的2500万美金种子轮融资。

传统行业以外,法律、金融、医疗行业积累了大量数据,为行业垂直基石模型训练提供了丰富的燃料,且法律、金融、医疗行业价值高,但普遍在传统软件巨头的垄断下变化缓慢。即便垂直SaaS一定程度上取代了过时繁琐的老系统,但总体的渗透率依然有限。以医疗行业为例,其行业规模高达4.3万亿美元,贡献了约1/5的美国GDP。但在美国市值前100的上市软件公司中,只有一家是服务医疗行业的软件公司。

2024年,Evenup ARR预计将达到5000万美金,最新一轮的投后估值达到了10亿美金。Evenup 利用生成式AI帮助律师进行人身损害赔偿(Personal Injury Claims)案件的索赔工作。虽然目前只服务于人身损害赔偿这一个领域,但这已经是一个非常大的市场了。美国每年约有30万参与处理人身损害赔偿的律师,每年支付给受害者的索赔金额高达1000亿美金。

有备而来者,率先享受红利,那些垂直行业专家、对行业的工作流有深入认知的创业者,结合不断进化的生成式AI基础设施,有机会迅速抢占用户,构建自身的行业数据壁垒。

③ AI不再按席位收费 :“Sell work, not software”Menlo Ventures的调查数据显示,企业在进行生成式AI产品采购决策时,第一考虑要素是产品是否具有简单可测量的投资回报率,其次是产品是否根据实际应用场景定制。

值得注意的是,现阶段,产品价格反而是最不重要的影响因素,仅1%的企业决策者声称产品价格影响采购决策。

 

数据来源:Menlo Ventures

结果正在变得更为重要。随着AI的独立工作能力提升,其工作结果、创造的价值会更容易被量化,企业对AI产品的价值评估,也会根据其工作成果界定,美国投资机构a16z提出。因此,商业模式变得更加重要。

SaaS时代,SaaS公司创新了按席位收费的商业模式,即按照使用SaaS产品的员工账号数量按月或按年收取订阅费用,这种定价方式背后的逻辑是,使用SaaS产品的每位员工,效率会有不同程度的提升、处理更多工作,许多SaaS定价的策略在于评估使用者效率提升创造的收益。

但到了生成式AI时代,这个SaaS时代一直以来赖以生存的逻辑正在被颠覆。随着Copilot产品向Agent产品的升级,未来的Agentic AI系统将在不同AI agents的相互配合下,自动完成任务,取代越来越多的工作者,显然,如果继续按照席位收费,开发者的收入则会逐渐减少。

Benchmark合伙人最先建议生成式AI公司“Sell work, not software”,即按照工作成果收费,打破按席位收费的模式。

基于此,目前原生AI公司普遍采取的商业模式分为两类,一类是基于用量的定价模式,Salesforce发布的Agent force智能体系统,提供客服、销售、员工服务等AI agent智能体,按照用户与agent实际交互的用量收费,每次”对话“收费2美元,如果发生以下三种情况之一,即视为一次”对话“结束—— AI agent无法满足用户需求,需要人工介入;用户主动结束与AI agent对话;用户超过24小时没有再主动与AI agent对话。

另一类是基于工作结果的定价模式,前Salesforce联席CEO Bret Taylor创立的AI客服公司Sierra,为客户提供基于工作结果收费的客服AI agent,从消费者满意度、问题解决程度、以及每次的交互成本三方面来评估工作结果,决定企业付费规模。采用按照工作结果定价的模式,实现了AI agent企业客户与开发公司的利益一致性,双方将共同得益于agent独立任务完成能力的提升。

趋势二:等待一个“杀手级”AI消费级应用

“2025年(AI应用)下一个大事件属于消费。”美国红杉资本合伙人Jess Lee表示,AI聊天、图片、视频已验证了其消费市场潜力,接下来将看到全新的AI消费社交APP、新形式的互动媒体、基于聊天的游戏、新的搜索和信息整合工具、基于互动式UI的聊天工具等。”

消费赛道,一直是历次技术创新浪潮下创业者和投资人高度关注的方向,如果回顾之前的技术周期会发现,全球市值Top15的科技公司中,有9家是从To C消费产品起家的。To C的公司上市时,估值超过100亿美元的比例,比To B公司高10%左右。

但在这一波生成式AI创业浪潮中,消费AI应用似乎在被创业者和资本遗忘。2024年,90%以上的A轮融资流向AI企业应用。

不过,自2024年下半年以来,这个现象正在发生改变。

2024下半年以来,资本市场对消费级AI应用的关注度上升,以硅谷孵化器Y Combinator 为例,其下半年孵化的消费级AI产品数量比上半年翻番。

 

数据来源:Y Combinator, UpHonest Capital整理

2025年,消费级AI应用的“土地”正在被开垦,行业在等待一个“杀手级”AI消费的应用。风险投资机构也对消费级AI应用的机会产生共识。YC Partner Michael Seibel表示,目前太多创始人寻找B2B的AI机会,太少人探索消费侧的机会,消费创业者的机会来了;a16z提出“生成式AI或将重塑从旅游、心理治疗到网购等一切(消费行为)。“前Index Ventures合伙人Rex Woodbury,称现在是“消费复兴”的机会。

生成式AI对消费端改变,体现在三个层面:首先,AI会逐渐改变人与人、人与信息交互的方式,形成新的流量入口;其次,AI搜索正在改变信息的分发方式,会创造新的商业机会;第三,AI释放PGC、UGC内容创作潜力,使内容消费更加丰富多元。

以AI搜索为例,作为线上流量的第一入口,已经久无战事,生成式AI引入了新变量。2020年创立的生成式AI搜索初创You.com,近期完成5000万美元融资,价值7亿美元了。OpenAI在7月发布AI搜索工具SearchGPT,其付费用户均可使用。

Perplexity是一家成立于2022年8月的美国AI创业公司,公司由前OpenAI研究科学家Aravind Srinivas和前Meta研究科学家Denis Yarats等联合创立,专注于开发基于人工智能的对话式搜索引擎,旨在通过大型语言模型(如GPT-4和LLama2)为用户提供精准的搜索结果。Perplexity的界面更像是聊天屏幕,用户可以通过自然语言提问,Perplexity会提供直接的答案,并附上详细的引用来源。

Perplexity的用户增长非常迅速。截至2024年4月,Perplexity 的月活跃用户数便突破了1500万。Perplexity在短时间内完成了多轮融资。截至2024年11月,Perplexity在新一轮融资中筹集了5亿美元,使公司估值达到90亿美元。投资方包括软银、亚马逊创始人贝索斯和英伟达等多家知名企业和AI领域知名人士。

除了通用搜索引擎,生成式AI使垂直领域的搜索引擎更普遍,瓜分通用搜索引擎的注意力。例如,垂直于企业知识数据库的搜索——Glean在9月份完成新一轮融资,估值达到46亿美元,旨在优化企业内部数据检索和问题答复,在近两年中ARR翻倍增长;初创企业DayDream种子轮拿到了5000万美元投资,Forerunner、Index联合领投。DayDream链接了超过2000+品牌,支持自然语言检索,根据用户提供的时间、地点、场合等信息给予相关产品推荐。

也许明年会出现更多令人眼前一亮的垂直领域的AI搜索创新。

这一点,美国红杉在2025年的AI趋势预测中也分享了一些思考,红杉提出AI搜索或将成为2025年的”杀手级“应用,他们提出了两点预测:目前一个整体的搜索市场可能会碎片化,未来每个人可能会有专业AI搜索引擎——例如,Perplexity可能会成为投资人和分析师的第一搜索工具选择,律师选择Harvey,医生选择OpenEvidence……全新的生成式AI搜索引擎将紧密契合目标用户的“心智模式”,投资人、律师、医生的思维模式各不相同,信息获取模式、目的和决策思维各有差异,这些不同和差异就是生成式AI搜索引擎创新的机会;消费级和企业级应用场景分化,每位知识工作者每天至少会使用两款AI搜索引擎 —— 一款用于工作,另一款用于其他所有事务。

除了AI搜索,落到电商、音乐、社交、游戏、旅行和教育等直接To C的领域中,也各有生成式AI原生应用的创新机会。

以旅行为例,Wanderboat是面向消费者的AI旅行规划工具,也是旅游内容分享社区。它构建了一个chatbot,可以根据用户需求推荐、定制目的地及各类娱乐体验活动,还可以主动学习用户的兴趣,定制专属行程。基于创始人此前在微软的经验,构建了一些很有趣的小工具,比如用户在查看地图时也可以与AI互动,实时获取一些信息和建议。在零付费推广的情况下,月活用户数量达到了6位数。

一是多模态AI营销,从文字延展到音频、视频。形式从单点的chatbot延展到具有操作执行能力的agent,并且准确率和对于边缘案例的覆盖力随着基石模型推理能力的提升增强。此外,如果生成式AI运用得当,销售、营销、客服对消费者的洞察进一步提高,可以创造更加个性化的服务、定制化体验。

GigaML是YC孵化的一家AI客服初创,虽然这个方向竞争激烈,但实际GenAI应用的渗透率还比较低,因为客服在实际工作中有许多边缘案例,现在大部分的GenAI应用解决边缘案例的表现一般,原有的自动化客服足以解决基础问题,所以企业升级的动力不足。GigaML发现将基石模型切换至o1-preview,加上大量的评估、调优之后,错误率大幅下降,从70%降至5%,并能够解决8成的边缘案例。在OpenAI最新推理模型加持下,客服用例值得期待。

Para和HeyGen分别是声音和视频营销的典型案例,Para利用AI生成个性化定制的声音营销电话,帮助品牌激活用户,帮助球队活跃粉丝;HeyGen的AI视频营销收入快速增长,据悉今年的年化ARR超过2000万美元,估值已达到5亿美元。

AdsGency则是一个利用AI用户数据洞察,实现精准广告营销的公司,创始人此前曾在滴滴、亚马逊从事广告、营销相关的产品工作。它的业务核心是广告和用户数据,为客户提供了一个全栈AI营销工具,覆盖内容创意、创作、投放、归因等流程。AdsGency也代表了现在AI营销的一个发展趋势—— 从Point Solution,到整个GTM的全流程自动化解决方案。

趋势三:企业应用大模型朝模块化方向发展

2024年,人工智能领域的一个显著趋势是模型的可组合性和模块化发展,企业不再仅依赖于单一的“大模型”解决方案,而是可以根据具体需求,将不同的模块进行组合,以此来定制出符合自己业务需求的能力。这种灵活性不仅能够提升效率,还能降低成本。

在技术架构层面,传统“大一统”的大模型会被逐步拆解为功能与场景模块。例如Amazon Bedrock提供了一系列生成AI的模块化服务,涵盖文本生成、图像生成、语音合成等功能,这些模块化的服务可以帮助企业根据自己的需求进行定制,支持跨行业的AI应用,如生成个性化的营销文案、产品推荐和自动化客服对话等服务。Transformer论文八位作者之一Aidan Gomez也瞄准这一方向,估值55亿美元的Cohere提供专为企业用例优化的系列AI模型,在语言生成、多语言处理、多模态、语义检索等方面各有所长,企业按需选择、组合。

2025年,模块化和抽象化设计将在多个领域得到广泛应用。特别是在人工智能和机器学习领域。这种设计方式将推动AI系统的高效演化和自适应能力,为AI技术的广泛应用提供更强大的支持。根据Gartner预测,到2028年,至少15%的日常工作决策将通过代理AI自主完成。

这种趋势表明,模块化和抽象化设计将为AI系统的自主决策提供更强大的支持,并且更多的技术企业将推出专为行业需求定制的AI模块。例如,针对智能制造、智慧医疗、自动驾驶等领域的具体需求,可能会出现更加精细化的模块组合,企业可根据自己的数据和业务需求灵活选择。而且随着硬件能力的提升,这些模块可能会更加高效,甚至实现更高的跨领域协同能力。总之,这种模块化大模型的发展将向纵深推进和重塑行业格局。



总结

这场科技商业史上最大“赌局”,让身处其中的投资者越来越感受到了曾经硅谷早期的投资氛围——押注一个未知的全新技术、等待一个超长回报周期,而不是基于互联网成熟技术的模式创新上迅速迭代和回血。

自从ChatGPT发布之后,硅谷正在吸引全球的目光。关注硅谷发生的故事,正在成为众多的中国投资者甚至中国企业员工、公关必做的事,大家试图从这些持续关注中获得最前沿的信息和生成式AI最前线所发生的故事,从而试图判断新的商业方向。

谁也不知道这场生成式AI的变革会将商业引向何方,也同样预测不到新技术的迭代如此之快。

在过去的几年里,听到最多的便是企业对生成式AI的抱怨“我们知道它重要,但我们仍然不知道如何用在自己的场景中”,这种抱怨带着一些敬畏——“不上大模型一定会被淘汰”。投资者在不断推高的估值和融资中,快要丧失信心。动辄几十亿美金的融资,再加上Scaling Law之下,不断增加的数据中心的投资,让他们望而却步。这也表明,2025年将是生成式AI让人们看到赚钱希望的一年,投资者和创业者同样需要信心。

AI Agent元年,这个发端于学术界的概念将会落到实际,并产生价值,企业将会使得生成式AI变得更加好用,并切实转化为价值。与此同时,消费级的AI应用将会让人们切实感受到生成式AI带来的生活的变化。

垂直领域的模型正在成为通用大模型的补充,让更多企业释放AI的价值。垂直行业中,将会出现越来越多的AI搜索应用,满足人们不同领域的需求。

2025年,从生成式AI来说,一些泡沫会破灭,一些企业能够从中赚到钱。技术新陈代谢快速而残酷,这场竞争中没有老手,都是新人,昔日的领军者亦有可能跌落神坛,最先关注到技术和商业的变化,并做出行动的企业,才能在这场竞争中生存下来。

 
查看评论(2)