红杉资本：生成式AI的第二幕

来源：红杉资本

文｜SONYA HUANG、PAT GRADY、GPT-4

编译｜毕颖

科学家、历史学家和经济学家长期研究创造创新寒武纪爆发的最佳条件。在生成式人工智能中，我们已经达到了一个现代奇迹——我们这一代人的太空竞赛。

这一时刻已经酝酿了几十年。摩尔定律的六十年给了我们处理艾克斯浮点数据的计算马力。互联网四十年给了我们高达数万亿个token的训练数据。移动与云计算交织的二十年让每个人手掌中握有一台超级计算机。几十年的技术进步为生成式人工智能起飞奠定了所需的必要条件。

ChatGPT的崛起，点燃了导火索，释放出一种我们许久未见的创新密度和热浪。这种气氛在“脑谷”（Cerebral Valley）尤为强烈。在那里，人工智能研究者无异于摇滚明星，每个周末，黑客之家都挤满了新的自主代理和陪伴聊天机器人。人工智能研究者从传说中的“车库里的黑客”变成了可调动数十亿美元计算资源的特种部队。arXiv印刷机变得如此多产，以至于研究者们开玩笑地呼吁暂停新的出版物，以便他们追上。

但很快，人工智能的兴奋变成了近乎歇斯底里。突然间，每一家公司都成了“人工智能副驾驶”。“人工智能销售”、“人工智能Adobe”和“人工智能Instagram”等塞满了我们的收件箱。1亿美元种子轮又回来了。我们发现自己深陷一个融资不可持续、人才战和抢购GPU的“泥潭”。

当然，裂缝开始显现。艺术家、作家和歌手挑战AI生成的知识产权的合法性。华盛顿充斥着关于道德、监管和迫在眉睫的超级AI的辩论。也许最令人担忧的是，硅谷内部也开始低声说起“生成式AI没用”的传言。产品远远低于预期，用户留存率很差便是例证。许多应用程序的用户需求开始趋于平稳。这只是另一个虚拟产品的周期吗？

人工智能的不满之夏，让批评者欣喜若狂地在坟头狂欢，让人不禁想起1998年，一位著名经济学家宣称：“到2005年，将会清楚地看到互联网对经济的影响，还没有传真机大。”

毫无疑问——尽管充斥着噪音、歇斯底里、不确定性和不满的情绪，生成式人工智能已经比SaaS有了更好的开始——初创公司用时几个月就获得超过10亿美元的收入，而SaaS市场花费数年才达到同样的收入规模。一些应用程序开始家喻户晓：ChatGPT成为史上增长最快的应用程序，深受学生和开发者欢迎；Midjourney成为我们共同的创意缪斯。据报道，它仅11人的团队就创造了数亿美元的收入；Character普及了人工智能娱乐和陪伴，并创造了消费者最期待的“社交”应用程序——平均用户使用时长高达两个小时。

但这些成功迹象，既没有扭转大多数人工智能公司没有市场契合度的产品或没有可持续竞争优势的现实，也没有改变人工智能生态系统整体繁荣不可持续的事实。

现在，尘埃稍定。我们认为目前是一个适当的时间点，来反思一下当下生成式人工智能所处的位置，以及将走向何方。

迈向第二幕

技术，掀起了生成式人工智能的“第一幕”。我们发现了一种新的“锤子”——基础模型——并释放了一波新奇的应用程序，它们只是这些酷炫的新技术的牛刀小试。

现在，我们相信市场正在进入到“第二幕”——这将是从客户出发的。第二幕将解决人类的问题。新的应用程序将与第一批应用程序有着本质的不同。它们倾向于将基础模型作为更全面解决方案的一部分，而不是整体的解决方案。它们引入了新的编辑界面，使工作流程更具粘性，输出更好。它们通常是多模态的。

市场已经开始从“第一幕”过渡到“第二幕”。进入“第二幕”的公司有很多，比如Harvey，它为精英律师事务所定制的LLM；比如Glean，爬取和索引我们的工作空间，使生成式人工智能嵌入到我们的工作流中；再比如Character和Ava，它们正在创建数字伴侣。

市场地图

我们更新的生成式人工智能市场地图如下。

与去年的地图不同，我们选择按用案例而不是按模型模态来组织这张地图。这反映了市场的两个重要推动力：第一生成式人工智能从技术推动到实际应用和价值的演变；第二，生成式AI的应用程序将具备越来越多的多模态。

此外，我们还包括了一个新的LLM开发者栈，反映了公司在生产中构建生成式AI程序时所依赖的计算和工具供应商。

重新审视我们的论点

我们原来的文章，提出了一个关于生成式人工智能市场机会的论点，以及一个该市场如何展开的假设。我们做得怎么样？

以下是我们犯的错误：

事情发展得很快。去年，我们预计可能还需要近十年才能获得实习生水平的代码生成、好莱坞质量的视频或不听起来机械的人类质量语音。但是听一听Eleven Labs在TikTok上的声音或Runway的AI电影节就可以清楚地看到未来正以超光速到来。甚至3D模型、游戏和音乐也变得很好，很快。
供应瓶颈。我们没有预料到用户需求超过GPU供应速度。许多公司增长瓶颈不是客户需求，而是访问Nvidia最新的GPU的速度。漫长等待成为常态，一个简单的商业模式出现了：支付订阅费以跳过排队，还能访问更好的模型。
垂直分离还没有发生。我们仍然相信，应用公司和基础模型提供商之间会有一个明显的区隔。这样的话，模型公司专注于规模和研究，应用公司专注于产品和UI。事实上，这种分离还没有显著地发生。实际上，最成功的应用程序都是垂直整合的。
激烈的竞争环境和现有玩家的迅速应对。去年，竞争格局中，有一些太过拥挤的赛道（尤其是图像生成和文案写作），但总的来说，市场还是一片空白。今天的竞争格局，在许多角落里，比机会更多的是竞争者。现在的玩家反应迅速，从谷歌的Duet、Bard到Adobe的Firefly——以及其他愿意承担风险的企业——都加剧了竞争。即使在基础模型层，我们也看到客户建立了他们的基础设施，以便在不同的供应商之间保持不偏不倚。
护城河在客户而不是在数据上。我们预测最好的生成式AI公司可以通过数据飞轮产生可持续的竞争优势：更多的用户→更多的数据→更好的模型→更多的用户。虽然这在某种程度上仍然是正确的，特别是在拥有非常专业、难以获得数据的领域，但“数据护城河”是站不住脚的：应用公司生成的数据并没有创造出无法逾越的护城河，而且下一代基础模型很可能会摧毁创业公司构建的任何数据护城河。相反，工作流程和用户网络似乎正在创造更持久的竞争优势。

以下是我们做对了的地方：

生成式AI是一个现象级事件。突然间，每个开发者都在开发一个生成式AI应用程序，每个企业买家都想买它。市场甚至保留了“生成式人工智能”的名称。人才流入了市场，风险资本也跟着进来了。生成式AI甚至成为了流行文化现象，出现在在像“Harry Potter Balenciaga”或“鬼写手”的德雷克模仿歌曲“Heart on My Sleeve”这样的病毒视频中。
第一个杀手级应用程序出现了。ChatGPT只用了6周就达到1亿月活用户的应用程序。相比之下，Instagram花了2.5年，WhatsApp花了3.5年，YouTube和Facebook花了4年才达到同样的用户水平。ChatGPT并非一孤例。Character AI（平均会话时间2小时）、Github Copilot（效率提高55%）和Midjourney（收入数亿美元）都表明第一批杀手级应用程序已经出现。
开发者是关键。像Stripe或Unity这样以开发者为先的公司，来自它们的一个核心洞察是，开发者可以帮助你开拓它们无法想象的应用案例。在过去几个季度，我们被音乐生成社区、人工智能媒介、AI客服代理等形形色色的应用所吸引。
形态正在演变。AI应用程序的第一个版本大多是自动完成和初稿，但现在它们正在变得越来越复杂。Midjourney引入了摄像机平移和填充，生动地说明了生成式AI优先用户体验，将变得更加丰富多彩。总体而言，形态正在从个人生产力发展到系统级生产力，从人机交互发展到面向执行的代理系统。
版权、道德和存在的恐惧。有关敏感话题的辩论一直在进行。艺术家、作家和音乐家们意见相左，有些创作者愤怒地指责其他人从衍生作品中获利，有些创作者则接受了新的人工智能现实。没有哪个创业公司想成为Spotify出现前的Napster或Limewire。规则是模糊的：日本已经宣布用于训练人工智能的内容没有知识产权，而欧洲则提出了严厉的监管。

我们现在处于什么位置？生成式人工智能的价值问题

生成式人工智能并不缺乏案例或需求。用户渴望人工智能能够让他们的工作更轻松，让他们的产品更好。这也是为什么他们以创纪录的速度涌向应用程序的原因。

但是人们会留下来吗？下图对比了以AI为先的应用程序和Youtube等公司的移动应用程序的第一个月留存率。

用户参与度也不佳。一些最好的消费者公司有60-65%的DAU/MAU；WhatsApp的是85%。相比之下，生成式人工智能应用程序的中位数是14%（值得注意的例外是Character和“人工智能陪伴”类别）。这意味着用户还没有在生成式人工智能产品中找到足够的价值，能够吸引他们每天都使用它们。

简而言之，生成式人工智能最大的问题不是找到应用案例或需求或分发渠道，而是证明自己的价值。正如我们的同事David Cahn所写，“2000亿美元的问题是：你要用这些基础设施做些什么？它将如何改变人们的生活？”要建立持久的业务，就需要解决留存问题，并为客户产生足够深刻的价值，让他们坚持使用并成为每日活跃用户。

目前，生成式人工智能仍然处于“尴尬的青春期”。有些闪光点，但当产品没有达到预期时，失败往往是不可避免地、可重复的但可弥补的。我们有明确的工作要做。

第二幕：一个共享的剧本

创始人正在从事困难的提示工程、微调和数据集策划，以使他们的人工智能产品变好。他们正在一砖一瓦地将华丽的演示融入到整个产品体验中。与此同时，基础模型基质继续加紧研究和创新。

随着公司找到持久价值的路径，一个共享的剧本正在形成。我们现在有了共享的技术来使模型变得有用，以及正在形成的UI范式将塑造生成式人工智能的第二幕。

模型开发栈

思想链、思想树和反射等新兴推理技术正在提高模型执行更丰富、更复杂的推理任务的能力，缩小客户期望和模型能力之间的差距。开发人员正在使用 Langchain 等框架来调用和调试更复杂的多链序列。
RLHF 和微调等迁移学习技术变得越来越容易使用，特别是最近推出了 GPT-3.5 和 Llama-2 微调功能，这意味着公司可以根据其特定领域调整基础模型，并根据用户反馈进行改进。开发人员正在从 Hugging Face 下载开源模型并对其进行微调以实现高质量的性能。
检索增强生成正在引入有关业务或用户的背景信息，减少幻觉并提高真实性和有用性。 Pinecone 等公司的矢量数据库已成为 RAG 的支撑性基础设施。
新的开发者工具和应用程序框架为公司提供了可重用的构建块，以创建更先进的人工智能应用程序，并帮助开发者评估、改进和监控生产中人工智能模型的性能，包括LLMOps工具，如Langsmith和Weights & Biases
以人工智能为先的基础设施公司，如Coreweave、Lambda Labs、Foundry、Replicate和Modal，正在解构公有云，并提供人工智能公司最需要的东西：以合理的成本提供充足的GPU，随需而变且高度可扩展，具有良好的PaaS开发者体验。

总得来看，这些技术缩小了模型预期与现实之间的差距，同时基础模型也在不断改进。但是让模型变得优秀只是硬币的一半。生成式人工智能优先的用户体验的剧本也在演变：

新兴产品蓝图

生成式界面：基于文本的对话用户体验是在LLM之上的默认界面。渐渐地，新形态正在进入武器库中，从Perplexity的生成式用户界面到像Inflection AI这样的人类听起来的声音等新的模态。
新的编辑体验：从Copilot到导演模式。随着我们从零射击到询问和调整的进步，生成式人工智能公司正在发明一套新的旋钮和开关，它们看起来不同于传统的编辑工作流程。Midjourney的新平移命令和Runway的导演模式创造了新的类似相机的编辑体验。Eleven Labs使通过提示操作声音成为可能。
日益复杂的代理系统：生成式人工智能应用程序不仅仅是供人类审阅的自动完成或初稿；它们现在有了自主解决问题、访问外部工具和代表我们从头到尾解决问题的能力。
系统级优化：有些公司并不是嵌入单个人类用户的工作流程并使个人更有效率，而是直接解决系统级优化的问题。

结束语

当我们越来越接近前沿悖论，随着变换器和扩散模型的新颖性逐渐消失，生成式人工智能市场的性质正在演变。炒作和闪光正在让位于真正的价值和完整的产品体验。

在红杉，我们仍然是生成式人工智能的坚定信徒。这个市场起飞所需的必要条件已经积累了几十年，杀手级应用程序的出现和海量的用户需求让我们对这个市场特别有信心。

然而，Amara定律——我们倾向于高估技术在短期内的影响，低估技术在长期内的影响——正在发挥作用。我们在投资决策中保持耐心和判断力，特别注意创始人如何解决价值问题。公司使用共享剧本，来推动模型性能和产品体验的边界，让我们对生成式人工智能的第二幕充满了乐观。

*本号系创业家&i黑马人工智能领域垂直号。黑智，人工智能领域产业服务平台，专注AI行业报道，探讨AI商业价值。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。