AI创新战：OpenAI必须走的突破之路

时间回到2022年11月，此时英伟达的股价近乎腰斩，跌至不足3000亿美元。

就在这个时候OpenAI发布了ChatGPT聊天机器人，这一基于生成式人工智能的AI Bot，一时间成为了科技界的头条。此时，甚至Google创始人慌乱，回来紧急发布应对策略。因为在这个时候大家不知道它是如何实现的。

英伟达GPU芯片可以加速AI基础模型的训练，同时具有完善的CUDA平台，它抓住了向上的“新风口”，其股价开始回升，市值逐步恢复。

到2024年的今天，仅仅两年过去，英伟达市值达到3.012万亿美元，成为了全球市值第二的公司。

英伟达的GPU芯片依然在加速生产中，而且他们现在拥有至高无上的定价权，每个人训练大模型的公司都必须接受 Nvidia 用金汤匙喂养他们的东西。

当前 H100的毛利率超过 85%，可以说英伟达成了AI2.0时代最赚钱的公司，没办法卖“铲子”的总比“挖金矿”的要先一步挣到钱。

而对于这波风口上的大模型公司来说，所有人都在关注无利可图的支出还将会持续多久。当前大模型创业公司的明确目标还是在赶上甚至超越 OpenAI，以及构建更大性能更好的模型，来挣取更多的预期收益。

而OpenAI也一样，OpenAI必须不断推出新的震撼世界的产品，同时推出可以直接触达用户的产品，否则它将陷于Meta 和 Google包围之中。

优势在缩小

当前许多公司在聊天机器人 ELO 方面与 OpenAI 最新的 GPT-4 相差无几，而在上下文长度和视频模式等某些方面，一些公司已经领先。

前不久Sora和GPT-4o的发布，并未引起像ChatGPT刚发布时引爆的破圈讨论风潮，这是因为ChatGPT刚发布时，我们并不知道它是如何实现的，我们也不知道如何追赶。而现在我们基于开源基础模型，可以大概判断出其实现的技术方案，只是需要时间来进行复现而已。

显然，只要有足够的计算能力，最大的科技公司都可以匹敌 OpenAI 的 GPT-4。据传，阿里最新发布的Qwen-2.0的开源模型已经可以比拟GPT-4 Turbo，Meta 的 Llama 3 405B 也将在开源的同时匹敌 GPT-4，Gemini 2 Ultra 已经在各方面超越 GPT-4 Turbo。

OpenAI 现在的优势之一是他们在收集使用数据方面一直处于领先地位，但这种情况相信很快就会改变。所以OpenAI才说人才是第一位的，其他没有什么是不可替代的，OpenAI也在不断的开出百万美元的年薪从Meta 和 Google等竞争对手的公司挖人。

如果OpenAI没有不断的推出新的技术产品，可以说其技术优势正在逐渐缩小。

微软与OpenAI的合作关系

虽然说微软宣布将为OpenAI 投入超过 100 亿美元的资本支出，而且这其中还有一大部分事用于推理，以便在自己的产品和服务中部署 OpenAI 模型。

由于 OpenAI 的怪异结构，微软也并未完全押注于OpenAI，一大部分资源被用于微软自己开发的模型上。

OpenAI 是一个非营利组织，其主要目标是创造安全且造福全人类的通用人工智能 (AGI)。OpenAI可以而且会违反允许微软访问 OpenAI 模型的协议，而微软对此没有任何追索权。

这是因为OpenAI 仍然是一家完全独立的公司，由 OpenAI Nonprofit 管理。微软是无投票权的董事会观察员，没有控制权。AGI 明确地排除了所有商业和 IP 许可协议。对于微软来说，最令人担忧的是，OpenAI 董事会可以在没有任何微软投票的情况下随时决定他们已经实现了 AGI。

虽然说现在OpenAI的产品可以通过微软来直达消费者用户，但他们之前并非完全背靠背的合作关系，OpenAI依然需要寻求独立的产品路线。

而微软也在减少对 OpenAI 的依赖，包括 Copilot 和 Bing 计划。微软最新发布的Phi-3模型，使用来自大型模型的大量合成数据训练小型模型，效果非常出色。其次，微软也正在使用 MAI-1 ~500B 参数 MOE 模型，利用了 Inflection 预训练团队及其数据集，并结合了微软自己的一些合成数据，来训练自己的GPT-4 类模型。

终端产品已成王道

OpenAI的缺点其实非常明显，它并没有拥有像 Meta 和 Google 可以更直接地接触消费者终端流量产品。

相比于Google的浏览器，Meta的聊天软件，ChatGPT的用户量还是比较少的，而且其中大多数只使用过几次，不会继续使用它。

未来的大多数可以预见的消费者，将通过现有平台来使用大语言模型，包括 Google、Instagram、WhatsApp、Facebook、iPhone/Android。

虽然 Meta 尚未找到如何将赚钱的方法，但他们的 Meta AI（由 Llama 3 70B 提供支持）已在 Facebook、Instagram 和 Whatsapp 上可用。

并且已宣布的推广范围已扩展到包括美国在内的 14 个国家/地区，这些国家/地区的总人口为 11 亿。大量用户已经可以使用比 ChatGPT 免费模型更好的模型。Meta AI 正处于其增长曲线的早期阶段，距离实现其 32.4 亿每日活跃用户群的目标仅完成了三分之一。

Google也宣布将AI 融入了 Workplace 办公工具中，使得Gmail、Google Drive、Docs、Sheets 和 Slides 都可以一键使用AI，同时未来也将打造新的搜索—-用AI组织搜索，同时Gemini 生成式人工智能模型添加到广告服务中，探索赚钱方法。

所以在这个背景下，OpenAI推出了自己的手机APP和桌面APP，用于直接面向用户，一方面便捷用户的使用，减少使用上复杂操作的时间成本；另一方面可以直接面对用户和占有用户。

此外，OpenAI也积极与苹果合作，打造新一代的siri，占有这个巨量的终端用户群体。如果OpenAI真的iPhone 上独家提供服务，那么OpenAI将一举成功占用最重要的终端市场。

开打价格战抢占用户

价格战的序幕应由 DeepSeek-V2 的问世拉开，这款产品以其卓越的性能和低廉的运行成本，成功超越了 Meta 的 Llama 3 70B。

DeepSeek-V2 的定价策略极具竞争力，它不仅在成本效益上明显优于市场上的其他竞争模型，而且其价格之低，甚至打破了风险投资支持的推理 API 提供商之间的价格战局面。这些提供商在为 Meta 和 Mistral 模型提供服务时，已经面临着亏损的压力。

DeepSeek-V2 的推出，无疑在这场激烈的市场竞争中掀起了新的波澜。

DeepSeek 声称，一个由 8卡 H800 GPU 组成的节点可以实现每秒超过 50,000 个解码token的峰值吞吐量，其API定价为每百万 tokens 输入 1 元、输出 2 元。即使在这样的情况下，依然可以实现高达 70% 以上的毛利率。而且DeepSeek-V2 没有照搬国外的开源模型，针对MoE、RoPE 和 Attention 都有全新的创新。

紧接着，智谱 AI 、字节豆包大模型和阿里Qwen-Long API也都相应的大幅下调价格。百度则直接宣布 ERNIE Speed 和 ERNIE Lite 两款模型免费。

OpenAI则对于非企业用户优先采取了免费优先的策略，虽然有一定的频次限制，但对于非企业用户来说是足够的。这标志着他们将去年的定价模式发生了重大商业模式转变，现在开发者和企业进入了完全补贴消费者的时代。

通过贴补消费者来增加用户使用终端频率和习惯，抢占终端用户市场。对于这些没有大规模终端使用的大模型公司来说，如果创新遇到瓶颈，那么这些拥有直接终端用户的企业公司，将可能快速将其包围。

国内价格战时间线：
DeepSeek 发布全球最强开源 MoE 模型：2024-05-06，DeepSeek-V2（32K 上下文） API 的定价为：每百万 tokens 输入 1 元、输出 2 元
用大模型 API 就上 bigmodel.cn！：2024-05-11，智谱 AI 的 GLM-3 Turbo API 价格调整为 1 元/百万 tokens（输入输出同价）
2024 春季火山引擎 FORCE 原动力大会上: 2024-05-15 ，字节 Doubao-pro-128k（128K 上下文） API 的定价为：每百万 tokens 输入 5 元、输出 9 元；Doubao-lite-128k（128K 上下文） API 的定价为：每百万 tokens 输入 0.8 元、输出 1 元
智谱 AI 最新推出 Batch API：2024-05-21，支持的模型以及价格：GLM-4 API 价格为 50 元 / 百万 tokens，GLM-3-Turbo API 价格为 0.5 元 / 百万 tokens（输入输出同价）
降价，立即生效！：2024-05-21，阿里云 Qwen-Long API 价格调整为每百万 tokens 输入 0.5 元、输出 2 元。
免费，立即生效！：2024-05-21,百度宣布 ERNIE Speed 和 ERNIE Lite 两款模型宣布免费。

战火必将燃向芯片

OpenAI 面临的最大风险就是芯片。

尽管 OpenAI 的芯片野心已经传闻了一段时间，最近OpenAI对谷歌TPU芯片的顶尖人才开始了大胆的偷猎行动。

OpenAI自己做芯片和基础设施也是迫不得已。

一方面，与购买 Nvidia 芯片相比，它大大降低了计算成本。当前Google的 TPU 建设速度非常快，而且成本会非常便宜。Meta 和亚马逊正在将其内部硅片的产量提升到不同程度，这让他们的大模型获得了计算成本优势。

另一方面，OpenAI公司目前处境尴尬，不能完全依赖微软的芯片和云服务，因为两者的关系紧张且微妙，而且微软正在认真制定自己的AI计划。

从长远的角度来看，OpenAI 在成本节约方面可能难以从微软那里获得显著的优惠，因为微软的商业策略倾向于通过向'外部'用户出租其内部芯片和云服务来实现盈利。OpenAI 有着更为深远的愿景，它渴望自主设计芯片和系统，以更贴近制造成本的方式打造定制化的解决方案，从而实现成本效益的最大化。

然而，OpenAI 对于微软芯片的设计缺乏必要的控制权，这可能导致微软提供的芯片及其系统无法完全满足 OpenAI 的特定需求。这种局限性可能会影响 OpenAI 在实现其技术目标和优化成本效益方面的灵活性和效率。

总结

当前AI大模型还处于发展的初期，巨量上升的空间使得资本可以无限制的投入，然而这种无限制的投入会持续多久呢？

在整一条产业上，目前只有卖芯片的英伟达赚到了钱，其他公司都是在赚取对未来期望的钱。一旦OpenAI所带来的创新性不足，那么也就意味着AI2.0将进入平台期。

OpenAI必须利用当前的优势，快速的占领终端用户，吸纳自己的用户群体。否则一旦式微，Google和Meta这种已经拥有巨量流量的现成产品公司，将具有非常大的后发优势。

所以说，终端产品成为市场竞争的关键，Google和Meta等公司拥有直接接触消费者的平台和产品，而OpenAI则需要通过推出自己的APP和与苹果等公司的合作来拓宽用户基础。通过价格战和补贴消费者将成为抢占市场份额的重要手段。

最后，芯片或许会成为OpenAI面临的最大风险。尽管OpenAI有意自主开发芯片和基础设施，但与微软的合作关系紧张，OpenAI需要在芯片开发和成本效益之间找到平衡，以保持其在AI领域的领先地位。

如果觉得这篇文章对你有所帮助，

请点一下赞或者在看，是对我的肯定和支持~

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。