打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
AI创新战:OpenAI必须走的突破之路

时间回到2022年11月,此时英伟达的股价近乎腰斩,跌至不足3000亿美元。

就在这个时候OpenAI发布了ChatGPT聊天机器人,这一基于生成式人工智能的AI Bot,一时间成为了科技界的头条。此时,甚至Google创始人慌乱,回来紧急发布应对策略。因为在这个时候大家不知道它是如何实现的。

英伟达GPU芯片可以加速AI基础模型的训练,同时具有完善的CUDA平台,它抓住了向上的“新风口”,其股价开始回升,市值逐步恢复。

到2024年的今天,仅仅两年过去,英伟达市值达到3.012万亿美元,成为了全球市值第二的公司。

英伟达的GPU芯片依然在加速生产中,而且他们现在拥有至高无上的定价权,每个人训练大模型的公司都必须接受 Nvidia 用金汤匙喂养他们的东西。

当前 H100的毛利率超过 85%,可以说英伟达成了AI2.0时代最赚钱的公司,没办法卖“铲子”的总比“挖金矿”的要先一步挣到钱。

而对于这波风口上的大模型公司来说,所有人都在关注无利可图的支出还将会持续多久。当前大模型创业公司的明确目标还是在赶上甚至超越 OpenAI,以及构建更大性能更好的模型,来挣取更多的预期收益。

而OpenAI也一样,OpenAI必须不断推出新的震撼世界的产品,同时推出可以直接触达用户的产品,否则它将陷于Meta 和 Google包围之中。

优势在缩小

当前许多公司在聊天机器人 ELO 方面与 OpenAI 最新的 GPT-4 相差无几,而在上下文长度和视频模式等某些方面,一些公司已经领先。

前不久Sora和GPT-4o的发布,并未引起像ChatGPT刚发布时引爆的破圈讨论风潮,这是因为ChatGPT刚发布时,我们并不知道它是如何实现的,我们也不知道如何追赶。而现在我们基于开源基础模型,可以大概判断出其实现的技术方案,只是需要时间来进行复现而已。

显然,只要有足够的计算能力,最大的科技公司都可以匹敌 OpenAI 的 GPT-4。据传,阿里最新发布的Qwen-2.0的开源模型已经可以比拟GPT-4 Turbo,Meta 的 Llama 3 405B 也将在开源的同时匹敌 GPT-4,Gemini 2 Ultra 已经在各方面超越 GPT-4 Turbo。

OpenAI 现在的优势之一是他们在收集使用数据方面一直处于领先地位,但这种情况相信很快就会改变。所以OpenAI才说人才是第一位的,其他没有什么是不可替代的,OpenAI也在不断的开出百万美元的年薪从Meta 和 Google等竞争对手的公司挖人。

如果OpenAI没有不断的推出新的技术产品,可以说其技术优势正在逐渐缩小。

微软与OpenAI的合作关系

虽然说微软宣布将为OpenAI 投入超过 100 亿美元的资本支出,而且这其中还有一大部分事用于推理,以便在自己的产品和服务中部署 OpenAI 模型。

由于 OpenAI 的怪异结构,微软也并未完全押注于OpenAI,一大部分资源被用于微软自己开发的模型上。

OpenAI 是一个非营利组织,其主要目标是创造安全且造福全人类的通用人工智能 (AGI)。OpenAI可以而且会违反允许微软访问 OpenAI 模型的协议,而微软对此没有任何追索权。

这是因为OpenAI 仍然是一家完全独立的公司,由 OpenAI Nonprofit 管理。微软是无投票权的董事会观察员,没有控制权。AGI 明确地排除了所有商业和 IP 许可协议。对于微软来说,最令人担忧的是,OpenAI 董事会可以在没有任何微软投票的情况下随时决定他们已经实现了 AGI。

虽然说现在OpenAI的产品可以通过微软来直达消费者用户,但他们之前并非完全背靠背的合作关系,OpenAI依然需要寻求独立的产品路线。

而微软也在减少对 OpenAI 的依赖,包括 Copilot 和 Bing 计划。微软最新发布的Phi-3模型,使用来自大型模型的大量合成数据训练小型模型,效果非常出色。其次,微软也正在使用 MAI-1 ~500B 参数 MOE 模型,利用了 Inflection 预训练团队及其数据集,并结合了微软自己的一些合成数据,来训练自己的GPT-4 类模型。

终端产品已成王道

OpenAI的缺点其实非常明显,它并没有拥有像 Meta 和 Google 可以更直接地接触消费者终端流量产品。

相比于Google的浏览器,Meta的聊天软件,ChatGPT的用户量还是比较少的,而且其中大多数只使用过几次,不会继续使用它。

未来的大多数可以预见的消费者,将通过现有平台来使用大语言模型,包括 Google、Instagram、WhatsApp、Facebook、iPhone/Android。

虽然 Meta 尚未找到如何将赚钱的方法,但他们的 Meta AI(由 Llama 3 70B 提供支持)已在 Facebook、Instagram 和 Whatsapp 上可用。

并且已宣布的推广范围已扩展到包括美国在内的 14 个国家/地区,这些国家/地区的总人口为 11 亿。大量用户已经可以使用比 ChatGPT 免费模型更好的模型。Meta AI 正处于其增长曲线的早期阶段,距离实现其 32.4 亿每日活跃用户群的目标仅完成了三分之一。

Google也宣布将AI 融入了 Workplace 办公工具中,使得Gmail、Google Drive、Docs、Sheets 和 Slides  都可以一键使用AI,同时未来也将打造新的搜索—-用AI组织搜索,同时Gemini 生成式人工智能模型添加到广告服务中,探索赚钱方法。

所以在这个背景下,OpenAI推出了自己的手机APP和桌面APP,用于直接面向用户,一方面便捷用户的使用,减少使用上复杂操作的时间成本;另一方面可以直接面对用户和占有用户。

此外,OpenAI也积极与苹果合作,打造新一代的siri,占有这个巨量的终端用户群体。如果OpenAI真的iPhone 上独家提供服务,那么OpenAI将一举成功占用最重要的终端市场。

开打价格战抢占用户

价格战的序幕应由 DeepSeek-V2 的问世拉开,这款产品以其卓越的性能和低廉的运行成本,成功超越了 Meta 的 Llama 3 70B。

DeepSeek-V2 的定价策略极具竞争力,它不仅在成本效益上明显优于市场上的其他竞争模型,而且其价格之低,甚至打破了风险投资支持的推理 API 提供商之间的价格战局面。这些提供商在为 Meta 和 Mistral 模型提供服务时,已经面临着亏损的压力。

DeepSeek-V2 的推出,无疑在这场激烈的市场竞争中掀起了新的波澜。

DeepSeek 声称,一个由 8卡 H800 GPU 组成的节点可以实现每秒超过 50,000 个解码token的峰值吞吐量,其API定价为每百万 tokens 输入 1 元、输出 2 元。即使在这样的情况下,依然可以实现高达 70% 以上的毛利率。而且DeepSeek-V2 没有照搬国外的开源模型,针对MoE、RoPE 和 Attention 都有全新的创新。

紧接着,智谱 AI 、字节豆包大模型和阿里Qwen-Long API也都相应的大幅下调价格。百度则直接宣布 ERNIE Speed 和 ERNIE Lite 两款模型免费。

OpenAI则对于非企业用户优先采取了免费优先的策略,虽然有一定的频次限制,但对于非企业用户来说是足够的。这标志着他们将去年的定价模式发生了重大商业模式转变,现在开发者和企业进入了完全补贴消费者的时代。

通过贴补消费者来增加用户使用终端频率和习惯,抢占终端用户市场。对于这些没有大规模终端使用的大模型公司来说,如果创新遇到瓶颈,那么这些拥有直接终端用户的企业公司,将可能快速将其包围。

国内价格战时间线:

  1. DeepSeek 发布全球最强开源 MoE 模型:2024-05-06,DeepSeek-V2(32K 上下文) API 的定价为:每百万 tokens 输入 1 元、输出 2 元

  2. 用大模型 API 就上 bigmodel.cn!:2024-05-11,智谱 AI 的 GLM-3 Turbo API 价格调整为 1 元/百万 tokens(输入输出同价)

  3. 2024 春季火山引擎 FORCE 原动力大会上: 2024-05-15 ,字节 Doubao-pro-128k(128K 上下文) API 的定价为:每百万 tokens 输入 5 元、输出 9 元;Doubao-lite-128k(128K 上下文) API 的定价为:每百万 tokens 输入 0.8 元、输出 1 元

  4. 智谱 AI 最新推出 Batch API:2024-05-21,支持的模型以及价格:GLM-4 API 价格为 50 元 / 百万 tokens,GLM-3-Turbo API 价格为 0.5 元 / 百万 tokens(输入输出同价)

  5. 降价,立即生效!:2024-05-21,阿里云 Qwen-Long API 价格调整为每百万 tokens 输入 0.5 元、输出 2 元。

  6. 免费,立即生效!:2024-05-21,百度宣布 ERNIE Speed 和 ERNIE Lite 两款模型宣布免费。

战火必将燃向芯片

OpenAI 面临的最大风险就是芯片。

尽管 OpenAI 的芯片野心已经传闻了一段时间,最近OpenAI对谷歌TPU芯片的顶尖人才开始了大胆的偷猎行动。

OpenAI自己做芯片和基础设施也是迫不得已。

一方面,与购买 Nvidia 芯片相比,它大大降低了计算成本。当前Google的 TPU 建设速度非常快,而且成本会非常便宜。Meta 和亚马逊正在将其内部硅片的产量提升到不同程度,这让他们的大模型获得了计算成本优势。

另一方面,OpenAI公司目前处境尴尬,不能完全依赖微软的芯片和云服务,因为两者的关系紧张且微妙,而且微软正在认真制定自己的AI计划。

从长远的角度来看,OpenAI 在成本节约方面可能难以从微软那里获得显著的优惠,因为微软的商业策略倾向于通过向'外部'用户出租其内部芯片和云服务来实现盈利。OpenAI 有着更为深远的愿景,它渴望自主设计芯片和系统,以更贴近制造成本的方式打造定制化的解决方案,从而实现成本效益的最大化。

然而,OpenAI 对于微软芯片的设计缺乏必要的控制权,这可能导致微软提供的芯片及其系统无法完全满足 OpenAI 的特定需求。这种局限性可能会影响 OpenAI 在实现其技术目标和优化成本效益方面的灵活性和效率。

总结

当前AI大模型还处于发展的初期,巨量上升的空间使得资本可以无限制的投入,然而这种无限制的投入会持续多久呢?

在整一条产业上,目前只有卖芯片的英伟达赚到了钱,其他公司都是在赚取对未来期望的钱。一旦OpenAI所带来的创新性不足,那么也就意味着AI2.0将进入平台期。

OpenAI必须利用当前的优势,快速的占领终端用户,吸纳自己的用户群体。否则一旦式微,Google和Meta这种已经拥有巨量流量的现成产品公司,将具有非常大的后发优势。

所以说,终端产品成为市场竞争的关键,Google和Meta等公司拥有直接接触消费者的平台和产品,而OpenAI则需要通过推出自己的APP和与苹果等公司的合作来拓宽用户基础。通过价格战和补贴消费者将成为抢占市场份额的重要手段。

最后,芯片或许会成为OpenAI面临的最大风险。尽管OpenAI有意自主开发芯片和基础设施,但与微软的合作关系紧张,OpenAI需要在芯片开发和成本效益之间找到平衡,以保持其在AI领域的领先地位。


如果觉得这篇文章对你有所帮助,
请点一下或者在看,是对我的肯定和支持~
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
AI实验室竞争白热化
美国科技动态:新技术革命临界点来临 人工智能大战开启:ChatGPT揭开AI战幔 杀死黄页一样摧毁G...
Twitter上一个人整理的2023年AI重要事件时间表
微软和OpenAI也要自研芯片,都想做躺赚的英伟达
人工智能[1553]过年8天AI圈变天!56件生成式AI要闻一文看尽
如何立即试用 Google 的 PaLM 2 AI 模型
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服