阿里百度360连夜出手长文本，大模型商业化厮杀开始了

丰色明敏发自凹非寺

一夜之间，国产大模型打起了长文本大战。

从昨晚到今天凌晨，各大厂排队官宣跟进长文本能力：

百度文心一言

下个月版本升级，开放200万-500万长度

360智脑

正在内测500万字，一完成就要入驻360AI浏览器

阿里通义千问

则一出手就是1000万字，且不用等，当场就开始。

内卷启动，大卷特卷。

要知道，长文本能力的跟进，意味着是要更大力烧钱了……而厂商们做这一决定，似乎毫不犹豫。

为啥如此呢？

这一切，还得从最近火到宕机的Kimi说起。

爆火Kimi，五次扩容仍然宕机

Kimi，全称Kimi Chat，来自月之暗面(Moonshot AI)。

是AI天才杨植麟创业大模型后拿出的第一份成绩单。去年10月初首次亮相，参数上千亿，主力卖点就是长文本，支持20万汉字输入处理，一本《三体》、《马斯克传》随便读。再加上一直可免费使用，Kimi迅速积累了一波粉丝。

它的爆火就发生在本周，一度冲进App Store 免费版应用的第五名，超越微信。

有数据统计，目前Kimi模型的日活跃用户数已达100万人（60万在小程序，34万在网页端，还有5万在App端），且留存率持续上涨。

其App端的下载量（效率类应用免费榜）也已经从2月的百名开外，挤进前十，仅次于豆包（抖音AI智能助手）和文心一言。

为啥突然爆火？

就在本周一，Kimi带来重大迭代，将长上下文窗口x10倍，扩展到200万字。让Claude3、GPT-4 Turbo都望尘莫及。

过去要10000小时才能成为专家的领域，现在只需要10分钟，Kimi就能接近任何一个新领域的初级专家水平。

这下网友们就玩嗨了。

近80万字的《红楼梦》《三国演义》、150万字的《诛仙》……统统往里扔，和喜欢的角色玩起了对话，而且还免费。

图源数字生命卡兹克

一波又一波围观用户的持续涌入，Kimi很快“撑不住了”：

本周四下午，在发布新功能后不到72小时，其小程序、App、网页版突然均显示无法正常使用。

问它问题，无一例外告诉你“累趴了，晚点再来”。

官方解释：

从昨天早上我们就检测到Kimi系统的流量持续异常增高，远超我们预期的资源规划。

我们已经进行了5次扩容。

为啥大家玩得这么上头？

一方面，Kimi的底层模型能力确实强。

上个月，Kimi就排进了大模型创业公司“AI ChatBots”第一名：

访问量较1月份上涨了107.6%（达到305万，本月预计可增至500万）。

官方也相当自信，之前媒体沟通会现场，他们直接将一摞比一摞厚的《中医中医内科学》《中医诊断学》、英伟达2023年年度财报、《甄嬛传》剧本版重重放在桌面上，让大家体验。

另一方面，Kimi从推出以来就是免费的，同时产品迭代快，“遥遥领先”的长文本已成差异化竞争点。

所以这次大更新，直接让Kimi火出了圈。

最近都出现了Kimi概念股。3月22日收盘，华策影视、中广天择、华扬联众等多家A股公司涨停。其中，华策影视、中广天择实现三连板。

（目前名单中多家企业予以否认）

投资机构中信建投建议，对于AI应用板块，需要重点关注涉及长文本处理，如法律文本、合同文本、知识库学习、阅读、客服等需要文本知识输出的场景应用。

由此，也就不难理解友商为啥连夜跟进了。

而这一波集体大动作，更底层的原因还在于，今年已到了大模型商业化争夺刀锋相见的时刻。

大模型商业化争夺开战

2024年的前三个月里，包括月之暗面、智谱AI、百度等多家大模型厂商的最新动作，都更加聚焦商业化领域了。

首先来看月之暗面。

最近一个月内，它在技术、商业化、融资方面都公布诸多新消息。

在Kimi模型最新升级后3天，3月21日，汉得信息透露关注到Kimi模型已经开启AIGC平台对接测试，目前正在找一些场景探索落地的可能性。

月之暗面创始人杨植麟

紧接着月之暗面负责人回应，年内将有商业化初步方案：

商业化现在诉求逐渐变得很强烈，也有用户会说在高峰时期Kimi会提示需要等待，询问我们能不能付费解决这些问题，所以这方面在今年也会有初步的方案出来，大家会看到。

多模态大模型方面，月之暗面被曝也在研发布局中、今年将会推出。

融资方面，今年2月，月之暗面被曝最新估值达到25亿美元。

知情人士透露，月之暗面拿下新一轮10亿美元融资，其中8亿美元来自新股东（阿里、小红书等），2亿美元为老股东跟投（红杉中国、砺思资本等）。美团龙珠曾领投该公司上一轮融资。

与此同时，月之暗面正在进行大规模投放，外界已能明显感知到Kimi。

B站、抖音等平台上，以及机场、电梯里，都能看到Kimi的广告（所以Kimi这两个月的爆火也和这有一定关系）。

截图自up主龙腾虎跃龙兽医视频

其次，同样是清华背景的智谱AI，几乎复刻月之暗面的投放路线。在B站、电梯里打起了擂台。

而在本月，ChatGLM千亿对话模型一周年之际，智谱AI也披露一系列商业化成果。

这是智谱AI在大模型趋势中，首次全面解读商业化落地进展和策略。

除了展示丰富的落地合作经验、标杆客户案例之外，智谱AI全面对外解读了面向不同客户的不同落地模式。

这种清晰明确的展示，一方面是展现自家实力，另一方面更是为了吸引更多企业更进一步推进商业化进程。

融资方面，北京市人工智能产业投资基金刚参与了智谱AI在今年年初完成的新一轮融资。此前，智谱AI表示已经在2023年年内（截至10月）累计获得超25亿元融资。

除了大模型初创企业，百度最近一次大模型动向，同样聚焦行业落地。

新发布的5个大模型不再单纯卷参数量，而是更加关注模型落地的性价比、领域契合度等，并且还进一步降价。

最新消息，苹果也被曝讨论使用百度AI技术。苹果正在寻找中国本土生成式AI提供方，与百度的对话仍处于初期阶段。

消息一出，百度美股盘前涨超6%。

……

不难看出，大模型应用落地元年里，厂商们不再是单纯秀技术肌肉，每次公开信息披露中，都会带有商业化方面的考量。

尤其产品应用体验方面，一直被视为国产市场的强项。有声音还认为，Kimi或许就是一个转折点，接下来国内大模型市场的思路可能要从基础能力演变转向对产品本身、客户需求细节的理解。

截图自@小熊跑的快公众号文章

多家厂商连夜官宣增强长文本处理能力，或许就是在推进新趋势发生了。

以上种种趋势都表明，大模型领域要进入更加疯狂的烧钱阶段了。

卷长文本处理能力、团队扩充、大规模广告投放……这些账，怎么算都是天文数字。

所以接下来，主打免费的国内大模型工具该怎么平衡收支——

是开启付费、靠To B带动To C，还是烧融资？

Kimi爆火后阿里、百度等大厂角逐长文本

2024年03月24日 00:44 来源：财联社

　　月之暗面不再“晦暗”。近期，由这家公司创作的大模型应用Kimi，吸引了大量目光。Kimi产生的效应已经从大模型圈外溢至资本市场，Kimi概念股在本周应运而生。用户激增，巨大流量突然涌入，甚至让Kimi服务器一度宕机。

　　Kimi在这一轮大模型应用当中突围，核心优势在于长文本读取和解析能力。颇为巧合的是，就在22日晚间，阿里高调宣布通义千问开放1000万字长文本能力。360当晚紧随其后，宣布360智脑正式内测500万字长文本处理功能，即将入驻360AI浏览器。

　　而据《科创板日报》了解，百度也将在下个月开放200万-400万的长文本能力。

　　阿里巴巴、百度等互联网巨头纷纷布局并升级自家的大模型产品，强化长文本处理能力，正让业界重新审视长文本处理在大模型领域的必要性和重要性。而随着Kimi的崛起，这也让大模型的讨论焦点从大模型本身转移到了应用端，2024年是否会成为AI大模型应用落地元年？

　　长文本是必要的吗？

　　相较于其他大模型应用，Kimi的长处在于长文本分析联网搜索、文档处理和等功能上，尤其在深度解析厚重书籍内容方面，其性能远超远超其他模型。3月18日，月之暗面甚至一口气将无损上下文长度提升了十倍，直达200万字级别。

　　据目前的用户体验来看，Kimi也不是全能选手。有用户反馈表示，对于一些较为困难的任务，包括结构化信息处理和图像中潦草文字的识别，对话连续性上，Kimi仍显示出一些短板。在生成能力和语音能力上，目前Kimi还未加入这些模态。

　　尽管如此，长文本能力的重要性不言而喻。目前，市面上的大模型应用，GPT-4Turbo-128k公布的文本范围约为10万汉字，Claude3200k上下文约16万汉字。

　　一家AI上市公司大模型架构业务人士告诉记者，由于模型训练结构的限制，以往大模型的文本范围都不算长，但复杂任务和行业知识通常是长篇巨制，这种情况下，只能拆分输入提问，但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本可以全篇连贯的去理解上下文，满足理解和问答的需求，长文本能力在此时是具备优势的。

　　而国内大厂们，则正在长文本领域快速布局。

　　《科创板日报》记者从知情人士方面了解到，百度在下个月将对文心一言进行升级，届时也将开放长文本能力，文本范围在200万-500万。目前，文心一言的文本最高上限在3.2万。

　　而阿里已经先行一步。22日晚间，阿里的通义千问官宣升级，向所有人免费开放1000万字的长文档处理功能。用户可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

　　360紧随其后，其在当晚宣布，360智脑正式内测500万字长文本处理功能，即将入驻360AI浏览器。

　　Kimi成功在前，阿里、百度、360先后角逐长文本。长文本能力会是大模型未来差异化的竞争点吗？

　　上述大模型架构人士表示，长文本能力目前在训练和效果上仍存在一些难点，比如如何避免遗漏细节。事实上，文本长度也可以通过RoPE等算法技术去拓展，但是此时会严重丢失细节，这就导致输出效果不准确。因此，核心标准是看输出结果的精准性连贯性，并不是文本长度越长越好。

　　另外一名大模型行业人士也告诉记者，长文本实际是大模型的基础能力，只要算力资源足够，理论上长文本可以追求无限长，“但是如果使用场景根本用不上长文本，那么此时的长文本就没有任何意义”。

　　2024年是大模型应用落地元年吗？

　　Kimi的火爆，一定程度上也反应了当下国内大模型的发展阶段，从打基建开始走向应用落地。那么，2024年是否会成为AI大模型应用落地元年？

　　澜舟科技CEO周明认为，从长远来看，人工智能在逼近AGI。而经过去一年的发展，大模型已经具备了落地的能力，企业侧也积攒了很多业务落地场景。加上国家政策的推动，2024年将会是大模型落地元年。

　　零一万物联合创始人祁瑞峰也表达了类似的看法，但他是聚焦在B端场景。目前，内容生成、理解、摘要和对话等应用仍占据主导，但随着新一代模型推理、决策和执行能力的提升，有望更快地将AI技术植入企业业务系统，真正开启大模型赋能的腾飞。

　　电商是AI应用最具代表性的领域之一。魔珐科技目前是阿里妈妈、淘宝直播生态官方指定的3D超写实虚拟直播服务商，旗下有一款3D虚拟人直播AIGC产品“有光”。

　　魔珐科技CEO柴金祥在接受《科创板日报》记者采访时表示，电商是公司AI产品应用的最主要一个行业。从已有的使用效果来看，多个知名头部美妆品牌在使用魔珐科技提供的3D虚拟人后，午夜６小时的直播时段内累计年GMV增量高达数千万。3D虚拟直播午夜超级直播广告投放高于行业均值2倍以上，ROI大于5倍。

　　尽管2024年被寄予厚望，但是各方仍然保持着审慎乐观的态度。

　　祁瑞峰认为，在C端市场，目前成本还很高，商业模式还未完全跑通。即便是对于现在已经可以创收的B端市场，周明也认为，要想做好产品标准化和完整交付，训练和部署成本、行业适配能力、幻象问题、数据安全四方面的问题，还有待解决。

　　梦饷科技CTO曹均涛在接受《科创板日报》记者采访时表示，虽然AI在电商行业的应用，想象空间非常大，梦饷也在通过GPT大模型重构业务场景，包括解决模特图片生成、素材差异化、服装秀、AI创作助手、聊天室导购等问题。

　　“但是现在的阶段，基础设施并不完善。”曹均涛告诉记者，梦饷在去年为创作者做了AI创作平台，虽然能生成模特图，但是成图率并不高，还是需要技术升级和内部做技术提示词、算法模型的调优，这个平台到现在还没有开放，“现在大家都在找应用场景，估计2024年开始能够看到更多AI、大模型带来的变化”。

　　在42章经创始人曲凯看来，2024年仍会是技术上不断突破的一年，很难真的做到大规模的落地和有非常多的场景，不过，不管是在B端还是C端，今年有望看到更多应用开始跑出来。与此同时，应用端的项目今年也将更受投资人青睐。

　　“去年大家投了非常多资金和精力在大模型本身，要想将这个故事持续下去，就需要有落地，因此会在应用端继续探索，找到PMF（Product Market Fit，产品市场匹配）。”曲凯说。

　　相关报道

　　AI传出大消息！苹果盯上百度AI技术 Kimi大模型也火了

　　免费开放1000万字长文档功能！阿里通义千问对标Kimi

　　国产大模型Kimi火了！龙头连续三个20CM涨停这些上市公司与Kimi合作或参股

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。