打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
牛津大学一项数据,让所有人都感到震惊!也给狂热的中国大模型浇了一
牛津大学一项数据,让所有人都感到震惊!也给狂热的中国大模型浇了一盆冷水!

牛津大学发现,用户所使用的语言与大模型训练成本有密切联系,比如简体中文的训练费用大约是英语的两倍。因为训练成本更低,英文大模型生态才得以冠绝全球.像ChatGPT如此“聪明”就在于语料更大,仅GPT-3便拥有1750亿的参数量。

扎心的是,由于训练成本更大,中文世界严重缺少好的开源大模型。一些中小企业、开发者空有创新想法,却没有创新的平台!

幸好,本土大厂正在把风向变好。阿里云已经开源了通义千问140亿参数大模型,免费、可使用。该模型在MMLU、C-Eval等12个权威测评集上均获得最佳成绩,全方位超越Llama-2-13B等同尺寸模型,整体训练数据超过 3 万亿 Token(词元),具备更强的推理、认知、规划和记忆能力。此前,阿里云还开源了通义千问70亿参数模型,一个多月下载量就破了100万。

中美大模型不只是表面的技术之争,生态之争才是胜负手。中文大模型的用户多了,生态自然也就繁荣了,阿里云开源无异于降低了中文大模型的门槛,值得肯定!
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
大模型参数调优
探秘吉利星睿智算中心:两大巨头的钱砸在哪儿了
全球最大!阿里云推飞天智算平台,单集群算力超12EFLOPS
大厂混战AI大模型,云计算谁最行?
生成式AI大模型,或将撼动云服务市场格局
搭建个人CFD知识库
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服