牛津大学一项数据，让所有人都感到震惊！也给狂热的中国大模型浇了一

牛津大学一项数据，让所有人都感到震惊！也给狂热的中国大模型浇了一盆冷水！

牛津大学发现，用户所使用的语言与大模型训练成本有密切联系，比如简体中文的训练费用大约是英语的两倍。因为训练成本更低，英文大模型生态才得以冠绝全球.像ChatGPT如此“聪明”就在于语料更大，仅GPT-3便拥有1750亿的参数量。

扎心的是，由于训练成本更大，中文世界严重缺少好的开源大模型。一些中小企业、开发者空有创新想法，却没有创新的平台！

幸好，本土大厂正在把风向变好。阿里云已经开源了通义千问140亿参数大模型，免费、可使用。该模型在MMLU、C-Eval等12个权威测评集上均获得最佳成绩，全方位超越Llama-2-13B等同尺寸模型，整体训练数据超过 3 万亿 Token（词元），具备更强的推理、认知、规划和记忆能力。此前，阿里云还开源了通义千问70亿参数模型，一个多月下载量就破了100万。

中美大模型不只是表面的技术之争，生态之争才是胜负手。中文大模型的用户多了，生态自然也就繁荣了，阿里云开源无异于降低了中文大模型的门槛，值得肯定！

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。