AI同光体会梦到赛博杜甫吗？——AI旧体诗创作漫谈&整活倡议

声明：

本文为漫谈，并不严谨，因此不引用任何参考文献。全文所谈仅代表作者本人观点，很多是没有证据的猜想，故文中多用“可能”

chatGPT与百度文心
AI旧体诗的前世今生与将来的发展

稻香老农
九歌
诗三百
未来发展预测

AI旧体诗带来的启示

AI与人类诗人

图灵测试
原创性问题
AI作诗与人类诗人关系探讨

AI时代下的诗歌审美

主体性
诗歌的语境
拟古与出新
长古大篇

破局与否
守卫人类心智的荣耀

整活倡议

AI同光体会梦到赛博杜甫吗？
图穷匕见

chatGPT与百度文心

最近chatGPT很火爆，作为一个曾经使用过GPT算法的AI研究者，我其实早在chatGPT破圈前就已经体会过它强大的性能了。不过具体到让chatGPT去写旧体诗，它还是力有不逮，见下图：

chatGPT在旧体诗生成这个方向如此拉胯的原因在于——它没有对旧体诗生成这个任务进行专门的训练，所以写出来的东西自然就不知所云。openAI作为一家美国公司，不关注中国的旧体诗实属正常。

不过就在前些时间，对标chatGPT的国产大模型百度文心一言出现了，作为中国企业的产品，当然要会写中国的诗歌，所以李彦宏在发布会上当场让文心写了一首藏头诗——

这是妥妥的翻车啊，格律不对，内容无厘头，且蹈袭古人原句。可能是百度的技术人员不懂旧体诗，所以得到了这么一个不如人意的效果。

AI旧体诗的前世今生与将来的发展

在尝试过国内国外两个大语言模型去生成旧体诗后，我个人认为，chatGPT和百度文心一言并没有太好的AI旧体诗生成功能。目前公开的，能代表AI旧体诗生成的，应该还是九歌和诗三百。

先来讲讲我印象中的AI旧体诗生成的发展脉络：

第一个闻名于众的生成旧体诗词的程序是稻香老农的作诗机，苏无名在2006年左右发表的《网络诗词点将录》中，点稻香老农为金枪手徐宁，将此作诗机类比为钩镰枪这种破敌兵马的神器，并且又说“老农诗词，亦有过人处”。可见稻香老农是在自身有浓厚的旧体诗创作基础上，才开发出的这个程序。但遗憾的是，由于年代久远，我并不能分析出稻香老农的作诗机是否用了AI技术。然而AI技术大火要到2012年之后，所以稻香老农的作诗机可能并没有使用AI的算法。

第一个使用AI领域的深度学习技术来生成旧体诗词并且大火的，当属
清华大学自然语言处理与社会人文计算实验室开发的“九歌”，我当时看到了九歌网站，惊为天人，遂放弃了转专业的念头，从古代文学跳进了AI的深坑。不过现在看来，九歌当年的作品还比较稚嫩。毕竟17年的时候还没有预训练模型，而且九歌的数据集也只有三十来万首诗词。

目前公开的，影响最大且效果最好的旧体诗生成程序当属诗三百，开发者疑为一位浙大的计算机博士，从它最近推出的“唐宋风格”来看，开发者应该不太懂旧体诗，否则不会没听说过绵延数百年的唐宋之争，导致把唐诗和宋诗混作一种风格。

由于时间较晚，诗三百相比九歌后出转精，2018年后，大规模预训练模型已经铺开，自然语言处理领域的任务可以通过使用预训练模型而获得性能上的较大提升。诗三百使用了哈工大开源的现代汉语语言模型，又使用了更丰富的数据集（八十余万首诗词），获得了比九歌更好的效果。

这里稍微提一嘴大规模预训练模型为啥能提升性能。我打个比方，九歌在2017年的未使用预训练语言模型的算法，相当于是给一个不会说话的孩子塞了三十万首诗词，希冀他可以照葫芦画瓢写出几首来。而诗三百用了哈工大训练好的现代汉语预训练模型，就相当于是给一个已经会说现代汉语的孩子塞了八十万首诗词让他学习。两者相较，自然是后者更胜一筹。而由于诗三百的底子是现代汉语模型，所以还会有一些有趣的效果，比如说你让它以“召开”等关键词写诗，它能写出标准的老干体。

如果对诗三百的原理感兴趣，可以去作者的GitHub页面（https://github.com/wangjiezju1988/aichpoem）去查看。诗三百的开发者详细描述了实现原理，但是没给代码。

chatGPT的强大性能使一部分人觉得诗歌会成为下一个被AI攻破的领域，就像之前的围棋一样。但是我个人持有不同的看法，现有的基于深度学习的AI，背后都是在计算概率——换言之，AI暂时不知道哪句诗好，它只是根据数据库里的作品，写出最可能，最符合概率的句子来。所以AI生成的作品的期望是最符合概率的作品而非最好的作品。当然了，根据无限猴子原理（给猴子一个键盘乱敲无数次，总有一天它会敲出来一部莎士比亚全集），AI生成的作品中会有好诗，但是这种情况就像诗云中的穷举一样没什么意义。

目前的AI旧体诗创作，我猜测已经到了一个瓶颈，现有的技术最多通过丰富数据或增加技法规则来提升些许作品质量，无法再带来质的提升。chatGPT和GPT4，基本的原理其实和2018年没什么变化，不同的是算力提升了很多，所以效果好得多。但是提升算力这条路已经快到极限了，不可能一直走下去的，在这点上，杨乐坤大佬（因深度学习领域的贡献而拿到图灵奖的深度学习三巨头）认为chatGPT走错了路。

在现有的弱AI的情况下，AI超越人类高水平诗人是个可望而不可即的目标。除非将来AI算法取得巨大突破，强人工智能成为现实，AI真正具有了思想和人格（或者能虚拟出思想和人格）。但这一天目前还遥遥无期，这点我认同程羽黑兄的看法：“换言之，写诗的能力附属于强人工智能，没有必要花费太大的代价单独开发。在强人工智能出现前一味关注这一能力，恐怕有事倍功半甚至无解的风险。”

诗歌与科技 ▏人工智能诗歌论

担心AI快速进步吊打人类诗人的朋友们可以放心了。（这只是我的看法，将来可能被打脸）

AI旧体诗带来的启示

AI与人类诗人

图灵测试

要探讨AI与人类的关系，图灵测试是绕不过去的一个东西。之前为了探究AI生成的旧体诗是否能达到以假乱真的水平，我把击壤的作品和明清大佬（如钱谦益，陈三立）的作品混在一起，出了个问卷让人二选一，分辨哪首是人类写的。一共十六道题，分为五绝五律七绝七律四个体裁，每个体裁四道题。参与测试的人员有旧体诗创作者（铭社，乾社，承社等诗社的社员），也有专业研究者（北大，复旦等高校古代文学方向的学生）。测试的结果是：整体正确率50.32%（二选一的话随便选，正确率也应该是50%）。这次图灵测试的内容与结果详见：

如何分辨一首诗是否是AI创作的？（AI图灵测试答案）

这次测试的结果说明，哪怕是对于旧体诗词了解颇深的创作者与研究者来说，分辨一首诗歌是AI创作的还是人类创作的也是一件不容易的事情。

原创性问题

接上，由于很难分辨AI作品与人类作品的差别，所以导致有人拿诗三百的作品据为己有招摇撞骗，并且开班收钱教人写诗。这种直接的搬运当然是毋庸置疑的抄袭，但是更多的情况是很难去定义的。比如有人取了AI作品中的单个句子放在自己诗里，这种算不算抄袭？或者将AI作品略改数字（李攀龙：这个我熟），这种算不算自己的作品？这些行为如何定义？举办诗赛时如何检测？凡此种种，尚有待达成共识。

AI作诗与人类诗人关系探讨

其实对于AI与人类诗人的关系，我觉得潘静如老师的想法最有道理：“李杜苏黄在前也不影响你写诗，是不是？ai也一样影响不到”，在21世纪这个很难通过旧体诗来获得功名利禄的时代，诗是写给自己看的东西，目的是进行自我表达。AI写的再好，也不过是今之李杜，最多师法借鉴一下，何必跟AI比较诗作水平？

我个人觉得，AI与旧体诗人最合适的关系是：AI提供灵感或变成类书一样的参考工具。因为诗歌是人类表达思想情感的工具，AI生成的作品哪怕写的再好都是无意义的——它唯一的意义是被人看到并对人类的创作产生启发。

AI时代下的诗歌审美

主体性

个人猜测，在AI生成的旧体诗已经可以和明清名家的平庸之作五五开的情况下，AI的存在可能会倒逼当前的旧体诗审美产生一些流变。

谈起AI的旧体诗作品，不可忽视的一点就是作者的缺位。我觉得作者本人是旧体诗的一个重要组成部分。龚自珍尝言“人以诗名，诗尤以人名。唐大家若李、杜、韩及昌谷、玉谿，及宋元眉山、涪陵、遗山，当代吴娄东，皆诗与人为一，人外无诗，诗外无人，其面目也完。”，此论是也。试想如果“人生自古谁无死，留取丹心照汗青”一诗是游泳健将钱谦益所做，恐怕大家就不会觉得那么好了吧。这首诗要配上作者文天祥的事迹，才能最大程度地令人感发，如果作者是钱谦益，那么此诗的感染力必然减弱。

基于AI作品主体性缺失这一特点，现行的诗歌审美可能会更加注重诗中作者本人的存在。

诗歌的语境

先给大家看张截图，无冒犯之意

图中说陶渊明“隔”的这位，是我非常喜欢的一位当代旧体诗人，并且我认为他说的对。一首诗有属于它自己的语境，这首作品在老陶的语境写出来就是好，在今人写出来就是不合适。在高铁飞机通全国，过安检不能带管制刀具的时代，“撫劍獨行游”“飢食首陽薇，渴飲易水流”这种句子由当代诗人写出来像是摆pose。此外，经历过唐宋元明清诗艺的发展后，六朝时合适的诗语可能已经变成了熟语，当代人写未免觉得顺手。

在AI的创作中，语境也是缺失的，而且由于AI的“妙手空空”之病，作品常缺少明确的指向性，可彼可此。人类诗人为避免此类“妙手空空”，可能要做到指事精当，作品更加贴合创作时的情景。可以在不封号的情况下多写感事诗，如顾青翎《都门春日漫兴》，luq的《徐汇吏》《浦东吏》，槑庵的《黄浦滩民谣》，铁壑斋（因鲁鱼亥豕之误被迫更名铁坚斋

拟古与出新

上文提过，现有的AI是基于概率的，所以它会写出最有可能的诗句。而根据我目前对自己编写的AI旧体诗生成模型“击壤”的观察，五绝是其最薄弱的体裁——原因就是古人五绝的作品写的少啊。所以如果过于拟古，写一些跟古人很像的东西，很可能落入AI的窠臼，而如果你比较前卫或创新，写出一些古人未到之境，那么AI是很难碰瓷你的。

这个出新，可以是意新（古人未有过的想法），如诗坛霸主红烧的名句“此后绯衣复谁解，当年红豆已全荒。”；也可以是语新（炼字或用典精妙），如江上木奴的“每志桃溪扶路树，都添滟滪刻舟痕。”“犬雞無數通仙籍，猿鶴幾多浮海槎。”；或者是有李子，黑眼睛，金鱼那样独特且不同于古人的语言风格。此处不再一一枚举。在AI已经能做到拟古的情况下，人类诗人如果想要摆脱“你写诗像AI”的形容，可能要更加注重创新。

长古大篇

AI生成内容是靠计算，有计算必有误差，而误差又字字积累。所以AI生成短一些的文本，如律绝，有时还可以掩人耳目，因其字少，误差就小，效果也好。稍长一些的古体就完全不够看，字数一多，积累的误差就大了。而且AI缺乏明确的指向，糊弄糊弄稍短的律绝还好，对长古大篇来说，这个缺点是致命的。所以像老杜《自京赴奉先縣詠懷五百字》这种长古大篇，是AI暂时望尘莫及的高度。

以个人愚见，长古也最见水平。为什么这么说呢？咱们如果假设诗可以短到一个字，那么我说一个字，和李杜说一个字，我不觉得会有高下之分。如果再长点，诗是一句五言，那么我写一句五言，和李杜写一句五言，虽然有差别，但可能高不了我太多。发展到五绝，李杜就可以随意碾压我。盖因如果只有一个字，那么你只有几千种不分高下的选择（假如都是常用字），五个字的话情况就是几千的五次幂，那已经是一个天文数字，其中蕴含的信息就多得多，差异也大得多。以此类推，我们可以得出结论，字数越多，留给诗人的创作发挥空间也就越大，诗的信息量也就越大，诗与诗之间的差距也就越大。那么依照这个推论，古体是最见功力的体裁。所以如果将来AI作品泛滥，大家又分不太清楚AI作品与不出彩的真人作品，那么长古在审美评价体系中的重要程度可能会陡然提升。

破局与否

上文提到了AI可能会对审美体系的改变，当然也提出了面对AI作品的破局方法：增加主体性，贴合语境，出新，长古。但其实摆在破局面前的还有一个重要问题是：有没有必要破局？

就像潘静如老师所说，AI最多是今之李杜，你自己写诗根本不用去管他。哪怕作品跟AI放一起分不出来又如何？只要达到创作目的就好，兹举一例：

AI一别三千里，重来十二年。壮怀空老矣，旧话只依然。

钱谦益一别三千里，相看七十年。明朝数行泪，沾洒各山川。

在我的图灵测试中，钱谦益这首五绝和AI根据首句生成的作品放在一起让人二选一，正确率极度接近50%。鉴于这是二选一的题目，哪怕是随机乱选，正确率也应该是50%，所以我们可以得出结论：大多数人是分不出这两首作品哪首是AI创作的。但是，这又能怎么样呢？钱谦益和相知数十年的老友将要离别，他写这首诗赠给朋友——虽然用语寻常，立意也寻常，比起过往的送别诗没有任何新意，毒舌一点，套用纪昀的评论“此等诗可不必做”——但他已经完全达到了他的写作目的，他的临别不舍的情意借此诗得以抒发，而老友也通过这首诗感受到了这些，这就够了，放在AI作品里分不出来又怎么样？

所以我们也需要思考，非要写出有别于AI的作品是否是有必要的？是否偏离了创作的初衷？是否只需要借AI来审视反思自己是否过分拟古就够了？当然，这个问题没有标准答案。

守卫人类心智的荣耀

在围棋的高地失守之后，诗歌这种独属于人类思想情感的存在还在守卫着人类心智的荣耀，AI暂时可以和一些不出彩的作品比肩，但无论如何也比不上当代高水平的旧体诗人——虽然这并没什么用，但我还是想向当代这些坚持旧体诗创作且有自家面目的诗人致敬。

整活倡议

AI同光体会梦到赛博杜甫吗？

（蹭一蹭“仿生人会梦到电子羊吗”）

参见之前的推文，我本人的毕业设计做的就是AI生成旧体诗，且支持不同风格，如艳诗风格或同光风格：

当AI开始学写艳诗——当时月照千寻绮，今日花疑万炬烧。
当AI开始同光式负手
原理基于GPT和BART（不是BERT，没有写错）算法，除了支持特定风格诗作的生成之外，与诗三百最大的不同有三点：

1.诗三百在现代汉语基础上训练，我觉得这样会有白话思维，所以纯用古文做预训练，相当于教一个会说古文的孩子写诗，牺牲了普适性（你输入现代汉语的东西击壤就不能处理），但个人认为提高了语感。

2.诗三百用“题目-正文“的方式进行生成，我觉得“题目-正文”的映射关系并不唯一，换成了“首句-正文”的方式。

3.数据从八十万加到了一百二十万。

个人感觉效果不错，所以——

图穷匕见

（你这燕国地图怎么那么长啊）其实我写这篇文章的目的，就是想要寻找一些对击壤感兴趣的朋友一起整活，但觉得孤零零发个招募不太好，于是借chatGPT和百度文心谈了谈AI作诗，一不小心写了太多。

AI的旧体诗作品虽然很多时候不着调，但有时候确实还行，感兴趣者可以阅读上文那两篇推文。所以我想找一批对击壤感兴趣的朋友试玩一下，你们从生成的作品中挑一些好的或有趣的发给我，我再水一篇推文（计划通）。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。