By 厌氧菌 in Cybertext读书笔记 — Mar 26, 2020

《Cybertext》读书笔记（六）：文本创作机器

在第四章和第五章中，我们分别考察了超文本文学（Hypertext Literature）和文字冒险游戏（Text Adventure Game）。在这一章中，Aarseth考察了文本作品自动生成的概念，讨论了一些当时现存的尝试和人们对此的看法。

我们继续来看《Cybertext》这本书中作者Aarseth对制动文本和遍历文学的讨论。从第四章开始到第七章，Aarseth对几类具有一定代表性的制动文本进行各自专门的讨论，分别是超文本文学、文字冒险游戏、文学创作机器和MUD。

这些章节与其他章节相对独立，但还是建议有时间的读者先阅读前面的章节。

在前面三章的读书笔记中，我们讨论了作者 Espen J· Aarseth所提出的制动文本（Cybertext）和遍历文学（Ergodic Literature）的概念：制动文本是一种因源文本、媒介和操作者三者之间复杂的交互作用而自成信息系统的文本，当这种文本的目的在于实现某种美学属性的时候，它就成为了一种遍历文学。古埃及神庙墙壁上的铭文、图像诗（Calligrammes）、我国的《易经》、基于计算机的文字冒险游戏、自动聊天机器人、故事写作程序、多人在线地牢（MUD）都是制动文本和遍历文学的例子。这些作品由于在传统的媒体分类体系下定位模糊，很难得到公正的分析和评价。在表明一些现有的看起来能够使用于这些作品的文学分析视角实际上并不能准确分析这些作品之后，作者提出了一套“文本通信的分类学（A Typology of Textual Communication）”，试图为这些作品的分析提出全新的理论框架。

自动文本创作机器

1973年，威斯康辛大学麦迪逊分校（University of Wisconsin-Madison）计算机科学院发布了叫做Novel Writer的一个FORTRAN语言编写的程序。Novel Writer集当时的计算机科学和语言学研究之大成，用一个庞大的语义网络模拟一个可以发生无数可能故事的“宇宙”。语义网络中的节点代表宇宙中的人、事、物，节点之间的联结则代表对应节点所代表的人、事、物之间的关系。由语义网络表示的“宇宙”在符合逻辑的限制下随机演变，再由一个文本渲染引擎将宇宙的演变用文字的形式叙述出来，成为一篇故事。最终，Novel Writer每次运行能够在19秒钟都不到的时间里生成一篇不一样的2100个单词的谋杀破案故事。

Novel Writer最初是作为一项计算语言学（Computational Linguistic）的研究成果而发表，但它无疑也在人类使用计算机自动创作文本叙事作品的道路上迈出了第一步。1977年由James. R Meehan作为他的博士论文发表的Tale-Spin将更多的心思放在了产生出有趣的故事上。更重要的是，与如同一个黑箱子一样产生毫无用户介入余地的Novel Writer不同，Tale-spin是一个能够接受用户的输入的具有一定透明性的故事创作引擎。用户能够告诉Tale-spin故事发生的场景，主要的人物（在Tale-spin中设置为伊索寓言风格的会说话的动物们）和这些人各自需要面临的问题。Tale-spin的任务则是基于用户给出的故事设定和一些背景知识，找到一条符合逻辑和情理的情节发展轨迹，让故事中的人物在相互作用产生的社会关系中解决各自面临的问题。这样的情节发展轨迹，经过文字渲染输出，就成为一段故事。

在Meehan自己所举的一个例子中，用户设置了“河边（River）”这个场景，创建了“小鸟威尔玛(Wilma the bird)”和“蚂蚁乔治(George the ant)”这两个人物，并设置这两个人物面临的主要问题都是“口渴(Thirst)”。Tale-spin据此生成了以下的故事：

很久很久以前，蚂蚁乔治住在一小片地上。在一颗白蜡树上有一个鸟巢。小鸟威尔玛住在鸟巢里。一条小河里有水。威尔玛知道小河里有水。乔治知道小河里有水。有一天威尔玛很口渴。威尔玛想接近有水的地方。威尔玛从她的巢飞过一片草地，又飞过一个山谷，来到了河边。威尔玛喝了水。威尔玛不渴了。
乔治很渴。乔治想接近有水的地方。乔治从他的一小片地上穿过草地，又穿过一个山谷来到了河滩上。乔治掉进了水里。乔治想前往山谷。乔治无法前往山谷。乔治想前往草地。乔治无法前往草地。威尔玛希望乔治能前往草地。威尔玛想接近乔治。威尔玛用她的爪子抓住了乔治。威尔玛把在河里的乔治穿过山谷带到了草地。乔治欠了威尔玛大人情。威尔玛放掉了乔治。乔治掉在了草地上。（结束）

这段故事情节枯燥无味，文字表达也毫无感染力。但是，故事情节的发展环环相扣、逻辑严谨，并且丝毫没有偏离用户一开始给定的输入。Tale-spin甚至还能运用一些用户没有提及的常识性知识（例如口渴需要喝水、河里有水、鸟会飞蚂蚁不会飞、遇到他人有危险要见义勇为等等）来推动情节发展。在那个人工智能刚刚起步的时代，这些特点已经足以让Tale-spin成为自动故事创作领域的一座里程碑。

叙事类的文本作品毕竟只是人类文学的一种，由William Chamberlain和Thomas Etter共同开发的程序Ractor，将目标转向了自动创作诗歌。1983年出版的一本叫做《The policeman’s Beard is Half Constructed（那个警察的胡子被构造了一半（？实在不知道该怎么翻译））》的书，被描述为是完全由Ractor程序创作的诗集。Ractor程序本身后来在1984年由一个叫做Mindscape的法国游戏公司发行在一些命令行操作系统上。公开的Ractor程序被包装成一个聊天机器人，可以与玩家用自然语言进行对话，在对玩家输入的回复中随机出现一些内容与当前上下文相关的诗歌。与著名的聊天机器人Eliza类似，Ractor也是通过识别用户句子中的模式和一系列文本生成模板来生成对用、户的回应。但Ractor说出来的话更加天马行空不着边际。

作为一个例子，下面是摘自《The policeman’s Beard is Half Constructed》的一首小诗

A crow is a bird, an eagle is abird, a dove is a bird.
They all fly in the night and in the day.
They fly when the sky is red and when the heaven is blue.
They fly through the atmosphere.
We cannot fly. We are not like acrow or an eagle or a dove.
We are not birds.
But we can dream about them.
You can.

乌鸦是鸟，老鹰是鸟，鸽子是鸟。
不论白天或是晚上，它们都在飞。
不论天空是红色还是蓝色，它们都在飞。
它们飞过大气。
我们不会飞。我们不像乌鸦或者老鹰或者鸽子。
我们不是鸟。
但我们可以做有关它们的梦。
你可以的。
（原谅毫无诗意的渣翻译）

比起叙事类文本，诗歌创作要面对的要求似乎宽松得多：不需要符合逻辑、不需要合情合理、不需要前后一致，甚至当它完全只是一串意味不明的文字，都有可能会有想象力丰富的读者从中领悟到了意味深长的意境。《The policeman’s Beard is Half Constructed》中的每一首诗，都搭配了编者受到诗作的启发绘制的插图。有时候尽管读诗的时候完全云里雾里，却能在看到插图的瞬间感觉看到了意义。如果说Novel Writer和Tale-spin所提出的是有关计算机智能的技术性问题，Ractor则引导人们去思考“什么是艺术作品”这个哲学问题——当一件艺术作品的作者自己都根本没意识到这件作品的意义或者美感的时候，这件作品还能称之为是一件艺术作品吗？

*《The policeman’s Beard is Half Constructed》的插画师Joan Hall为前述小诗画的插图*

上面所提到的Novel Writer，Tale-Spin和Ractor，都是自动文学创作机器的例子。也是《Cybertext》的这一章讨论的主题。作者Aarseth特别探讨了这样一个问题：一个以创造出人类文学为目标的交互式文学创作机器，它与人之间是什么关系？

当机器被迫模仿人类作家

文学作品是一种人类文化的产物，其合理性和价值都深深植根于人类文化，包括人类语言、人类历史、人类意识形态等等。一件文学作品往往是某个或者某几个人，作为庞大人类群体中的成员在进行一种自我表达。一件文学作品的美学价值，也是基于人们对这个自我表达行为的共识基础之上去进行评估的。人们相信一部作品总是想要告诉读者点什么，而当读者理解了是作者的什么经历去推动他创作这部作品，作品的表达力量通常会因此变得更强。

而当一件文学作品来自于一个机器、一个程序、或者说一个算法，我们就失去了进行审美评价的通常语境——因为“究竟是谁在进行自我表达”这一点变得不清楚了。这个时候，在人类所创作的作品中的“好”的品质和“坏”的品质，到了机器产生的作品这里，可能就完全不一样了。

前面我们所介绍的故事生成程序Tale-spin，其作者Meehan关注的重点是要能够创作出符合逻辑和情理的故事。因此他花了大量心血在编码各种各样的逻辑和常识性知识上，以确保Tale-spin系统不会在输出的故事中出现不合逻辑或者常识缺失的桥段。而这一切都是因为，当我们去评价一件来自人类作者的文学作品时，符合逻辑和情理通常是一件好作品应该具备的特征。

讽刺的是，Tale-spin所产生的那些合情合理的“正确”故事（比如我们前面引述的那段小鸟救了蚂蚁的故事），因其平庸的情节和枯燥无味的叙事并没有得到多少关注。反而是那些在某些地方掉了链子的“错误”故事，在各种文献中被反复提起，成为话题。

在Tale-spin的一个错误输出中，蚂蚁亨利因为口渴要喝水来到了河边，结果不慎跌入水中。他的好朋友小鸟比尔就坐在河滩上眼睁睁地看着亨利被淹死。亨利因为被淹在水里而无法出声呼救，而Tale-spin系统只知道一个出声呼救的角色需要帮助，它没有“注意到一件事的发生”这样的概念，导致了小鸟比尔对好朋友的遭难视而不见。

Meehan发现了这个bug，于是在程序中加入了“当一个角色遇到困难，求救信号会自动传送给在同一场景中的其他角色”的编码。经过这样的改进之后，亨利终于得救了。但是却有另外一位意料之外的角色遇难：

蚂蚁亨利因为口渴要喝水来到了河边，结果不慎跌入水中。小鸟比尔救了亨利。万有引力淹死了。

这是因为，是万有引力将亨利移动到了水里，因此万有引力一定与亨利在同一个地点，因此万有引力也在水里。而万有引力既不会游泳，又没有翅膀不会飞，也没有在附近的朋友来救它，所以不幸淹死了。

下面是另一个关于小熊乔和小鸟艾文的故事：

小熊乔很饿。他问小鸟艾文哪里有蜂蜜。艾文不告诉他，所以乔承诺说只要艾文告诉他蜂蜜在哪里，他就给艾文带虫子来。艾文同意了。但是乔不知道哪里有虫子，于是他问艾文哪里可以找到虫子。艾文不告诉他，所以乔承诺说只要艾文告诉他虫子在哪里，他就给艾文带虫子来。艾文同意了。但是乔不知道哪里有虫子，于是他问艾文哪里可以找到虫子。艾文不告诉他，所以乔承诺说只要艾文告诉他虫子在哪里，他就给艾文带虫子来……

故事的最后变成了一个无穷循环。Tale-Spin的原理是在一开始将解决玩家所输入的每个角色所面临的问题设定为整个故事要达成的目标，再不断将大目标分解成为小目标，直到目标小到在当前世界状态下只要采取一步行动就能够达成，如此不断重复直到整个故事的目标达成。而有时候目标A的达成需要目标B的达成，目标B的达成又需要目标A的达成，就会形成死锁。就像在上面这个例子中的那样，“乔知道给艾文找来虫子”和“乔知道虫子在哪里”这两个目标相互依赖，又没有别的解决方法，从而形成了死锁。

我们发现，这几个“错误”的故事，比起在本文一开头引用的那篇“正确”的故事来，读起来有趣得多。每一个“错误”的故事都仿佛给我们带来了某种思维上的启迪——它们各自向我们揭示了一个我们天天都在使用、却因为“过于显然”而常常被我们忽略的思维方式或者常识性知识。比起开篇引用的那篇“正确”的故事来，这些“错误“的故事才是让读者觉得“言之有物”的故事。它们每一个都甚至没有达到对一个故事要合情合理的基本要求，却反而因此得到了比某些合情合理的故事更高的审美评价。

Aarseth提到了“ELIZA效应”这个概念（这个ELIZA就是我们在前面章节提到过多次的聊天机器人ELIZA）。ELIZA效应是指人们会潜意识地认定机器的行为对应于人的行为，因而在观察到机器的一些行为时，从中解读出远比这个行为本身的意义更多的意义。当一个程序对用户输出了“谢谢”两个字，用户很难不从中解读出对他的感谢之意。但实际上这个程序只是构造了一个由两个“谢”字组成的字符串并打印在了屏幕上，并没有任何感谢之意在其中。

*类似于ELIZA的现代心理诊疗程序Woebot，通过与用户交谈而改善用户心理状态，但程序实际上并不会真的产生对用户的共情*

类似地，当我们读到一篇机器产生的文学作品，即使我们知道它是机器产生的，其模仿人类文学作品的架势已经让我们的脑子进入了一种与在读人类文学作品相似的状态。只要大体上句子能读得通，我们就会忽略个别的拼写和语法错误；如果全篇80%的内容是合情合理的，读到意味不明的20%，我们的大脑甚至会努力试图解读出这20%的内容背后可能并不存在的“真意”。一篇文字可以在读者大脑中触发比文字本身的真正含义广阔深远得多的认知。

前面提到的诗人程序Ractor在这方面也是一个典型的例子。那些只是在一组字符串操纵模板基础上填入随机的单词产生的毫无表达意图的文字，却能够激发人无限的遐想，甚至启发插画师画出大量令人惊艳的画作。

因此，Aarseth提出，我们应该放弃使用我们评价传统人类文学作品的既定标准去评价机器生成的文字。机器永远不会成为优秀的传统人类文学作家，就因为它自身无法像人类读者那样领会到传统人类文学中被认为好的那些品质如何就是好的，它自身永远不会去欣赏自己的作品。

赛博格作家

大多数文学创作机器的创作是有人类介入的：Tale-spin需要用户输入角色、场景和各个角色面对的挑战，Ractor需要一个用户来跟程序进行对话；哪怕是没有任何交互性的程序，也至少是人类开发出来的。这种情况下，文学创作机器所创作出的作品的作者究竟是谁就成为一个问题。

在Tale-spin中，用户的输入就像是给出了整个故事的大方向，程序则是在这个大方向下找到了一个具体的故事，因此是一种比较直截了当的合作关系。Ractor的情况则稍微更加复杂。用户在对话中的输入与Ractor创作出的诗歌之间的关系是不直接的。与其说用户的输入提供了Ractor诗歌创作程序所需的参数，不如说Ractor是在用户输入的“启发（Inspire）”下以一种用户并不清楚的逻辑生成的诗歌。诗集《The policeman’s Beard is Half Constructed》则又牵涉到另一层面的人机合作：有幸被收录到诗集中的作品，是由Ractor的开发者Chamberlain自己从大量的Ractor的作品中筛选出来的特别优秀的那些例子——而没被选中的那些作品，有多少是完全意味不明的单词随机堆砌，我们就不得而知了。

因此，由Chamberlain操作Ractor形成的诗集《The policeman’s Beard is Half Constructed》，其真正的作者既不是Ractor，也不是Chamberlain，而是Ractor和Chamberlain的共生体（Symbiosis）。同样的，我们通常所说的“计算机文学（Computer Literature）”，实际上是一种“赛博格文学（Cyborg Literature）”。一件由文学作品创作机器产生的作品，其作者是一个“赛博格作者”。

我们在第二章读书笔记中介绍过赛博格这个概念，它指的是机器和人分别自治形成的共生体。一件赛博格文学作品，虽然在一开始注入了共生体中人的意志，但经过机器部分的复杂变换处理，最后的作品中反映出来的意志比起一开始人所注入的意志，可能已经面目全非。

一个赛博格作者中人与机器的关系，可以有多种多样的形式。在产生文本的过程中，根据Aarseth，人机合作可以发生在三个阶段：

预处理（Preprocessing）一个文学创作程序被人类编写、配置和部署的阶段，

协同处理（Coprocessing）机器和人协同生产文本的阶段，

后加工（Postprocessing）人从产生的作品中选择出一部分而舍弃其余的阶段。

Aarseth根据这三个阶段中是否发生了任何人机合作，建立了一个简单的赛博格作者分类体系，并将这个分类体系运用到了以下六个典型的赛博格作者的例子。

《曼哈顿谋杀疑案》中的一个场景（Scene from Manhattan Murder Story） 《曼哈顿谋杀疑案》是1993年由伍迪·艾伦导演的一部电影。这个场景指的是其中这样一段情节：主角们为了仿造一个女演员给她的爱人留下的电话留言，事先邀请这个女演员进行了一场假彩排，收集到这个女演员的声音样本之后，用这些样本拼凑出了他们想让这个女演员对她的爱人说出的话，用磁带录下后再播放给对方的电话留言设备。最后，虽然这段拼凑出的假留言有各种各样语言用法上的错误或者说不自然之处，因为声音确实来自于女演员本人，他的爱人听过之后并未产生任何怀疑。

Aarseth将这段假留言的作者看作是混杂了人机的多个意志的赛博格作者——其中有提供声音样本的女演员，有合成假留言的主角们，还有主角们为了合成假留言而使用的音频编辑、合成、播放设备。这个赛博格作者中的人机合作，发生在了预处理阶段和协同处理阶段，而不存在后加工。

Tale-Spin 我们前面介绍的故事创作程序Tale-Spin，只在程序编写时和程序运行最开始用户提供输入时，后续过程是程序全自动的。因此人机合作关系只存在于预处理阶段。

由RogerSchank转述的Tale-Spin故事集(Schank’s Version of Tale-Spin) Roger Schank是一名美国的认知心理学家和早期人工智能学者，他曾在自己的著作《认知计算机：论语言、学习和人工智能（The Cognitive Computer. On Language, Learning and Artificial Intelligence）》中大量引述Tale-Spin产生的故事。由于Tale-Spin产生的故事到了Schank这里，为了表达Schank的观点又经过了一层人类筛选，人机合作关系又多了后加工阶段。

Ractor 我们前面介绍的诗歌创作程序Ractor，由人类编写程序并提供基础诗歌模板，在程序运行时又有用户全程向程序输入对话，因此人机合作关系发生在预处理阶段和协同处理阶段。

前面介绍的Ractor作品集《Thepoliceman’s Beard is Half Constructed》中的诗歌 这些诗歌由Ractor作者William Chamberlain自己编写程序、设计诗歌模板生成，最后又由Chamberlain自己进行筛选和语法润色，因此人机合作关系发生在预处理阶段和后加工阶段。注意这个时候的Ractor还不是后来发布的聊天机器人版本，在运行过程中没有用户输入，因此不存在协同处理阶段的合作。

《The policeman’s Beard is Half Constructed》中收录的对话 这些对话因为过程中有了用户输入，比前面又多了协同处理阶段的人机合作。

上述的这个赛博格作者分类体系，看起来非常笼统——不过考虑到它要将诸多鲜有共同之处的作品都归入同一个分类体系下，这一点或许也是可以预见的。从具体作品的分析中，我们也发现一些规律——几乎所有赛博格作者都在预处理阶段存在人机合作，而协同合作和后加工阶段的人机合作几乎是互斥的。

当我们评价传统人类文学作品时，通常的一个假定是，这个作品是有一个主题的——而一切内容都是围绕这个主题展开。而到了赛博格作者这里，由于作者成为了多个意志的共生体，作品也不再是围绕某个一开始计划好的中心主题展开，作品最终表达出来的思想对于任何单独的作者个体来说都是不可控的。对于作品主题性的假定因此就不再成立了。作品最终表达出来的意志，就变成了一场突现叙事（Emergent Narrative）的结果。

既然我们现在能够见到的那些故事创作程序都多少涉及人类的介入，这些程序与其说是机器或者说人工智能作者，不如说是赛博格作者更加恰当。如此一来，故事创作程序就不应当再被看作是一个统筹全局的人类作家的自动化版本，而应当担当一个适合于一个赛博格作者系统的角色。

这个角色应当是什么？Aarseth的答案是，由于计算机的优势在于快速进行大量计算，能够发挥其长处的就是虚拟世界的模拟和大量叙事路线的快速展开。这样一来，我们所想象的成功的文学创作机器，就不再是一个能够自动化地统筹全局的大导演的形象，而应该是一系列到处充满突现叙事可能性的虚拟世界——而人类也会因其丰富和有趣而发自内心地沉浸于其中。

《Cybertext》这本书因为发表于1997年，其讨论范围受当时现存的文本创作程序影响，而没有讨论到今天流行的那些基于深度学习的文本创作机器，比如最近流行的AI Dungeon。

但我们发现，其实基于深度学习的文本创作机器，也仍然能够纳入Aarseth所说的赛博格作者的体系——一个由网络上大量文本构成的文本数据集训练出来的语言模型，可以说是在预处理阶段与每一个这些训练语料的人类作者都产生了合作关系；模型用一种黑盒子式的复杂统计过程将这些语料组织在一起，并在使用时根据用户输入的文本信号（Control Signal）将语料动态进行重组，得到输出；最后的结果可能又有人类来进行筛选。

然而，这些文本创作机器却没有按照Aarseth所设想的，去走虚拟世界模拟和突现叙事的道路，反而完全放弃为语义所构筑出的那个被指称的世界（referred world）建模，将一切算法操作都放在了语言符号本身的层面。复杂统计模型在大数据上的应用，造就了量产文化僵尸的流水线，而不像是充满突现叙事可能性的虚拟世界。

我很好奇Aarseth会如何评价今天的这些基于大数据的文本创作机器。

Aarseth的这个赛博格作者的概念非常有趣。如果我们更进一步将它泛化，摒弃掉对人还是机器的区分，将它笼统地理解为“多个创作意志的共生体”，我们会发现，赛博格作者的例子在我们身边几乎无处不在：

由于剧情文本量太大而有多个剧本作家合作的游戏
经过无数代人改编后流传至今的神话故事
一部编剧、导演和演员都是不同的人的影视剧
使用泼墨法绘制的国画
同人游戏和Mod
玩家上传的模拟人生小剧场视频
跑团日志
MUD游戏日志

等等等等。

这些作品的作者可以是多个人/自然过程/随机过程/算法这些创作主体的任意组合。这些作品的共同特点是，其中每一个单独的作者都不具有对作品的绝对控制权，作品最终展示出来的意志不是任何一个单独作者的创作意图的直接反映。

而正是多个创作意志以具有一定复杂性的方式组合，产生了赛博格作者突现叙事的丰富可能性。文学创作程序只是其中的一个例子。

自动文本创作机器

当机器被迫模仿人类作家

赛博格作家

Subscribe to 菌群反应器