四

字体:16 +-

因为“黑箱”难题，我和莫妮卡关于机器翻译的研究一个学期不到就碰了壁。

起初一切还很顺利。我们分析了二十世纪的几种商业翻译软件，这些软件的原理大多很简单，连我也能理解。无非是先将一个句子拆解成一个个词组，再根据辞典把这些词组翻成目标语言，然后根据目标语言的句法规则将词组重新组合，就得到了翻译的结果。这种方法对于简单的句子尚且可行，但用它翻译一些习语时，总是免不了要闹笑话。因为目标语言中可能并没有类似的表述。

对此，一些翻译软件开发者想了一些对策，比如说为专有名词、习语和固定的表达方式建立语料库，软件进行翻译时会先检索语料库中是否有匹配的内容。这样的做法的确让翻译的准确度和流畅性都有所提高，但是，词义消歧仍是一个难题。特别是当一个词在源语言和目标语言中并不等价的时候，就会引出很多麻烦来。

一个最常被举到的例子是英语的“sheep”和法语的“mouton”。在英语里，“sheep”指的是绵羊，而法语的“mouton”不仅可以指“绵羊”，也可以指“羊肉”（英语中的mutton），两个词并不等价。为了检验一个翻译软件是否能有效地消除歧义，我会设计一个包含类似“mouton”这样的单词的法语句子，让软件生成英语的译文。那些采用最传统原理的软件几乎只会把“mouton”翻成“sheep”，而并不会考虑语义是否恰当。所以，有开发者设计了一套统计学方法来消除歧义。比较常见的方法是：先制作两种语言的平行语料库，然后进行统计，从而发现“mouton”和草地、牧羊犬或羊毛等词一起出现时，一般要翻译成“sheep”；而与表示吃或烹饪的动词出现在一起时，则要翻译成“mutton”。

之后莫妮卡又分析了一些二十一世纪初的机器翻译软件。有些软件使用了大量的统计学方法，通过隐变量和对数线性模型来实现翻译（这些术语都是莫妮卡告诉我的，我也不确定自己的表述是否准确）。这部分的工作我几乎没有参与。她试图教会我线性代数的基本知识，我也努力了一番，不过最后还是放弃了。有一天，她把伦敦大学的一位讲师请到了会议室，向她请教了一些高维空间中的线性不可分问题。而我能做的，只是站在一边泡红茶罢了。

我们在一个学期之内测试了2013年以前所有重要的翻译软件。因为莫妮卡也懂一点法语，所以着重测试的是英法互译的部分。她总能很清晰地解释为什么这些软件在面对一些句子时，能或不能派上用场。然而，真正棘手的是在那以后被开发的软件，它们几乎都采用了深度学习的技术。和以往一样，我们做了一些英法互译的测试，记录并分析翻译的结果。然而，莫妮卡却发现我们唯一能做的就是分析结果，所有的过程都是在隐藏层完成的。解释具体的翻译机制，显然已经超出了她的知识范围。

“我现在能确定，某类神经网络结构比另外一些更有效，能提高翻译的精准度。引入了注意力机制之后，能降低梯度消失的风险。但是，我无法解释翻译工作是怎样在隐藏层里完成的。这些翻译软件对于我们来说，只是一个个‘黑箱’。”

“抱歉，我不太明白。”

“没关系，我也不明白。”坐在我对面的莫妮卡摇了摇头，“而且这还只是二三十年前流行的深度学习。后来苏黎世联邦理工学院的一个团队，设计了一套马里亚纳大学学习的算法，能让人工智能根据需要实时修改自己的神经网络，以往能实现可视化的神经网络模型，现在也都变成了隐藏层，而很多具体的运算更是在隐藏层中的隐藏层里完成的。最新的机器翻译软件都采用了这套机制。据说能极大地提高精准度，还能彻底解决梯度消失的难题，而代价也不过是完全牺牲了可解释性。我没有办法分析它，任何人都没有办法。”

“这也就意味着……”

“我们可能要换个课题了。”她说，“对不起，朱迪，都怪我低估了这个课题的难度，害得你和我一起浪费了这么多时间。”

“我也学到了很多东西。比如说简单的句法理论和语义学的初级知识，当然，还知道了这个世界上有种名叫线性代数的学科，而Matrix(6)一词在子宫之外还有别的意思。这些知识就算换一个课题应该也能派上用场。”

之后，我们用了一个小时左右的时间讨论未来该研究些什么。结论大概是，她的强项在计算机技术，而我的强项在历史语言学，我们应该在这两者之间找个连接点。于是我提议说，或许我们可以运用计算机科学来构拟古代语言。对于这个提议，莫妮卡不置可否，说出口之后我也感到有些欠妥。这的确是个很有挑战性的课题，也能发挥我们各自的长处，但它似乎没有什么应用价值。但是，或许会有哪个电影或游戏需要让角色讲几句卢维语或瑟罗尼亚语，谁知道呢……

就在这个时候，小会议室的门被粗暴地推开了，走进来了一个看起来和我们同龄的女生。

她有一头略显暗淡的金色短发和一张轮廓鲜明的脸。她穿着一件灰色的帽衫和一条紧身牛仔裤，帽衫正中间有个红色的字母“A”，看来她和设计这件衣服的人都没有读过霍桑。那个女生又向前走了几步，我才看清楚她眼睛的颜色—灰色之中有一点点蓝，就像英格兰随处可见的天空一样。

“这里是语言学小组吗？”她问，又回过头去，像是想要确认一下贴在门上的那张纸，然而门已经自动关上了。“我应该没找错地方吧？”

“你没找错。”莫妮卡站了起来，“找我们有什么事情吗？”

“能不能让我加入你们？我受不了机器学习小组的那群人了。”

“他们做了什么？”

莫妮卡示意她坐下，她却仍站在原处。

“问题不在于他们做了什么，而在于想做什么。我真不敢相信，他们竟然想开发一个能自动证明所有图论问题的人工智能。这简直太可笑了，就像到了十九世纪末还有人想造个永动机一样。”她的语速很快，“我敢赌五千英镑，他们肯定没听说过希尔伯特计划(7)。”

“我可不准备跟你赌，因为我也这么认为。”莫妮卡微笑着说，“我们该怎么称呼你？”

“艾玛·索弗罗尼茨基。”她说，“叫我艾玛就可以了。”

“你有一个很显眼的姓氏。”

就在那一年，三一学院数学系的索弗罗尼茨基教授因为解决了某个数论难题而被册封为勋爵。当时媒体进行了铺天盖地的报道，所以即便是我这种古典文法学校的学生也听说过他。

“机器学习小组的人也问我，尼古拉·索弗罗尼茨基是不是我父亲。”她走向莫妮卡旁边的椅子，两个人一起坐了下来。“可惜不是，我父亲只是个普通的医生。”

“但这的确是个在英国很罕见的姓氏。”

“这倒也是。除了我家和尼古拉伯父一家，我还没遇到过别的姓索弗罗尼茨基的人呢。”

“索弗罗尼茨基爵士是你伯父？”

“是啊，”她轻描淡写地说，“但你们千万不要误会，我虽然是他侄女，但很多想法都跟他不一样。我可不是布尔巴基学派(8)的信徒，也没打算做纯数学研究。所以，我能加入你们吗？”

“我倒是没什么意见。”莫妮卡看向我这边，“朱迪，你觉得呢？”

“我也没什么意见。”我说，“不过，索弗罗尼茨基小姐，我们现在遇到了一些麻烦，可能要换个课题重新做起。”

“那不是正好吗？”几分钟前才刚刚闯入这间会议室的艾玛理直气壮地说，“我来帮大家想个新课题好了。”

听她这么说，莫妮卡在一旁苦笑着摇了摇头。