无米之炊
作为同二十一世纪的中国一同成长起来的人,在“中国人学习英语”这条路上,我同太多太多人一样,因为缺乏教育,走了太多弯路;因为市场浮躁,听了太多谎言。而如今,当我有了独立思考的能力之后,眼里看到的,却是还是数不尽的弯路跟谎言。
中国人一出生就要背负许多悲哀,不知道怎么学习英语,算是其中一条。
在义务教育普及的时代,多数中国人都学过英语,然而几乎每个人自始至终,都未曾有机会和勇气,踏入真正的英文世界半步。从小到大,我们一直被要求写让中国人评价的英文作文,读中国人写的英文文章,听中国人读的听力材料,背中国人编排的英语词表。在高考的框架下,仿佛学习英语的终极目的,就是为了获得在中文世界里的体面,而非获得一把通往英文世界的钥匙,与随之而来的,更高的能动性。而从高考框架刚刚走过来的人,在本是理性生长跟培养能动性的年纪里,马上又被备考CET,TOFEL,GRE的大潮裹胁着,阅读大量令人生厌的文本,一遍遍啃完厚厚的词书,再次失去了享受自由学习语言的快乐的机会。
正像这世上既没有官方的TOFEL词汇表,也没有官方的GRE词汇表,学的人多起来后,市场上居然也有了词汇表;精通一门语言的过程,同样没人规定必须经受汲汲於功利的痛苦,可是大家,最终却还是都一致选择了痛苦。这在我看来,是因为视野之内,除了痛苦,没有出路。
中国人在我心中的形象,一直是隐忍而目光长远的,愿意坚强地蛰伏十年久,换得他日金榜名。然而这种目光长远,换来的却是欣然地迎难而上,进入一轮又一轮痛苦的循环,而不是努力寻找新的办法把自己从痛苦的循环中解放出来。长年累月隐忍的结果是,往往痛苦,反而带给我们崇高感,令我们体会灵魂的深沉。我们很容易在一条业已确定的道路上,沉湎于披荆斩棘,克服挫折的快感,却十分避讳冒险去发现另一条能化解困难的出路;好像深刻理解事物并创造出路,就是钻营取巧,属于懦夫一般。如此一来,学习英语的中国人,便少了从痛苦中寻找出路的痛感和动机;而没了动机,是很难等到出路的。
学语言就是学艺术
语言和钢琴一样,属于高雅的艺术,又同计算机类似,属于复杂的工具。语言的复杂性,决定了语言学习的过程,像是一片深不见底的理论深海,而二十一世纪的人类还是在海边捡拾贝壳那个孩子。有关二语习得(second language acquisition)的理论,自上世纪以来层出不穷,但神经生物学底层理论的空缺,让这些理论的得出更多基于观察归纳,大多流于“假设”(Input Hypothesis, Interaction Hypothesis, Output Hypothesis, Noticing Hypothesis), “模型”(Monitor Model, Competition Model),而非可以复现的“原理”。虽然二语习得理论的根基不稳,但在我看来,想找到中国人学习英语的出路,远远还不到研究并广泛传播二语习得理论的阶段。中国人现在要做的是无米之炊,首先要解决的不是不会做菜,而是米饭不够。
所谓米饭不够,指的是每个中国人手中既没有足够的英文文本以供学习,又没有够好的工具去管理手上的英文文本和词汇。对于这一点,我感触颇深。“想要在可选文本和管理工具方面解放国人”,成为了我编写 Vocabulary Picker 和 Vocabulary Manager 的直接动机。
在我看来,中国人学习英语的普遍需求,已经被教育市场绑架的太深,其中又以学习英语的文本,特为尤甚。从某种程度上讲,中国人学习英语的文本,被整个英语培训生态,垄断的十分彻底。在我的观察里,中国人往往并没有选择英语文本的自主权,或者说,“中国人没有机会读自己想读的英文”。跟我同样成长在内陆省份的那批人,从小就活在《新概念英语》之类的经典文本的阴影里,从来没有权利决定自己要读什么层次的英文,读什么话题的英文,读谁说的英文。对大多数中国人来讲,能够接触到的英文文本是极为有限的。特别是在中文世界的深处,每一篇英文文章都像是一张粮票,代表着一段时间的未来内 可以学到的所有英语词汇和表达。而这一张张粮票,则常常是英语培训机构选编成的一件件商品。中国人只有购买商品,才有英文可读。而没有英文可读的中国人,一旦萌生出学英文的念头,便会像着了急的企业诉诸咨询机构一般,立即委身于有商业口碑的培训机构,把英文文本的选择权利,又再度移交给了培训机构。如此一般中国人每对培训机构的依赖多一寸,整个英语培训的商业生态,对中国人英语文本选择权的掌控就会多一尺,而中国人离培养起自主选择英文文本的意识和能力就会远一丈。
英文文本在我心中对于解放中国人的意义如此重要,是因为它在我看来对语言学习有一极大的利好,那就是为每一个新的语言现象,立即提供有意义的语境,而有意义的语境反过来,又仿佛可以替代讲求定义准确的词典条目,成为语言现象最生动的释义。通过英文文本学习英文,似乎有着纲举目张,提纲挈领的功效,而这又好像是为什么几乎所有的英语教材,都以一系列课文为核心进行编排。虽然在二语习得理论中,“有意义的输入和输出”是很多理论频繁提起的,然而有意义的语境之于学习新语言现象的作用,对于经常反复学习少量英文文本的中国人来说,却又应该是深有体会的,不至于搬出学者的话语为自己撑腰。
英文文本自带的语境固然有用,然而通过这类文本中的语境来学习语言现象,最困难的莫过于高效的管理这些词汇和语境。文本的出处不一,载体也多样,管理起来自然繁琐。以书为例,原版书固然是很好的文学语境,对于学习文学词汇肯定大有裨益,然而其中的语境跟词汇却星汉灿烂似地散落遍地;若想仔细的管理起来,非得花足时间,下足功夫不可。
而在管理英文文本中出现的词汇,以及其他语言现象的工具方面,我见到中国人使用最多的,还是纸和笔。想用纸笔对词汇进行管理,就得老老实实得摘抄下整个句子,甚至整个段落。这种违和感,就好比见到想吃瓜的人都必须得先种瓜一样;我们想做的是对语言现象及其语境进行管理,而不是摘抄句子。至于出现这种违和现象的原因,我是部分能理解的。因为中国人能接触到的大部分英文文本都以纸为载体。纸上的信息并非是数字化的,自然无法用程序进行管理,只能靠双手去实现包含录入在内的所有管理逻辑。而至于为什么中国人可选的英文文本大都印在纸上,我想大抵还是因为那些文本,无一例外都是看重著作权的商品。
在众多语言现象中,以英文词汇为最繁。在我看来,文本中的英文词汇,天生就是种十分整齐的数据结构,躺在一套又一套的正则表达式里。而程序三大基本控制结构中的循环结构,又好像天生是为批量处理这类整齐的数据结构而生。这意味着生词倘若以数字化的形式呈现,便十分适合交由程序进行批量的管理。而想管理起我们在阅读英文文本中遇到的生词语境,最基本地,只需要管理单词本身、单词所在的句子、句子所在的段落,以及指向原文的链接,至多再加上收录生词的时间。有了这些最基本的原始数据,程序便成了可以“一生二,二生三,三生万物”的现代魔法,让人专注于对语言现象灵活而多样的管理,从而彻底从字母级的摘抄工作中解放出来。
既要给中国人带来选择英文文本上自由,又要让文本以数字化的形式呈现。这两项诉求,让我本能的想到了趋向无穷的英文互联网,想到了人们在浏览器上进行阅读的场景,想到了小部分人使用软件 **Anki [3]**管理单词的情状。
工具
英文互联网对于学习英语的中国人是一个巨大的语言宝库,哪怕只是其中可以畅通浏览的冰山一角,都可以极大丰富中国人可选择的英文文本。浏览器本身提供的丰富API,则让摘取词汇及其语境成为可能。而Anki[4] 背靠庞大的插件生态,又提供了大量类现成的,类似于“匹配词义”,“科学复习”的,一批能灵活管理单词的强大工具。这三者在一起,让我看到一条拦腰断开的路,能把学习英语的中国人从“文本选择”和“语境管理”的困境中解放出来;而连起这条断开的解放路,只需要一人之力。
这条断开的通路在我看来少了两个关键的组成部分,一个是能从英文网页中摘取词汇和语境的浏览器插件,也就是后来的 Vocabulary Picker[5],另一个是在导入 Anki[6] 前,能进行初步编辑和管理,比如删除词汇,恢复时态的桌面应用,也就是后来的 Vocabulary Manager[7]。
在技术方面,由于两个开源软件都力求在有限的开发时间内惠及更多的英语学习者,因而在技术选型上都以平台兼容性为要。其中Vocabulary Picker 选择了受众最广,插件丰富的 chrome浏览器 作为运行平台,Vocabulary Manager 选择了跨平台 (Win, Mac, Linux ) 的 Electron 作为运行环境。而程序的界面语言则优先以英文开发,目的是为了令软件可以同时惠及中国以外的英语学习者。由于我起初对 JavaScript十分陌生,再加上 JavaScript 的工具生态十分复杂,整个开发过程比预期中长了许多,从学习 JavaScript, ES6 Syntax, 和 Chrome API 到设计并完成 Vocabulary Picker,耗时大概1周;从学习 React, TypeScript, 和 Electron 到陆陆续续设计完成并发行 Vocabulary Manager,耗时大概两周。
在程序的实现方面,Vocabulary Picker 摘取词汇语境的逻辑,基于正则表达式和HTML的排版这类永恒的结构,因此不会随着前端技术的发展而过时,而且很容易在未来提供摘取日语,法语等其他语言的支持。而Vocabulary Manager 在实现的过程中,力图规范用户的管理行为,比如在导出词汇到Anki时,只能以时间范围筛选条目,目的是从源头避免出现管理混乱。
额外令人欣喜的,是Vocabulary Picker与Chrome侧的插件生态兼容良好,允许用户充分在摘取词汇前,利用Chrome插件,优化文本排版(如 Clearly[8]),高亮低频词汇(如 Words Discoverer[9])。
最终整个流程的各个环节如下:
Chrome –> Vocabulary Picker –> Vocabulary Manager –> Anki
Chrome侧的其他插件,负责对网页针对阅读进行优化;Vocabulary Picker 负责从网页上摘录词汇及其语境,并将数据批量导出;Vocabulary Manager 则负责导入 Vocabulary Picker导出 的文件,并允许用户对导入的词汇进行简单的增查删改,最终批量导出成 Anki 可以读取的文件;最后 Anki 可以依赖各类插件,对收集起来的词汇进行复杂的词汇管理,譬如为单词匹配 mdx 词典内的释义,为用户依照艾宾浩斯遗忘曲线安排复习。
通过Anki 制作的抽认卡
特别的,开源的电子词典 GoldenDict[10] 对整套工作流程有着画龙点睛的作用 。一来是因为 GoldenDict[11] 允许使用自己喜欢的 mdx 词典,方便了用户选择自己信赖的优质词典,二来是因为 GoldenDict[12] 的查词快捷键非常高效,选中词汇后,Ctrl + 两次C,便可发起一次查询,因而让 Vocabulary Manager 不必额外管理词典释义。
如此一来,从英文互联网上文本,到开源的电子词典,整个流程除了Chrome外 完全依赖于免费的开源软件,却给了用户趋向无穷的语言材料,和强大到足以管理上万语言现象及其语境的管理工具。
后记
在我亲自对上述流程进行测试时,计算机带给我的彻底解放,令我我十分感慨。但与此同时我也产生了些许疑惑:在浏览器技术早已成熟的当下,在Anki早已成熟的今天,为什么中国罕见 类似 Vocabulary Picker, Vocabulary Manager ,仅需一人之力就可完成的语言学习工具出现?为什么直到计算机性能早已充沛的现在,学习英语的中国学生还未被从纸笔中解放?为什么包括各大学校在内的大部分的英语教育机构,仍在印发纸质的文章和纸质的词汇表?为什么包括我曾经就读的高中在内的许多学校,还在拒绝学生携带电脑?
我想,或许是因为绝大多数中国人还没有萌生出,完全使用计算机学习英语的理想。
从小和纸笔一同长大的中国人,似乎很难摆脱对纸质阅读迷信一般的追捧,和对墨水质感坚定不移的信仰;就好像纸笔不只是处理信息的工具,而是文化气息浓重的文房四宝,体现着自身的文化修养;而使用纸笔学习承载异域文化的西洋文字,对文化人来讲,更好像是天经地义一般。然而时过境迁,沧海桑田,当代的人要解决规模庞大的当代问题,而当代的知识分子,也绝对做不回只需琴棋书画相伴的传统文人。
在我的眼里,计算机像极了二十世纪的铜器,二十一世纪的火。我认为在当代的中国,每个会思考的个体,都有责任借助新兴的工具,首先解放自身的潜能,然后再去解决前辈一度难以解决的问题,留给后人至少可步的后尘。在中国人学习英语的问题上,我想不单是我个人,应该还有成千上万的人跟我一样能看到一套完全基于计算机的,从听说,到读写,免费、自由、去中心化、合法、强大,且能够持续惠及国民全体的理想方案。这套理想方案,能通过中文互联网,把无限的语料没有门槛地送进千家万户,并充分发挥程序的长处,把人从批量学习管理语汇的苦海中解脱出来。虽然这套理想方案,反过来也需要成千上万有责任感的国民和学校,齐力平地起高楼;但最重要的是,它的的确确是肉眼可见的乌托邦。