您的位置:首頁 >教學 >

錢鍾書數學考15分 出道計算機題 這些人研究了35年

“對新事物的抗拒是歷史上常有的現象

抗拒新事物到頭來的失敗

也是歷史常給人的教訓。”

為了錢鍾書的“數字夢”

《中國新聞周刊》記者/鮑安琪

發于2019.11.18總第924期《中國新聞周刊》

在因涉嫌“貪污罪”取保候審的五年中,欒貴明常常想起錢鍾書1985年夏給他的那封信。

在信中,錢鍾書告誡他,項目做好了,很多人會高興,也有很多人會生氣,他有可能成為眾矢之的。錢鍾書還要他十年之后再來看這封信。

出事時,時間剛好將近十年。

這個項目即“中國古典文獻數據庫”,現在叫“中國古典數字工程”。從1984年錢鍾書布置這個任務,35年過去,欒貴明和稍后加入的田奕只干了這一件事,一直到今天。

由于資金缺乏,公司不斷往西搬遷。現在的“掃葉”公司位于北京西南五環外房山區一處名為“掃葉園”的平房院落。“掃葉”之名源于一句行內話:校書如掃落葉。

田奕告訴《中國新聞周刊》,截至目前,已完成從太古時期到北宋之前中國古典文獻的錄入梳理工作,共計十億多字。預計再過5年,可完成1912年之前主要文獻典籍的數字化,工程總計15億字。

忘年交

1964年9月一個周二的上午,在單位6號樓一樓大書庫最后一排書架旁,欒貴明第一次見到了錢鍾書。

當時,欒貴明剛從北京大學中文系古典文獻專業畢業,分配到中國科學院哲學社會科學部(簡稱“學部”,為中國社科院前身)文學研究所。出于大學時代萌生的對錢鍾書的景仰,他一來便到處打聽哪里可以見到錢鍾書,得到錢鍾書來單位都會到書庫看書的“情報”。

欒貴明記得,錢鍾書當時看的是一部不引人注意的書《叢書集成》。他過去打招呼,簡要地做了自我介紹。令他意外的是,錢對他的家世并不陌生。

欒貴明是世家子弟,外公家曾有很多產業,包括頗有名氣的北京雙合盛啤酒廠,他上高中時就開始協助外婆打理家產。錢鍾書認識他的舅舅、研究茅盾的王積賢。

從那時起,欒貴明常幫錢鍾書做一些瑣事,如從所里借書、帶信、取工資、報銷醫藥費等,兩人逐漸成了忘年交。

1972年3月,錢鍾書從河南“五七”干校回京后,開始寫作《管錐編》。他對書籍的需求量很大,欒貴明用鋼管和鋼板焊了一輛車,為他運書。

曾擔任社科院副秘書長的楊潤時說,當時京城世家子弟中有一批“玩家”,欒貴明身上就有這種“玩家”風范。他愛搗鼓半導體收音機、電視機等,雖然外觀簡陋,卻可聽可看;還自學成才,成為學部第一個持有國家頒發的證件的放映員。漸漸地,在上世紀六七十年代的學部,許多人都知道欒貴明是個愛“玩”且能“玩”出一些名堂的人。

數學15分的人出的計算機題

1982年,在胡喬木的力邀下,錢鍾書出任社科院副院長,但條件是不分管行政工作,也不要辦公室和工作人員。

當時,錢鍾書已開始《宋詩紀事》的研究。這是一部清代人整理的宋代詩集,他計劃在其作者厲鶚的基礎上修正補足,形成《宋詩紀事補正》。在他的指導下,欒貴明利用下班后的時間,進行具體編輯與整理。

做了兩年,欒貴明發現,這項工作需要做宋代3800多位詩人的補遺工作,工程量巨大。比如在一處發現了某一句詩,就要人工拿這句詩到這位作者的作品集里去查。作品少還好辦,像陸游有一萬多首詩,查找起來就很困難。錢鍾書對工作的進展很不滿意,時常說做得“太單薄”。欒貴明提出從所里增加兩個人過來一起做,但被拒絕。

1984年的一天,他去錢鍾書家時,錢鍾書告訴他,給他找了一個“好工具”:計算機。他問,什么叫計算機?錢鍾書把女兒錢瑗叫了過來,錢瑗開玩笑地說:“什么機密都透露給別人。”

原來,錢瑗不久前才從英國做訪問學者回國,有次向錢鍾書提起,英國學者在用計算機輔助研究莎士比亞戲劇。這讓錢鍾書想到,中國也可以用計算機來研究古籍。

他讓欒貴明放下手邊的工作,先研究計算機,還當場拿出8000元交給他。當時錢鍾書每月工資為365元,楊絳的工資稍少一些。

欒貴明說,錢鍾書跟他說的事,在他那里從不過夜。他從錢鍾書位于北京西三環南沙溝的家出來,就騎車沿著三環一路尋找哪里有計算機賣。

也巧了,騎到東三環,在人民日報社附近的路口,他看到保定計算機廠正在舉辦一個小規模的計算機展銷會,就進去細問了半天,并留下了聯系方式。當晚他到家時,廠家的推銷人員已經坐在他家樓梯上等著了。

雙方達成協議,計算機可以先免費試用。那時還沒有PC機,這是一臺蘋果機,硬盤只有10兆,售價五六萬元,就放在他家里。

欒貴明向錢鍾書報告借到了計算機,并把8000元還了回去。他把計算機說明書給錢鍾書看,錢鍾書嫌中文翻譯得不好,直接讀的英文原文。

欒貴明回憶,社科院很多人都有過疑惑,說錢先生一個數學只考15分的人怎么可能想出一個關于計算機的項目?欒貴明說,真正做過文獻整理的人,太知道計算機是可以幫助他的。

1984年至1985年間,欒貴明自己買書,自學了計算機basic語言。因為錢鍾書說,不會德文怎么研究馬克思主義,不會文言文怎么研究中國古典文化?計算機技術如同工具,不能找別人幫忙,必須自己學。

在他對計算機漸漸摸索出門道后,錢鍾書布置他,用計算機錄入《論語》。

欒貴明告訴《中國新聞周刊》,一開始并不知道計算機可以用來做《宋詩紀事補正》,后來隨著錄入文獻的增多,才有了條件做這件事,這是一個逐步認識的過程。但利用計算機研究中國古典文獻,有一些文獻是一定要錄入的,《論語》就是其一。

搞電腦的一個大問題是燒錢。存儲代碼的軟盤一張30元,性能不穩,很容易損壞。電費也成為每月的大額支出。欒貴明一個月工資60元,時常感到經濟上的壓力。

雖然他都是利用晚上時間在家做,但文學所的同事漸漸聽說了,有時會拜托他查找《論語》的資料。

1985年夏天,時任文學所所長的劉再復和黨委書記朱寨一同來到欒貴明家中,一再勸說他把這個項目轉到所里,作為所里的計算機室。欒貴明給錢鍾書打電話,錢鍾書讓他答應了吧,還開玩笑說:“你背叛了我。”

隔了一天,欒貴明在院里收到錢鍾書給他的信。這就是那封讓他十年后再重看的信。

信中寫道:“昨得電話,我為你欣興,我當初對你說此事若你一個人干,能力不夠,拼了命亦難如愿。此事若出官,一定不讓你帶頭,只讓你鑲邊,你得把你辛苦得來的一些積累交公。果然不出我所料,因為你的牌子不夠領銜,而這樁買賣又是大好招牌,你和我一樣只是親自動手的小工,不是組織人事、支配財務、發號運籌的大帥。我已修行多年,可以掛名,你還得當苦力呢。”

錢鍾書親自為這個項目命名為“中國古典文獻數據庫”。

所里把社科院大樓一層的一個房間撥給欒貴明,作為計算機室的辦公用房。從保定計算機廠借的電腦,也由所里支付購買,并添了設備。

計算機室開始招兵買馬。第一批14人,幾乎都是高中畢業生,并非社科院正式職工,開始時連合同工都算不上,只是“學員”。

整個計算機室沒有一個計算機專業畢業生,都是欒貴明帶頭研究,計算機室的人跟著學。欒貴明幾乎吃住在計算機室,曾經在計算機前連續工作40多個小時,以致手足僵直,最后只能被人從椅子上抬下來,放到床上休息。

錢鍾書還親自為欒貴明挑選了一位助手。

1986年初春的一個上午,他和楊絳一起來到計算機室,讓欒貴明把新招的學員找來,與他們分別談話。當晚,他向欒貴明描述了一個學員的外貌和衣著特征。這個學員就是田奕。

田奕高中畢業時由于生病,沒有參加成高考,在社會上打零工。當時《光明日報》辦了一個十天左右的計算機培訓班,她出于興趣前去聽課。欒貴明也被請來在這個班上授課,她從而得知了社科院的計算機室在招人的消息。

田奕向《中國新聞周刊》回憶,當天錢鍾書一身英國紳士打扮,戴一條白色圍巾。時至今日,她仍然清楚地記得兩件事。一是握手時,錢鍾書的手像面條一樣軟。她后來常去錢鍾書家,與錢鍾書和楊絳漸漸熟悉,楊絳開玩笑說這是由于錢鍾書“十指不沾陽春水”。

二是錢鍾書的皮鞋特別好看,是棕色的,上面還有花紋,泛著皮革自帶的光澤。田奕后來知道這是錢瑗在意大利給他買的。錢鍾書逝世后,楊絳特意把這雙皮鞋贈給她留作紀念。

談話時,楊絳沒有說話,都是錢鍾書在問問題。談話內容田奕不記得了,只記得很快就談完了。

錢鍾書告訴欒貴明的是:“聰明的孩子容易不可靠,可靠的孩子容易不聰明,這兩個優點她都有,她會幫咱們把這個項目完成的。”

“你們是裁縫,不是外科醫生”

錢鍾書不肯擔任任何單位的“顧問”,唯獨計算機室例外。他戲稱,計算機室的年輕人是他的“孩兒們”。

他來院里開會,常常先到計算機室落腳。每年過生日收到很多蛋糕和鮮花,都叫出租車送來計算機室,或讓學生去他家取,鮮花插瓶,蛋糕分吃掉。

研究規范、規劃和方案,都是錢鍾書親自制訂的。

80年代中期,使用繁體字是一個敏感的事情,但錢鍾書要求他們尊重著作原貌,必須使用繁體字。

先前錄入《論語》時,欒貴明使用的是計算機自帶的輸入法,缺字嚴重。他們搜羅了近十個中文輸入系統的資料,請錢鍾書選定,錢鍾書敲定了臺灣的朱邦復創制的“倉頡輸入法”。

這種輸入法以字首筆作為分類,字身作為補充,可以隨時添加新字。錢鍾書給了欒貴明一萬余元,購買了倉頡輸入法硬卡。到現在,“中國古典數字工程”一直在使用這種輸入法。

在倉頡輸入法的框架下,他們研制出了有近3萬漢字并具有繁體字自動生成功能的“全漢字庫”。

錢鍾書要求,數據庫僅收錄中華民國建立之前的古籍。他提出,打破經史子集的傳統分類,用作者統攬作品,這在古籍整理領域是一種創舉。

他還親自指定了錄入所使用的文獻底本。他認為,受時代局限和政治考量的影響,乾隆年間完成的文淵閣本《四庫全書》有很多不準確和遺漏之處,因此要避免采用。在《全唐詩》版本的選擇上,他指定使用乾隆年間江南詩局的原刊本。

在《史記》版本的選擇上,則使用張元濟編的百衲本中的宋本。錢鍾書認為這些版本收錄全面,也更準確,同時能避免侵中華書局的權。而當時社會上普遍還沒有版權意識,《中華人民共和國著作權法》要到1990年才首次頒布。

慎用現代漢語中的標點符號,正文和后人的注釋不得混淆,也是一大規范。錢鍾書告誡研究小組:“你們是裁縫,只能是量體裁衣,不能做外科醫生。”

1986年,欒貴明和團隊返工重新錄入了一遍《論語》。第一部使用電腦編制的《論語數據庫》于1987年由人民日報出版社正式出版,錢鍾書題寫了書名。

錢鍾書為欒貴明修改該書“前言”時,寫下一段評論:“有了紙墨筆硯‘文房四寶’,準還有人用刀筆和竹簡;有了汽車、飛機、電報電話,也還有不惜體力和時間的保守者。對新事物的抗拒是歷史上常有的現象,抗拒新事物到頭來的失敗也是歷史常給人的教訓。”

根據先“文”(《論語》)、后“詩”、再“經”的順序,錢鍾書給研究小組布置的第二項任務是《全唐詩》。

比起《論語》,《全唐詩》可謂浩如煙海,需要增加設備和錄入人員,這些都需要經費。欒貴明找所里,所里解決不了;找院里,院里也不能立項。他一遍遍跑院科研局,局長王煥宇下決心冒一次風險,同意從院科研經費中撥出10萬元,以借款方式給欒貴明,并約定了還款時間。

研究小組花了近三年時間,錄入了27冊《全唐詩》的全部正文、異文、補遺和注文,經11次校對,于1988年發布了《全唐詩數據庫》。

通過運算,《全唐詩數據庫》判定全唐詩共有53035首、作者3276位,訂正了4萬多首和兩千多人的傳統說法。

1988年10月的一天,欒貴明到院辦公室找當時分管人事的社科院副秘書長兼新聞發言人楊潤時,請求以新聞發布會形式

最新動態
相關文章
天津理工部分學生感染諾如病毒
教育部:學校不得公布考試成績和排名 ...
學校上線“在校午餐” 鄭州二七區中小...
駐馬店市第二小學有多個班級老師把學生...
考研最后沖刺階段要注意啥?多地啟動202...
2020屆高校畢業生規模預計將達到874萬人...
一肖中特准马会香港