CBETA 校訂作業簡介

標籤:

編案:2020-05-05,原發佈於微信公眾號「CBETA 電子佛典集成」題作 「CBETA修订电子佛典文献之作业简介」,2024-03-12 更新。

一、背景

實體書是一種傳統文獻,人們運用竹片、石板、紙張等材料作為知識及資訊的載體,隨著時代的進步,書籍的材料越來越輕薄、便於攜帶。刊行之後,如果有修訂,則需要再版印行。相較之下,電子書是一種現代文獻,不但可以同時供人和機器「讀」,而且更突破了實體書在物理上的限制。藉由網路分散管理,發布後仍然可以讓不同地方的人共同編輯,快速更新資料。【注1

有鑑於電子文獻的價值與發展趨勢,CBETA 從 1998 年著手提供電子佛典集成的服務。我們將傳統紙本藏經與佛教典籍數位化,建立了已獲版權、可非營利流通的「電子藏經閣」(閱藏系統):桌機版CBReader 、線上版 CBETA Online ,並且定期校訂與更新版本。

校訂,即校勘訂正。校勘(又稱校讎或讎校)是文獻處理的基本功。對此工作,陳垣歸納出「校法四例」(或校勘四法):對校法、本校法、他校法、理校法。即,核對書籍文字,摘誤修正,以提供文意較完整的或接近原稿的本子。 

CBETA 是海納百川的數位服務平台,不受紙本印刷的限制。我們根據「校法四例」來校訂文獻。然而,限於各方資源,CBETA 無法以專精於版本校勘者自居,更何況漢譯佛典的校勘常常需要對讀梵本、巴利本、藏譯本等等。因此,歡迎大家提供更好的版本校勘建議。

底下簡介 CBETA 校訂電子佛典文獻的作業情況,敬請指教。
 

二、CBETA 工作簡介

1998 年成立至今,我們有四大工作內容:

(1)收錄佛典文獻
(2)校訂佛典文獻(即:修訂用字、添加新式標點)
(3)發展應用技術
(4)募集財務資源

我們以(1)「收錄佛典文獻」為主要目標,其次是(2)「校訂佛典文獻」。今以《大正藏》簡說 CBETA 的收錄與校訂流程:

(1)先按《大正藏》原書目錄、用字、標點錄入電子資料;
(2)重新架構更好的目錄結構,添加新式標點;
(3)根據《大正藏》對讀《高麗藏》所得的差異、使用者的問題回報等等,按照「校勘四法」考證用字;
(4)記錄校訂細節,建立與公佈「校訂考證資料庫」。

截至 2023 年底,我們數位化了 2.3 億字以上的佛典文獻。多年來,我們不但逐卷編錄累增的佛典文獻清單,也正在逐筆消化如山的校訂任務。如果使用者回報的校訂問題數量比較少、屬於不難查證的,我們大多在下一季更新資料;如果單次提報幾十、幾百筆,或者屬於較難考證的校訂問題,我們則需要較長的作業時間。
 

三、佛典文獻的校訂與記錄

CBETA 參考哪些建議來校訂文獻呢?主要有幾個來源:

(1)使用者回報:使用者透過寫信或線上版的「問題回報」反饋
(2)官網討論區:使用者在官網註冊帳號,然後貼文建議修訂
(3)學術出版品:學術論文與專書的論證
(4)講座的影音:演講、教學、研討會的考證發表
(5)CBETA 作業:我們從作業中所得,例如《大正藏》對比《高麗藏》所得的異文

我們重視目前所掌握的其他藏經版本。對於有疑義之處,盡量覆核《大正藏》所採用「底本」(如《高麗藏》再雕本)。舉個例子,引用《高僧傳》第 11 卷會看到以下的「修訂註解」:

《高僧傳》卷11:「家內忽有異香,及光明照壁,迄[A4]旦乃息。」
(CBETA 2023.Q4, T50, no. 2059, p. 397a9-10)
[A4] 旦【CB】【麗-CB】,且【大】(cf. K32n1074_p0871b04)
CBETA 校訂考證資料庫

「修訂註解」表明這筆資料出自 2023 年第四季(Q4)的版本。校注 [A4] 的【CB】、【麗】、【大】是版本略符,細節如下:

a.「且【大】」表示「且」是《大正藏》的原書用字。
b.「旦【CB】【麗-CB】」表示「旦」是 CBETA 選擇的校訂用字,並且也是 CBETA 核查的《高麗藏》用字。
c.「cf. K32n1074_p0871b04」表示這一筆校訂的修訂依據出自《高麗藏》(K),具體的位置在 K32n1074_p0871b04(請參考「CBETA 行首資訊」)。
d. 「CBETA 校訂考證資料庫」提供更多的經證、文證。這是我們近期建置的資料庫,公佈原本屬於內部作業的資訊。

image

圖:十三世紀《高麗藏》刊刻收錄了《高僧傳》,今見第十一卷第八張第四行作「旦」。(出自:東國大學「佛教記錄文化遺產檔案」,<https://kabc.dongguk.edu/viewer/view?dataId=ABC_IT_K1074_T_011&imgId=032_0871_b>,2024-03-12)。

這些「修訂註解」的內容不但可供核查,對於許多使用者來說,也是進一步閱讀的方向。截至 2023 年底,我們總共校訂了 34 萬筆用字。以最新發布的 2023.Q4 資料為例,用字、標點修訂一共涉及 928 卷 15,700 行(請參見 https://cbetaonline.dila.edu.tw/doc/zh/changelog/2023/2023Q4.pdf)。

 

四、為佛典文獻添加標點

CBETA 從 2004 年開始進行佛典文獻新式標點。桌機版與線上版都可以設定是否顯示標點符號。

盡善盡美的標點是困難的。然而,比起簡單斷句的《大正藏》或完全沒標點的《高麗藏》,我們提供八成可信的新式標點文獻,以期降低閱讀障礙。如今,人工標識的新式標點文獻主要集中在《大正藏》第 1 至 42 冊,一部分《嘉興藏》經文也以「古籍酷」的 AI 標點呈現。

我們歡迎讀者提問討論,也將修訂記錄公諸於「CBETA 校訂考證資料庫」。另一方面,我們也很樂於看到學者利用 CBETA 新式標點的佛典文獻,進一步整理出更專業的點校本、精校本。如果這些著作願意授權給 CBETA,我們可以一起造福更多的人。

 

五、文字版本選擇

桌機版閱藏系統 CBReader 提供「原書版」與「CBETA 版」兩種文獻。線上版 CBETA Online 則提供「CBETA 版」文獻。大致而言,「原書版」《大正藏》幾乎等同於紙本《大正藏》的用字與校勘資訊;「CBETA 版」則顯示 CBETA 校訂後的用字與校訂註解。使用者可以根據自身的需求來選擇閱讀的文字版本。

以上述引文為例。如果閱讀《高僧傳》第 11 卷的時候選擇了「原書版」,文字顯示與《大正藏》一致,作「且」:

「迄乃息。」

如果選擇的是「CBETA版」,則顯示校注標記 [A4],以及根據《高麗藏》校訂的「旦」:

「迄[A4]旦乃息。」

在 2016 年發布的桌機版(即 CBReader 2016)和更早的版本中,使用者只能夠針對 CBETA 校訂版進行全文檢索。自 2018 年,我們推出了 CBReader 2X 桌機版,既能夠檢索「原書版」,也可以檢索「CBETA 版」,實現了「雙重檢索檔」計畫!
 

六、結語

CBETA 在這 26 年以少量資金與人力達到現在的成果,殊為不易。我們也存在許多不足,需要與各界相互合作。

使用者可能一生鑽研所興趣的某些經典,而 CBETA 數位化作業面對的是古往今來的所有藏經資料。雖然使用者與 CBETA 都在整理佛典,但是彼此採取的方法及需求各有偏重。因此,二者是相互協作的理想對象。

我們期待您提供人力、財力,甚至技術方面的支持,以彌補 CBETA 的不足。CBETA 也將盡己所能,讓新時代的數位藏經更加完善!

注1】釋惠敏〈資訊科技在佛教文獻運用的觀念與實例 : 多價文獻模式、電子佛典、數位博物館、傳記時空資訊系 統、中國佛教寺廟志數位典藏、Science 2.0〉《臺北大學中文學報》13,2013年,pp. 1-16。