2005年10月號 CBETA 發行

CBETA首頁 電子報首頁 +電子報信箱



編者的話

各位親愛的讀者,您好:

這個月我們進行了卍續藏 X01~X04 的處理,若一切順利,過幾天即可上網供大家閱讀及下載。或許各位會奇怪,為什麼 CBETA 一開始不由 X01 著手呢?底下我們會略為介紹卍續藏的處理因緣。

另一個好消息,CBETA 完成了一個查詢漢字的工具程式,此程式可以協助大家快速尋找 CBETA 現有電子佛典中的用字資料,其中最難能可貴的,是前幾個月在諸多義工菩薩的協助下,讓許多缺字都能快速聯結到教育部異體字字典,讓這些過去不易查詢的生澀文字,可以立刻找到其意義,這對我們理解佛典無疑是有極大的幫助。

此程式目前已邀請參與的義工菩薩們搶鮮使用,並請他們做最後的測試,正式下載的網址,就請各位隨時注意 CBETA 的最新訊息了。

時序已入冬,加上流感的威脅亦不可輕忽,希望大家好好照顧自己的身體,祝大家皆能平安健康,萬事如意!

電子報編輯 敬上


各組最新進度

◎輸校組

  • 卍續藏常錯字檢查:X03-05
  • 卍續藏簡單標記Ⅰ:X02-04
  • 卍續藏簡單標記Ⅱ:X01-04
  • 卍續藏句讀:none
  • 網路校對發出:B31
  • 網路校對完成:B12
  • 大藏經補編輸入:B20、B28-29、B32-33。(杭)
  • 法寶總目錄看圖校對:none
  • 確定下一波輸入經目

◎研發組

  • 簡單標記版轉XML版: X01, X02, X03
  • 待進行:XML P5 格式經文及 Java 跨平台界面

◎標記組

  • 大正藏:
  1. 修訂經文用字,主要有:
    • 「大正藏<-->高麗藏」比對差異修訂:T30n1579《瑜伽師地論》約 217 筆
    • 楊大德提出的修訂:T54 等
    • 其他用字修訂:[迫>追]求、[純>鈍]根、饕[餐>餮] 等
  2. 「大正<->高麗」行首對照取出。
  3. 重校T20n1061悉曇字。
  • 卍續藏:
  1. 過去一個月已完成:
    • X01, X02, X03 簡單標記檢測完成。
    • X01, X02, X03 XML 標記作業完成。
    • 卍續藏句讀作業--X55 n0919, n0920 經文標記修訂及插入句讀比對作業。
  2. 進行中: X54、X55校勘條目輸入。
  3. 預計進行: X04、X05 XML 標記作業。

◎文字組

  • 「翻譯名相同義詞庫」完成。
  • 「漢字工具」V1.0 完成。

◎網資組

  • 整理藏經目錄, 查詢待輸入經目
  • 處理中華藏,卍正藏目錄.
  • 寫高麗藏 KI 轉 KW 程式
  • 寫修訂格式自動轉 XML 程式
  • 寫處理音切格式經文的程式
  • 寫捐款處理系統
  • 處理百字查詢傳回的資料
  • 由教育部異體字字典光碟取出系統字的字碼
  • 撰寫漢字工具程式



一步一腳印 -- CBETA 經驗分享

■ 藏經電子化之處理現況與未來規劃

在卍新纂續藏陸續完成 X54~X88 冊之後,目前已開始進行 X01~X53 冊的進度。

為什麼會有這種處理順序?我們首先回顧 CBETA 成立之初,第一階段的目標是完成大正藏 T01~T55 及 T85 共 56 冊的經文,而同一時間日本 SAT 也在進行 T56~T84 的輸入工作,如今這二部份皆已完成,這正是佛典電子化的一個好的開始。

在 CBETA 第二個五年計畫中,我們是決定以卍新纂續藏為處理目標。然而早期因受限於經費的關係,所以先從常用的禪宗部開始,這也是大正藏比例較少的部份。

很感謝諸多善緣的促成,後來有了新加坡方面的固定贊助後,我們即著手規劃完整的卍新纂續藏數位化工作,至今已完成後半部 X54~X88冊,現即開始從第一冊進行,擬於明年底前完成所有卍新纂續藏的數位化作業。

相信很多人和我們一樣,一定很好奇在看似浩瀚無盡的佛典中,到底實際數量為何?我們曾初步收集並分析資料,以入藏經目來說,粗略估計在大正藏及卍續藏皆完成之後,尚有約近 600 部的典籍還有待輸入。這近 600 部佛典在嘉興藏佔了最大的份量,其餘分散在各大藏經之中,這都是有待未來要搜尋及數位化的藏經,讓我們共同期盼電子佛典集成的來臨。

隨著電子佛典數量的累積,CBETA 的重心也逐漸由量的提升而轉型成質的強化,在未來有許多的可能在等著我們,希望諸位法友們能持續給我們支持鼓勵,以及不斷地給予指教與建議,一同打造更好的閱藏環境。

■ 各種資料庫的建置

除了持續將藏經電子化,CBETA 也有著愈來愈多的資料庫陸續建置中,這是我們朝著質的提升前進中很重要的一環,這也是未來要和諸位法友分享的資訊。

這個月完成了大正藏VS高麗藏的行首對照表,這個工程在過去電子報有介紹過,如今已經建置完成,日後利用此資料,就可以快速查詢大正藏與高麗藏的相關位置,未來在經文的引用複製上,期望也能同時看到大正藏與高麗藏的出處。

另一個和高麗藏相關的資料庫,是有關六冊高麗藏影印本的問題。在去年10月的電子報中,我們有報導關於《高麗大藏經》影印本有六冊與韓國「高麗大藏經研究所」公布高麗藏電子檔次序不同,如今我們也完成了二個版本的對照,利用此資料,即可快速查詢二者的關係。

佛典缺字是另一個資料庫,這是 CBETA 成立以來就一直在維護的資料庫,但近日終於有了一個簡便使用的查詢工具,也就是 CBETA 漢字工具,程式在近日中即會推出。

除了文字之外,「詞」也是漢文重要的單位,我們最近也初步整理出了「翻譯名相同義詞庫」,藉著同義詞,我們可以在經文中查到更多相關的資料,在「香光尼眾佛學院圖館」的網頁中,亦有類似但功能更強的檢索--「佛教經典主題詞全文檢索資料庫」,我們也希望將此功能結合在 CBReader 之中。

各位對提升電子佛典應用價值有任何的建議,也歡迎給我們指導。



回覆讀者來函

讀者來函:

參考
大正新脩大藏經 第三十九冊 No.
1799《首楞嚴義疏注經》CBETA 電子佛典 V1.15 普及版
乾隆大藏經

大正新脩大藏經 第十九冊 No.
945《大佛頂如來密因修證了義諸菩薩萬行首楞嚴經》
CBETA 電子佛典 V1.18 普及版
大佛頂如來密因修證了義諸菩薩萬行首楞嚴經卷第七
下列之刺應為剌

T19n0945_p0139a28(00)齱@ 摩訶迦羅耶(二十五) 地唎般刺那伽囉(二十六) 毘
T19n0945_p0139b14(00)齱@(五十七) 薩憐捺囉刺闍耶(五十八) 跢他伽多耶(五十九)
T19n0945_p0139b18(00)齱@婆伽婆帝(六十七) 刺怛那雞都囉闍耶(六十八) 跢他
T19n0945_p0139c24(00)齱@烏[合*牛](三十八) 唎瑟揭拏(三十九) 般刺舍悉多(四十) 薩
T19n0945_p0140c02(00)齱@那囉刺迦(七十六) 波囉婆悉普吒(七十七) 毘迦薩怛

CBETA 回覆:

您舉出T19n0945「楞嚴咒」五個有問題的「刺」字,出現在該經的附文以宋元明為底本的地方。

經查詢大正藏,大正藏原文皆為「刺」,但在 參考同一經T19n0945 的 麗本經文 (麗本經文皆作「 囉 」,「 囉 」對應的悉曇字通常是( ra ),音跟「剌」接近), 以及對照T39n1799《首楞嚴義疏注經》的「 剌 」字,故您所提的刺字皆應修訂為剌字。

此外,T39n1799 這一筆「刺」字也要修訂為「剌」:

T39n1799_p0918c12 帝 (七十五) 阿悉多那囉 [刺> 剌 ] 迦 (七十六) 波囉婆悉普吒 (七十

以上供您參考,很感謝您的來函指教。


讀者來函:

經閱 :

千手千眼觀世音菩薩廣大圓滿無礙大悲心陀羅尼經

唐西天竺沙門伽梵達摩譯

T20n1060_p0107a09(09)讔{命終時十方諸佛皆來授手。欲生何等佛上。隨願皆得往生。

上句中 ……欲生何等佛上…… 是否應為……欲生何等佛土……之誤?

CBETA 回覆:

關於來函提及之 "上" 字,大正藏原文即是如此。

T20n1060_p0107a09屭荓瞻漶C欲生何等佛[1]上。隨願皆得往生。復

在此處有一個校勘

[1] 上=土?

表示在某一個版本的確是使用 "土" 字。

參考上述校勘及以下相關經文資料

T20n1064_p0115c24齯j悲章句者。臨命終時。十方諸佛皆來授手。
T20n1064_p0115c25爣生何等佛土。隨願皆得往生。復白佛言。世


很清楚可以得知 "佛土" 才是合理的用字,故 CBETA 經文修訂如下:

T20n1060_p0107a09屭荓瞻漶C欲生何等佛[01][上>土]。隨願皆得往生。復


讀者來函:

CBETA 地藏菩薩本願經 版本
http://www.cbeta.org/result/normal/T13/0412_002.htm

T13n0412_p0788a21(06)欓O人眷屬假因業故墮惡趣者。計當劫數。
T13n0412_p0788a22(06)攭荋筐k女兄弟姊妹。塑畫地藏形像瞻禮功德。
T13n0412_p0788a23(05)矕M即解脫生人天中受勝妙樂者。
T13n0412_p0788a24(08)孎Y承斯功德轉增聖因。受無量樂。

另一版本

是人眷屬,假因業故,墮惡趣者,計當劫數,承斯男女兄弟姊妹塑畫地藏形像瞻禮功德,尋即解脫,生人天中,受勝妙樂。是人眷屬,如有福力,已生人天,受勝妙樂者,即承斯功德,轉增聖因,受無量樂。

不同之處 : 受勝妙樂。是人眷屬,如有福力,
如不是cbeta?版本漏三句﹐就是另一版本多三句。
因這段cbeta版本唸不大順﹐所以我想請問﹐這分別是OCR
作業錯誤造成﹐還是cbeta版
原文就是這樣。
多謝

CBETA 回覆:

我們查詢CBETA的底本大正藏,大正藏原文就是這樣。

就我的比較,差異在另一版本多這四句——「受勝妙樂。是人眷屬,如有福力,已生人天」。

本經「麗本」無。大正藏採用「明本」,沒有任何校勘本。
在「明版嘉興大藏經」有本經,但它是「原書全缺,由 黃[薛/木]藏 補入」;在補入的經文中,也就是「嘉興藏第1冊 p0251b09-11」,它的文字與大正藏相同。

又,「乾隆大藏經」,就我手上的版本(傳正有限公司),在第62冊 p0679b14-p0680a02,用字也同上述的 嘉興藏、大正藏。

也就是我們目前查到的幾個版本,皆與大正藏及 CBETA 原文相同。

在不改文字情況下,改一個圈點可以幫助解讀,作這樣:

T13n0412_p0788a20曭鴗腄C聞名見形瞻禮供養。是人眷屬假因
T13n0412_p0788a21禶~故墮惡趣者。計當劫數。承斯男女兄弟
T13n0412_p0788a22攭n妹。塑畫地藏形像瞻禮功德。尋即解脫生
T13n0412_p0788a23齯H天中。受勝妙樂者。即承斯功德轉增聖
T13n0412_p0788a24囍]。受無量樂。是人更能三七日中一心瞻禮

上面的關鍵字句,新式標點如下,會更好懂:

是人眷屬,假因業故墮惡趣者計當劫數,承斯男女兄弟
姊妹塑畫地藏形像瞻禮功德,尋即解脫生人天中;
受勝妙樂者,即承斯功德轉增聖因,受無量樂。

也就是說——

已墮惡趣者,生人天中(受勝妙樂);(已)受(人天)勝妙樂者,轉增受無量樂。

以上供您參考。


讀者來函:

No. 26 中阿含經 (卷42) T01, p0695b

復次。諸賢。比丘離於喜欲。捨無求遊。正念正智而身覺樂。
謂聖所說.聖所捨.念.樂住. 室 。得第三禪成就遊。

室 => 空

以上的錯誤在中阿含經中發生多次,請查察糾正!

CBETA 回覆:

查詢相關文字,的確都出現在中阿含,共找到 21 筆,其中有室字有十筆有校勘,依校勘紀錄,【宋】【元】【明】共有三筆作「定」,有七筆作「空」。

查詢了大正藏的底本高麗藏,其原文亦做「室」。

在參考底下三段經文及佛光阿含藏,我們會將這些室字修訂成空。

《中阿含經》卷1:「復次。聖弟子離於喜欲。捨無求遊。正念正智而身覺樂。謂聖所說.聖所捨.念.樂住.空。得第三禪成就遊。」(CBETA, T01, no. 26, p. 422, b17-19)

《中阿含經》卷1:「復次。聖弟子離於喜欲。捨無求遊。正念正智而身覺樂。謂聖所說.聖所捨.念.樂住.空。逮第三禪成就遊。是謂聖弟子逮第三增上心。易不難得。」(CBETA, T01, no. 26, p. 423, b10-13)

《中阿含經》卷1:「如是。聖弟子離於喜欲。捨無求遊。正念正智而身覺樂。謂聖所說.聖所捨.念.樂住.空。逮第三禪成就遊。樂住無乏。安隱快樂。自致涅槃也。」(CBETA, T01, no. 26, p. 424, a3-6)

感謝您的來函指教。


讀者來函:

末學於前日,頌讀貴會出版HtmlHelp之 中品般若 摩訶般若波羅蜜經 時,發現一些文字上的勘誤 在翻查過文字版的經典之後,想提供與您

資訊如下

  76 一念品

No. 223 摩訶般若波羅蜜經 (卷23) T08, p0386c
原文:不得淨佛國土而淨淨國土。
經文:不得淨佛國土而淨佛國土。

No. 223 摩訶般若波羅蜜經 (卷23) T08, p0387a
原文:所修持戒戒忍辱精進禪定不遠離般若波羅蜜。
經文:所修持戒忍辱精進禪定不遠離般若波羅蜜。

以上兩項

CBETA 回覆:

在查詢之後發現 CBETA 經文與大正藏原文相同。
但再查詢大正藏之底本高麗藏之後,證實大正藏用字明顯有誤,
故我們修訂成與高麗藏相同:

T08n0223_p0386c20齯T昧而行空無相無作三昧。不得眾生而
T08n0223_p0386c21囍迄N眾生。不得[19]淨佛國土而淨[淨>佛]國土。
T08n0223_p0386c22齯ㄠo諸佛法而得阿耨多羅三藐三菩提。

T08n0223_p0387a03礸陔躁窄F薩所有布施。不遠離般若波羅蜜。
T08n0223_p0387a04攭珥蚴蠽揳戒>]忍辱精進禪定不遠離般若波
T08n0223_p0387a05躞劂e。四禪四無量心四無色定修四念處乃

非常感謝您的來函指教



網站導覽

在處理 CBETA 漢字工具的過程中,有不少相關的網站值得參考,茲列如下:

中央研究院 資訊科學研究所 文獻處理實驗室 (http://www.sinica.edu.tw/~cdp/):

漢字工具的組字式模糊查詢技巧即是利用中研院資科所提出的字根序,再配合 CBETA 的演算法才得以完成的。

教育部異體字字典 (http://140.111.1.40/):

在查詢罕見字的意義時,這個網站提供了極大的幫助,是個值得充份利用的網站。

教育部重編國語辭典修訂本 (http://140.111.34.46/dict/)

這是查詢一般字詞的好地方。

全字庫 CNS 11643 (http://www.cns11643.gov.tw/web/index.jsp)
漢字庫 ISO 10646 (http://www.cns11643.gov.tw/seeker/chinese/search.jsp)

此二者皆是查詢漢字的好地方。

Unicode Home Page (http://www.unicode.org)

這裡可以查詢 Unicode 的諸多資料,Unicode 漢字可以在此查詢:http://www.unicode.org/charts/unihan.html



交流園地
  歡迎建議與指教!來函請寄至這裡

本會電子報之文章著作權均歸原著作者所有,轉載時請全文照登,謝謝。
website: http://www.cbeta.org/      email: service@cbeta.org
11246 台北市北投區光明路276號4樓
TEL:(02)28932133 FAX:(02)28930043