《妙法蓮華經》卷1〈2 方便品〉和《大方廣佛華嚴經》

《妙法蓮華經》卷1〈2 方便品〉:「佛告舍利弗:「諸佛如來但教化菩薩,諸有所作,常為一事,唯以佛之知見示悟生。」(CBETA 2019.Q2, T09, no. 262, p. 7a29-b1)

 

《大方廣佛華嚴經》卷32〈29 如來相海品〉:「如來有大人相,名覺佛種[11]姓雲,於瑠璃華、金寶蓮華放無量寶正法光明雲,嚴淨一切如來光明,普現一切清淨法界,寶光明無壞解脫,遍入甚深諸法界海,普現無量自在力海。」(CBETA 2019.Q2, T09, no. 278, p. 601c22-26)[11]:姓【大】,性【明】【聖】

 

这个字图片上是衆字。不是眾字。怀疑cbeta把所有的衆字都修改成台湾标准了

CBETA在台灣,不執行台灣字型標準,難道執行大陸標準嗎?此貼完全多餘。

徑山萬壽禪寺·蕭蘇晏

 

我一直认为cbeta所做的,是使用原本佛经的用字字形。而不是搞一套某个地区的标准来修改。否则cbeta根本没有必要搞什么组合字这种东西。直接都按照某个标准改过来就是了

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

maha's picture

此事主要是 CBETA 作業當時,對於「眾」這個擁有許多細微差異的異體字,統一採用當時作業時的 BIG5 「眾」字。

CBETA 是儘量按原書字形來記錄,但像「眾」這種擁有許多細微差異的字,如要仔細計較,那麼數位化的效率肯定會大打折扣。好比大正藏以高麗藏為底本,面對高麗藏這類異體字非常多的雕版藏經,大正藏也是不得不大量採用通用字來統一處理。

CBETA Maha 吳寶原 

 

maha's picture

這是20年前,在台灣BIG5當道時期,各家字體對於「眾」字的各式異體字形。

CBETA Maha 吳寶原 

 

maha's picture

目前 unicode 對於「眾」的相近異體是「眾」、「衆」兩字。如果經文敘述跟該字字形結構有關,我們會視狀況採用「衆」字。

CBETA Maha 吳寶原 

 

cbeta's picture

http://www.cbeta.org/format/rare-rule.php

在此頁下方有份文件

這是當時 Big5 的作業環境下所進行的文字規範,作業的過程我們都有詳細說明,這在當時的時空背景是有其必要的,歡迎有興趣的法友參考。

若有人現在願意站在 CBETA 的成果上,將經文進一步依大藏經原書還原,相信大家也是樂見其成的。

 

鄙人覺得似無必要對電腦端文字一依原書字型,畢竟CBETA所處理的不僅是《大正藏》一部大藏經,而是包括其在內的歷代佛教文獻(除了大藏經,還有衆多非藏經文獻),如此一來,字型之豐富性、多樣化則在必然,而時至今日,即使有Unicode不斷推出新版本,對表意文字進行擴充(SAT一直參與其中。目前已進行到擴展G區,尚未發佈),但也終是無法涵蓋中日韓越四國歷代出現過的全部漢字字符的,更何況,Unicode所發佈的並非字型或字體。進一步説,要想一個或幾個字體包括Unicode已發佈所有的漢字字符更是癡人説夢(且不論字體作者及商家是否願意如此做)。

再者,電子佛典的製作旨在令今日更多人深入經藏,透過電子佛典瞭解佛教教義、歷史等,而非錙銖必較於古人抄寫、刊刻之用字(此處並無意否定佛典用字於文字學等其他學科之研究意義,僅就電子佛典之製作初衷而言),若令大衆計較於此,豈非捨本逐末之舉?

故此,竊以爲在CBETA立場,一方面應及時與SAT展開深入協作,以自身積累的海量數據及豐富經驗,努力推進佛典漢字字符在Unicode中的定義,一方面亦應全面檢討二十餘年來關於電子佛典漢字字型之規範及應用工作,結合兩岸四地政府對於字型之規定文件,製訂出呈現CBETA特色的用字規範。

徑山萬壽禪寺·蕭蘇晏

 
cbeta's picture

認同您的看法。

Unicode 本身在規劃上已經有一些問題,再加上不同字體所呈現的結果也會有所不同,想要完整還原原書字型,一來不太可能,二來也沒有必要。

所以若文字工作者,想要用 CBETA 的基礎進一步深入處理,我們樂見其成,但 CBETA 本身不會進行這類工作。持續修訂文字是會的,但不會把百分之百還原當成目標。

若真想看到原書的字型,直接瀏覽原書圖檔是簡單的解決方法,所以 cbetaonline 網站已有部份經藏有提供原書圖檔對照,大正藏的圖檔應該都有了。

誠如所言,Unicode確實存在著不少先天設計缺陷,目前又沒有更好的解決之道,大家也只能因循舊例了。

比較好奇的是,持續修訂文字,除了明顯訛誤的必要改訂,對於異體字、俗寫字處理,現在所依據的是一般慣例還是某種規範呢?

徑山萬壽禪寺·蕭蘇晏

 
maha's picture

對於異體字、俗寫字處理,現在所依據的是一般慣例還是某種規範呢?

CBETA 目前的原則,基本上是尊重原書異體字、俗寫字的存在,但如果對現代一般人(非專家學者)在字面上容易造成誤解,如「己已巳」、「剌刺」、「且旦」、「釆采」、「間閒」等等,我們在有所發現的情況下會盡量予以區分校訂。而所謂「校訂」,還是會保留原書用字讓讀者選擇閱讀及檢索。

異體字方面,我們主要是依據《教育部異體字字典》;而對於「俗誤字」的資訊,則參斟各大字辭典的意見。

CBETA Maha 吳寶原 

 

感謝解答。大體明白CBETA的做法了。

徑山萬壽禪寺·蕭蘇晏

 

这个regular.doc文件的格式太古老。已经无法打开了

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

maha's picture

不會吧,我用 WORD 2016 可以正常打開。

CBETA Maha 吳寶原