感觉应该算一个比较典型的问题

 

《一切經音義》卷40:「XXXXXXXXXXXXX」(CBETA, T54, no. 2128, p. 572a21)[A3]:跳【CB】,[跳-兆+花]【大】

 

这里的问题是,在xml文件中,没有用[跳-兆+花],而是使用的跳字。

也就是说。直接使用校勘代替了原文。

 

查了一下这个字。在日文中大概是“雏”的意思。

 

感觉使用校勘代替原文的情况,还是挺多的。

 

更合适的做法是,在xml文件正文(text字段)中。使用异体字标签。

討論區:
ユーザー maha の写真

我們主要是依《教育部異體字字典》來判定異體字。在《教育部異體字字典》中,「跳」的異體字群中並沒有「[跳-兆+花]」。
 
又,此處:
 
《一切經音義》卷40:「XXXXXXXXXXXXX」(CBETA, T54, no. 2128, p. 572a21)[A3]:跳【CB】,[跳-兆+花]【大】
 
CBETA 之所以選用「跳」字,是有依據的。這依據記錄在 XML 標記裡:
 
<note n="0572a2101" resp="CBETA" type="add">跳【CB】,<g ref="#CB11145"/>【大】</note>
<app n="0572a2101">
<lem wit="【CB】" resp="CBETA.maha">跳<note type="cf1">T54n2128_p0649b01</note><note type="cf2">T54n2128_p0796c06</note></lem>
<rdg wit="【大】"><g ref="#CB11145"/></rdg></app>
 
也就是依據:
 
T54n2128_p0649b01
T54n2128_p0796c06
 
剛查了,CB11145 [跳-兆+花] 的對應 Unicode 為「U+2C9B7」,這對我們是新發現。
CBETA Maha 吳寶原 

 

这里的问题不是跳字的校勘问题,问题是在正文中使用了校勘,也就是说,没有把校勘和原文做出区别:

 

上遭老反下詵櫛反說文云齧人<anchor xml:id="nkr_note_add_0572a2101" n="0572a2101"/><anchor xml:             id="beg0572a2101" n="0572a2101"/><anchor xml:id="end0572a2101"/>蟲也並從<g ref="#CB06537">䖵</g>叉卂皆聲也卂音信叉音爪</note>。

 

请看。应该改为:

 

上遭老反下詵櫛反說文云齧人<anchor xml:id="nkr_note_add_0572a2101" n="0572a2101"/><anchor xml:             id="beg0572a2101" n="0572a2101"/><g ref="#CB11145"/><anchor xml:id="end0572a2101"/>蟲也並從<g ref="#CB06537">䖵</g>叉卂皆聲也卂音信叉音爪</note>。

 

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

ユーザー maha の写真

CBETA Maha 吳寶原 

 

是的,  我有疑义的地方,就在于在xml-p5的text中使用了lem用字.  应该在text中使用大正藏本来的用字. 而不应该使用lem用字.这对于保持大正藏的"原来模样"不利.

 

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

ユーザー maha の写真

我們的企圖是整理出一個經過校訂的 CBETA 版本,所以採用校訂過的 lem 內容做為 TEI 本文,CBReader 內定用字也是採用 lem 內容(一般人是不太會去看校註內容的),目的是讓讀者第一時間先看到較合理的文字,至於其他藏經版本的用字(異讀)則以校註型態呈現,以供有興趣研究的人作為參考。

至於「保持大正藏的"原来模样"」,這個呈現上的需求只要程式透過 rdg 標記就可以達到了。

CBETA Maha 吳寶原