CB缺字查詢Unicode的一個疑問

現在CB上的缺字開放網友幫忙查詢Unicode
http://dict.cbeta.org/word/help_find.php

看了之後也想幫忙查字回饋一下CBETA
但後學有一個疑問
印象中CB缺字的Access資料庫中
每個缺字似乎都有《今昔文字鏡》的M碼
(不是很確定,只看到一個螢幕擷取)
而《今昔文字鏡》已經推出了Unicode版,
可以查詢Unicode
這代表《今昔文字鏡》內部一定有個轉譯器
可以連結M碼跟統一碼
只要取得這項資料
是否就可將CB缺字資料庫中待查unicode的缺字
很快地用程式去查到Unicode
再用人工比對一下Unicode字(Win8 新細明體)與大正藏紙本上的字(影像檔)
這樣是不是比較快?
還是我漏掉什麼地方沒考慮到?

CBETA愛用者 合十

討論區:
cbeta的头像

您好:

謝謝你提供的資訊,我們會再參考文字鏡的資料。

我們目前大約有三萬字的缺字(以Big5的標準來看),而有M碼的只有七千多一點,那些是早期才有查詢M碼,後來的缺字都沒有M碼的紀錄了。

chen的头像

謝謝解疑。那還是真的要一個字一個字人工去查。

 

Unicode 7.0已經推出了,但沒有新增漢字。聽說日本研究大正藏的SAT組織,已經向統一碼組織提出了一個提案(IRGN1858),這個提案預計在未來的「擴充F區」中,新增六千多個大正藏當中的罕用字,如果屆時提案通過的話,CBETA大正藏當中絕大部份的組合字,都可以找到對應的電腦字,這在促成佛經的數位化上,應是美事一樁。
 

CBETA愛用者 合十

☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸

                三世諸佛共說此心 
     
         吾有一軀佛 世人皆不識
         不塑亦不裝 不雕亦不刻
         無一塊泥土 無一點彩色
         工畫畫不成 賊偷偷不得
         體相本自然 清淨常皎潔
         雖然是一軀 分身千百億

               偈出 聖彌勒菩薩

☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸☸