勘误004

《蟻喻經》:「諸苾芻!我時謂彼苾芻言:『其蟻聚者,即是一切眾生五蘊聚身。夜中出煙者,即是眾生起諸尋伺。晝日火然者,即是眾生隨所尋伺起身語業。大龜者,即是五鄣染法。」(CBETA, T01, no. 95, p. 918c17-21)

 

《蟻喻經》:「於晝夜中起諸尋伺,而身語業不善施作,五鄣煩惱之所覆蔽,耽著五欲,增長無明,生我慢心」(CBETA, T01, no. 95, p. 919a2-4)

 

这里面的鄣是地名,不是障碍的障。

討論區:

潘重規提到他在1980年〈敦煌卷子俗寫文字與俗文字之言就〉的論文中指出,敦煌文字的俗寫習慣可歸納成「字形無定、偏旁無定、繁簡無定、行草無定、通假無定、標點無定」等等條例。

古代寫經、抄經也是如此,「鄰、隣」混用,「已、以」不定,「躊躇、踟躕」無別,有些後人認為的「錯別字」,其實是重要的版本、年代、譯者等訊息,不能見到就改。

Yifertw

不知道这个勘误的标准是什么,但是看到不确定的字确实会有很多疑惑。

大陆这边的惯例似乎是不改通假字,但是改意思或者发音明显没有关系的字。

如果阅藏还有这么多奇怪的文字障碍,感觉也挺苦恼的。

但是,我们可以使用choice标签或者char标签来标记出这个字啊。是不是?

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

maha's 的頭像

關於「鄣」字,請參考 http://dict.variants.moe.edu.tw/yitib/frb/frb05181.htm

但是,我们可以使用choice标签或者char标签来标记出这个字啊。是不是?

是的,理論上,我們可以透過標記,把所有冷僻字詞規範成常用字詞。但,佛典文字浩瀚,要下大工夫才行。而且,也要考慮是否值得這樣做。最近我們內部有在討論「同義詞」、「異體字」、「簡繁字」的檢索,我個人認為從檢索角度來下手是一個可以進行的方向。

 

CBETA Maha 吳寶原 

 

查了一下子,没有任何本字和通用字的,在页面只能显示组合字的,一共有17038个字。

 

而这种使用缺字模组的字一共有27820个。

 

想把这些17038个字消灭掉,工作量十分巨大。

 

但是消灭之后,对搜索引擎会非常友好

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk