有关悉曇体unicode化的总结

1. cbeta使用的方案是使用汉字的code,覆盖了部分汉字的编码。所以在cbeta的windows版本上复制粘帖的时候,会复制粘帖变成中文。而cbeta在线版则使用了图片。cbeta的图片估计是直接从大正藏中扫描所得,所以清晰度比较差。但是cbeta 的windows版因为使用了ttf字体,所以清晰度很高。

但是cbeta的字体有一个还有一个问题,那就是制作的软件似乎有问题,造成不是标准字体格式,

在windows7以上,linux,mac下,都不能直接使用。

网友的解决办法是先转成otf字体,然后再转回来。才可以使用。

2. unicode 7.0引入了悉曇体,使用了U+11580~U+115FF之间的编码,实际用到U+115DD。unicode8.0又有增加。

但是目前只有一种字体可以支持unicode,就是ApDevaSiddham字体。  

ApDevaSiddham字体目前应该是支持unicode最好的字体。但是还是不支持叠辅音(conjunct consonants),

梵字llaṃ和kṣa不能很好的显示。但是单辅音和摩多字母则毫无问题。

缺点是字形相比汉字来说,有点太小了,和汉字一起的时候显得太小。

另外,它也存在覆盖了天城体的码表的问题。

3. Muktamsiddham 这个字体和cbeta的所采用的覆盖汉字的方案不同,

使用的是覆盖天城体的码表的技术方式来实现的。

据说从1.2版本之后,G版支持unicode8.0,   但是使用之后发现无效。也许使用方式不对

4. cbeta使用的悉曇字一共有2046个,有个别重复。我尝试全部替换为unicode。发现替换了640个之后剩下的全是叠辅音。

5. 阅读unicode标准,其实有处理叠辅音的方法。按照文档n4294- 3.9的描述,只要使用U+115BF VIRAMA连接辅音即可。但是实际显示还是不行,梵字llaṃ和kṣa都横排分散开来,不是按照悉曇字的规定竖排链接。

我猜测,也许缺乏的只是一个更好的字体而已。甚至也许只要解决U+115BF这一个字符就可以了。但是查了很久,没有得到关于如何使用字体软件处理这种特殊情况的资料

最开始觉得这个东西随手就能完成,因为unicode的悉曇字只有50个。做成woff字体文件,不超过50k大小,在web上显示也很简单,没想到是一个大坑。

 

討論區:
maha's picture

很專業。佩服,佩服!請持續關心這個主題,等時機因緣到了,還請協助 CBETA 將悉曇字 unicode 化。

CBETA Maha 吳寶原 

 

找到了印度系文字等复杂文字的 Unicode–OpenType 方案,需要先以 Devanagari 这个典型的印度系文字为参考看它的 Unicode Core Spec 章节(Unicode 10.0.0)以及 OpenType 规范(Developing OpenType Fonts for Devanagari Script),然后看 Siddham 的 Unicode Core Spec 章节以及 USE 的规范(Creating and supporting OpenType fonts for the Universal Shaping Engine)。

具体链接:

https://www.microsoft.com/typography/OpenTypeDev/devanagari/intro.htm

https://www.microsoft.com/typography/OpenTypeDev/USE/intro.htm

 

 

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk