1. cbeta使用的方案是使用汉字的code,覆盖了部分汉字的编码。所以在cbeta的windows版本上复制粘帖的时候,会复制粘帖变成中文。而cbeta在线版则使用了图片。cbeta的图片估计是直接从大正藏中扫描所得,所以清晰度比较差。但是cbeta 的windows版因为使用了ttf字体,所以清晰度很高。
但是cbeta的字体有一个还有一个问题,那就是制作的软件似乎有问题,造成不是标准字体格式,
在windows7以上,linux,mac下,都不能直接使用。
网友的解决办法是先转成otf字体,然后再转回来。才可以使用。
2. unicode 7.0引入了悉曇体,使用了U+11580~U+115FF之间的编码,实际用到U+115DD。unicode8.0又有增加。
但是目前只有一种字体可以支持unicode,就是ApDevaSiddham字体。
ApDevaSiddham字体目前应该是支持unicode最好的字体。但是还是不支持叠辅音(conjunct consonants),
梵字llaṃ和kṣa不能很好的显示。但是单辅音和摩多字母则毫无问题。
缺点是字形相比汉字来说,有点太小了,和汉字一起的时候显得太小。
另外,它也存在覆盖了天城体的码表的问题。
3. Muktamsiddham 这个字体和cbeta的所采用的覆盖汉字的方案不同,
使用的是覆盖天城体的码表的技术方式来实现的。
据说从1.2版本之后,G版支持unicode8.0, 但是使用之后发现无效。也许使用方式不对
4. cbeta使用的悉曇字一共有2046个,有个别重复。我尝试全部替换为unicode。发现替换了640个之后剩下的全是叠辅音。
5. 阅读unicode标准,其实有处理叠辅音的方法。按照文档n4294- 3.9的描述,只要使用U+115BF VIRAMA连接辅音即可。但是实际显示还是不行,梵字llaṃ和kṣa都横排分散开来,不是按照悉曇字的规定竖排链接。
我猜测,也许缺乏的只是一个更好的字体而已。甚至也许只要解决U+115BF这一个字符就可以了。但是查了很久,没有得到关于如何使用字体软件处理这种特殊情况的资料
最开始觉得这个东西随手就能完成,因为unicode的悉曇字只有50个。做成woff字体文件,不超过50k大小,在web上显示也很简单,没想到是一个大坑。
RE:有关悉曇体unicode化的总结
很專業。佩服,佩服!請持續關心這個主題,等時機因緣到了,還請協助 CBETA 將悉曇字 unicode 化。
找到了印度系文字等复杂文字的
找到了印度系文字等复杂文字的 Unicode–OpenType 方案,需要先以 Devanagari 这个典型的印度系文字为参考看它的 Unicode Core Spec 章节(Unicode 10.0.0)以及 OpenType 规范(Developing OpenType Fonts for Devanagari Script),然后看 Siddham 的 Unicode Core Spec 章节以及 USE 的规范(Creating and supporting OpenType fonts for the Universal Shaping Engine)。
具体链接:
https://www.microsoft.com/typography/OpenTypeDev/devanagari/intro.htm
https://www.microsoft.com/typography/OpenTypeDev/USE/intro.htm
Linux版本阅藏程序:
http://cbeta.buddhism.org.hk