cb:tt标签的语序都是错乱的

《大日經義釋》卷4:「畢竟不傾動耶謂即以此(a) 字門故有如是力阿 用也第六句是憶念持義猶如比丘作羯磨法令眾僧一心和合同共受持今此真言亦爾用(a) 字加阿 持竟請一切如來憶念本誓故同共受持也第七句是本性淨義此[5]即轉釋前句何故諸佛同心[6]念持由本性淨故若法入(a) 字門即是從本以來無動無阿 垢十方三世諸佛」(CBETA, X23, no. 438, p. 314c7-13 // R36, p. 605b10-16 // Z 1:36, p. 303b10-16)[5]:即[王* ]作是[6]:念一作加

 

阿字放在悉曇字的大后面。

我感觉这个问题是在于cb:tt没有一个上级元素造成的。

討論區:

cb:tt标签的子标签cb:t的属性xml:lang也比较混乱。

没仔细统计过,但是看到的就有sa、sa-x-rj、sa-Sidd、zh等多种。

先从显示效果看,应该需要的显示效果,如果是悉曇体,

我觉得应该是分两种。一种是单个的悉曇字母,应该附在相应的字后面。比如阿字。后面紧挨着一个悉曇字母。

如果是咒语一类,比较好的显示效果是一行汉字,一行悉曇字。这样对应起来要好看点。

不知道是不是有汉语拼音,如果是汉音拼音,就应该在汉字上面采取注音的方式来显示。

为了作出这些效果,最好的办法应该是在cb:tt标签上级,还有一个标签,将cb:tt标签放在里面作为子标签。

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

cbeta's 的頭像

您好:

您大概是看到 cbetaonline 的網頁,此處果然有點問題,我會幫你反應給他們。

如果您在 cbetaonline頁面選取文字,就可以看到選單中有一個 "問題回報",也可以直接將問題直接反應給工程師。

在 CBReader 上則沒有這個問題。

至於 xml:lang 屬性的確有不少種,但那不是混亂,而是根據實際的情況所安排的。

在顯示方面,我們也是根據大正藏原書,有的是逐字梵漢對應,有的是隔行對應,在原書模式下,我們都儘量根據書本的格式來處理。

看到了最新的关于lang的标准是:BCP 47。位置在:https://www.iana.org/assignments/language-subtag-registry/language-subta...

 

涉及到梵语的条目:

%%
Type: language
Subtag: sa
Description: Sanskrit
Added: 2005-10-16
%%
Type: variant
Subtag: bauddha
Description: Buddhist Hybrid Sanskrit
Added: 2010-07-28
Prefix: sa
%%
Type: variant
Subtag: itihasa
Description: Epic Sanskrit
Added: 2010-07-28
Prefix: sa
%%
Type: variant
Subtag: laukika
Description: Classical Sanskrit
Added: 2010-07-28
Prefix: sa
%%
Type: variant
Subtag: vaidika
Description: Vedic Sanskrit
Added: 2010-07-28
Prefix: sa
Comments: The most ancient dialect of Sanskrit used in verse and prose
  composed until about the 4th century B.C.E.
%%
Type: script
Subtag: Sidd
Description: Siddham
Description: Siddhaṃ
Description: Siddhamātṛkā
Added: 2013-12-02
%%

 

简单的统计了一下目前使用的xml:lang,一共有下面这些:

en
pi
sa
sa-Sidd
sa-x-rj
san-tr
x-unknown
zh
zh-x-yy
 
这里比较让人费解的几个标签是
 
san-tr 只出现在T54n2133A_001.xml,梵语千字文。似乎使用的是梵语的拉丁转写,那么应该是sa-Latn吧?
 
x-unknown出现在多处,都使用在cb:t标签里面,也都是拉丁字母,含义不明。
 
 
zh,现在的标准是宏语言了,可能更合适的是zh-Hant或者lzh-Hant吧?
 
zh-x-yy出现在三个文件中:T54n2132_001.xml,T54n2133B_001.xml,T54n2135_001.xml。
文件头中有说明,含义为:Chinese Yinyi(音譯)。但是不见其他文件也使用这种用法。
 
 
关于单独的sa标签。基本多是拉丁形式的,那么写成sa-Latn更好一些吧?

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

cbeta's 的頭像

謝謝您提供的資訊,未來我們在整理這個範圍時,會再參考 TEI 最新的規範以及您提供的資料。

目前理解有限,

几个建议:

附加在TEI标签上,添加一个xml:lang标签。一般应该是lzh-Hant.

国语文言文: lzh-Hant

国语白话文: cmn-Hant  或者zh-Hant

这样,如果来源是简体中文的,也可以加入,只要改成cmn-Hans即可或者zh-Hans。

如果是梵语。

悉曇体:sa-Sidd

天城体:sa-Deva

拉丁体: sa-Latn

兰扎体目前标准里面没找到,可能还是原来的形式:sa-x-rj

 

 

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk