大般若经的编号问题

大般若经的链接是:http://cbetaonline.dila.edu.tw/zh/T0220_001

在光盘中的文件编号是类似:T05n0220_191.xml

但是在github上的文件编号却是:T05n0220a.xml , T06n0220b.xml

而XML文件中的都是这种:xml:id="T06n0220b",

这就导致了不一致.

究竟是带不带后面的小字母呢?

因为从ab经文的角度来说,大般若经也没有不同的版本问题,使用ab小字母就比较奇怪了

因为我一直是按照xml:id来寻找文件的.这个编号和文件名保持一致还是挺重要的.

 

討論區:
cbeta的头像

您好:

Github 上的是我們公開的版本。

而光碟中已處理的各卷,只是提供光碟程式使用,未來極可能會依不同的程式而有不同的改變,並非是固定的格式。

至於大般若經的 abc 代碼,當初是為了處理大般若經 16 會的檢索功能,讓使用者能指定單獨檢索不同的各會而設計的。

我們也曾考慮過要合併成一個大檔,但因為諸事繁多,這類牽扯較大的修改,要等其他專案有空檔時,才能進一步評估處理。

主要疑问在于,究竟那个是最后会使用到的方式?

因为你们的在线版和github版不一致.

比如大吉祥天女经的url是http://cbetaonline.dila.edu.tw/zh/T1252a_001

可见有一个a.

可是大般若经的在线版的url http://cbetaonline.dila.edu.tw/zh/T0220_001 里面没有a.

如果按照github作为标准的话,那么在线版应该显示成 http://cbetaonline.dila.edu.tw/zh/T0220a_001

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

cbeta的头像

您好:

大般若經算是一個特例了,因為它是一個橫跨三冊的大經,所以在十多年前,為了搜尋與切割成小檔比較好處理的原因,所以有了現在看到的切成十六會的樣子。

當時並沒有想到要把 XML 公開,或是認為公開大概也不會有太多人去用。而呈現上,自然是以使用者好懂的方式,這二者之間,就是內部用程式來處理,把難懂的 XML 變成好懂的呈現。

我們已有多次想將大般若經合併成大檔,但牽涉的範圍不小,不管是內部使用或公開的程式,有相關的部份都要修改,所以一直找不到適當的時機來統一處理。

未來會改成如何,現在我們也不敢說,我個人是傾向只分成三個檔案, 即 T05, T06, T07 各一個檔,但實際最後的結果,則要到時才會知道了。而且或許未來的人依然會繼續修改調整下去,這也不是不可能的。 :)

只要文件名能和xml:id的内容保持一致就行啊

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk

 

cbeta的头像

目前 Github 上面公開的版本就是文件名和 xml:id 一致。