誠懇的提一些關於cbeta官方PDF電子書的後續優化建議

        各位大德好,我發現2019年Q3版本的PDF電子書中封裝了多种字體。檢索、複製、文本重排均會出現問題,這有沒有可能是這些功能和字體之間出現衝突。

        如果仍然不能解決這些問題,那麼希望之後製作PDF電子書時能精心製作,讓電子書更加規範精美,盡量讓書頁內容排版更加規整,段落排版更合理美觀,頁面字號一致,避免兩個頁面之間字號大小不一致。這樣下個版本的PDF電子書即使捨棄檢索功能,也能作為極佳的電子佛典使用。配合另外的epub電子書也能正常進行內容檢索,功能也基本全面了。


     ​    我看到索達吉堪布的“智悲佛網”上也發佈了一些PDF電子佛典。這些PDF佛典能夠正常文本重排,也能正常進行內容檢索,漢文部分也能正常進行複製。文本重排后所有的漢字顯示正常,但是藏文部分卻會成為一堆亂碼。我雖然為cbeta的官方PDF佛典挑了一些細小錯誤,但是我是真的希望cbeta電子佛典能夠更加完善才提出這些建議的。

        希望這些智悲佛網上的電子佛典能夠提供一些參考,對解決問題有一些幫助。

智悲佛網官方網站鏈接

https://zhibeifw.com/

 

這是PDF佛典部分鏈接   

https://zhibeifw.com/sd/yizuo/

 

這是其中一部分佛典的下載鏈接

https://cloud.zhibeifw.com/s/vkrekaty

 

討論區:
cbeta's picture

我們的 PDF 是用 Calibre 去轉檔的,所以也無法特別為 PDF 版做什麼調整,不過目前出了一些狀況,若大家有更好的轉檔工具,也歡迎提供給我們參考。

        您好,我發現CBETA官方PDF電子書不能進行文本重排以及不能正常檢索,這也許是因為用來轉換為PDF的原始文件是用Unicode進行編碼的。我發現2019年Q3版本電子書中附帶的佛經目錄清單TXT文件是用UTF-8進行編碼的,我把它用Adobe acrobat PRO XI轉換為PDF后,不僅可以正常檢索內容,而且進行文本重排也沒有任何問題。也許換用其它的PDF轉換工具,並且咨詢一下對這方面研究比較深的人能解決問題。


還有,這是網絡上的一篇文章,也許可以做一些參考

https://blog.csdn.net/CrownP/article/details/88564967
這個網站上也提供了一個老版本的“Adobe Acrobat 7”​,點擊前面的編號“07”可以進行下載,壓縮包內附帶安裝說明,也許能夠提供參考

http://www.homeinmists.com/

cbeta's picture

在多次測試之後,發現是 Calibre 4.x 版由 epub 轉成 pdf 會產生複製漢文變成亂碼的問題。

最後我們採用了 Calibre 3.48 版來轉換,同時也寫了一篇轉檔操作說明。

http://www.cbeta.org/node/5609

因此,若有人希望自行轉出不同格式的 PDF,就可以參考上述的操作說明自行轉檔了。

我用xsl-fo程序写了一个转换程序,粗看起来似乎还可以。是不是有什么坑还不知道。因为用的人实在是少

Linux版本阅藏程序:

http://cbeta.buddhism.org.hk