六、簡單標記

CBETA 經文數位化工作流程

六、 簡單標記

(一)簡單標記 I

標記,是針對已完成校對文件之進一步編輯作業。在進入正式 XML 標記之前,輸校組需對經文段落加上適當標記,成為「簡單標記版」的經文電子檔。

這一套簡單標記,目的是把經文當中「經號 N」、「經卷 Jj」、「品 D」、「著者 A」、「譯者 Y」、「序 X」、「偈頌 Ss」、「咒語 Z」、「附文 W」、「段落 P」、「其它標題 Q」、「行中小段落 P」…等,以簡單符號標示區分出來,方便電腦認識經文各段落之不同屬性,並能加以進一步運用。簡單標記主要是在行首資訊後的三欄「_##」標記欄位置中標示出來(圖十三),或標記於經文中的「行首」、「行中」、「行尾」。

 

圖十三、第一 階段簡單標記產出之純文字檔

圖十三、第一 階段簡單標記產出之純文字檔

 

(二)簡單標記 II

第二階段簡單標記之重點工作為「架構經文標題層次」(圖十四)。此自訂標記可讓電腦認識整篇經文之章節架構,如:

 

圖十四、經文之標題層次架構

圖十四、經文之標題層次架構