我國少數民族歷史悠久,許多少數民族在歷史上創(chuàng)制了古民族文字,并以民族文字形成了極其豐富的反映各民族社會歷史發(fā)展情況的文字歷史檔案。研究少數民族文字歷史檔案數字化建設的現狀與對策問題,可更好地發(fā)掘、傳播與利用這一優(yōu)秀的民族歷史文化遺產。
一、少數民族文字歷史檔案數字化建設的現狀
少數民族文字歷史檔案是指建國前少數民族地方政權、土官、個人在其社會歷史發(fā)展過程中以本民族文字直接形成的反映少數民族政治、歷史、經濟、軍事、天文、歷法、醫(yī)藥、教育、文藝、哲學、倫理、宗教和民俗等方面情況,具有保存價值的各種不同形式的歷史記錄。少數民族文字歷史檔案數量豐富、種類繁多,其中較為典型的是滿文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書等檔案材料,按其現存方式可劃分為古籍、文書、石刻(又包括碑刻、摩崖、石經墻、石經片和石經墩等類型)、金文、印章、竹簡、木刻、貝葉、骨文、皮書、布書、瓦書和陶文等?,F今,少數民族文字歷史檔案的數字化建設處于起步階段,現狀如下:
1 .少數民族文字數字化技術多為高校、民族研究所、計算機中心等機構進行開發(fā)。以藏文數字化技術的研究為例。1986年由青海師范大學研究開發(fā)的TCDOS2.0版藏文系統(tǒng)通過了鑒定,這是第一個收入使用的藏文系統(tǒng);中國藏學研究中心和航天部701所于1988年8月推出了藏文文字處理及激光編輯排版印刷系統(tǒng),后與濰坊華光合作開發(fā)出了華光書林藏文排版和激光照排系統(tǒng);中國計算機軟件與技術服務總公司、民族印刷廠、北京大學計算機研究所、中國民族語文翻譯中心聯合研制并推出了北大方正藏文書版系統(tǒng),北大方正1997年推出了基于WIN31的藏文維思彩色印刷系統(tǒng);西南民院計算機研究室開發(fā)了基于DOS平臺的SPDOS漢藏文版操作系統(tǒng)和藏文文字平臺。
2 .北方地區(qū)少數民族文字數字化技術的研究領先于南方地區(qū)。除藏文外,其他少數民族文字數字化技術開發(fā)情況如下:
?。?)蒙古文。內蒙古計算中心開發(fā)出蒙文、漢文、英文操作系統(tǒng),與山東濰坊合作研發(fā)出華光V型蒙文書刊、圖表、報紙激光照版系統(tǒng);內蒙古大學研制出MPS蒙漢混合字處理系統(tǒng);內蒙古大學與北大合作開發(fā)出《北大方正電子出版系統(tǒng)》蒙文版。內蒙古社會科學院蒙文研究所的蘇·蘇雅拉圖研制出基于Windows95的蒙古文處理系統(tǒng)(便攜式計算機)。
?。?)維、哈、柯文。主要有1989年新疆民語委主持開發(fā)的博格達維、哈、柯、漢、英、俄多文種排版系統(tǒng);北大方正及濰坊華光已都研制有維、哈、柯文的排版系統(tǒng);1997年6月新疆開發(fā)的《未來多文種系統(tǒng)VTDOS6.1》。
(3)朝鮮文。如方正朝鮮文書版系統(tǒng)和思維系統(tǒng);華光推出的書林朝鮮文系統(tǒng)。
?。?)錫伯文、滿文。有新疆民語委主持開發(fā)的計算機錫伯文、滿文文字處理和輕印刷系統(tǒng);內蒙古大學等研制的滿文系統(tǒng);遼寧省檔案館和東北大學計算機語言工程研究室共同開發(fā)的滿文操作系統(tǒng)。
(5)彝文。有北大方正和西南民院合作開發(fā)的彝文系統(tǒng)書版軟件;西南民院自行開發(fā)的VCDOS漢彝文雙語平臺和SPDOS漢彝文版漢字操作系統(tǒng),后又推出了Win95彝文文字平臺;由云南省民語委和云大計算中心合作開發(fā)的云南規(guī)范彝文排版系統(tǒng)。
?。?)傣文。北大方正開發(fā)的傣文電子出版系統(tǒng);濰坊華光開發(fā)的傣文電子排版系統(tǒng)。
?。?)壯文。由北大方正研制的在英文基礎上稍加改造后實現的壯文書版系統(tǒng)。
(8)苗文。云南省楚雄州光亞電子研究所研制的苗文排版系統(tǒng)。
3 .檔案系統(tǒng)少數民族文字歷史檔案的數字化管理工作尚未全面開展。現今少數民族地區(qū)許多檔案館(室)都收集珍藏有滿文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書等少數民族文字歷史檔案,這些檔案大多處于手工管理階段,只有少數檔案部門開展了少數民族文字歷史檔案信息的數字化工作,檔案系統(tǒng)尚未開發(fā)出單一或多民族的數字化管理系統(tǒng)軟件;在現有檔案管理軟件中,也沒能開發(fā)出少數民族文字歷史檔案的管理功能,這就極大地限制了少數民族文字歷史檔案的利用效率與范圍。
二、少數民族文字歷史檔案數字化建設的方法
?。ㄒ唬┮M與采用少數民族文字數字化的技術與科研成果
如許多高校、民族研究所、計算機中心等機構在少數民族文字處理技術方面開發(fā)出了藏文、蒙文、維文、朝鮮文、錫伯文、滿文、彝文、傣文、壯文、苗文等。在數據庫建立方面,蒙古文和藏文取得了顯著的成績。1987年完成中世紀蒙古語文數據庫;1993年在完成100萬詞綴(現代蒙古語文數據庫)的基礎上,又完成了《500萬詞級現代蒙古語文數據庫》;完成了《元朝秘史》拉丁標注、漢文標注和漢文旁注本的檢索統(tǒng)計系統(tǒng),在《現代蒙古語詞頻統(tǒng)計》的基礎上又整理出《現代蒙古語頻率詞典》;研制了MHJ—1型蒙古語言分析軟件包;1990年推出蒙古文拉丁化輸入方法,開發(fā)了從新蒙古文到老蒙古文的轉寫軟件,完成了蒙古文詞根、詞干和附加成分的自動切分與復合詞的自動識別系統(tǒng);蒙文字幕機系統(tǒng),蒙漢混排圖章計算機輔助設計系統(tǒng),篆文刻繪系統(tǒng),蒙語文節(jié)目微機管理系統(tǒng),微機蒙文圖書目錄管理系統(tǒng),蒙醫(yī)癲癇病專家系統(tǒng)等。
此外,廣西壯族自治區(qū)語委主持開發(fā)了壯語詞庫;西南民族學院開發(fā)出彝文(四川涼山規(guī)范彝文)字幕機系統(tǒng);中國社會科學院民族研究所完成了1994年基金項目——中國少數民族語言文字多媒體數據庫。這些少數民族文字數據庫的建立,為少數民族文字歷史檔案的數字化提供便利條件。
?。ǘ┓e極開展少數民族文字歷史檔案的數字化工作
1 .鍵盤輸入。鍵盤輸入是少數民族文字歷史檔案數字化的一種基本形式,目前已經開發(fā)出許多少數民族文字輸入法,各民族地區(qū)的檔案館(室)工作人員可根據所管理少數民族文字歷史檔案的情況選擇具體的少數民族文字輸入法,以作為少數民族文字歷史檔案數字化的基本工具。
2 .掃描儀。掃描儀的工作原理是把紙上的圖形、圖像或文字信息變成像素點陣,再用二進制數表示這些點陣,從而將圖形、文字變成數字,輸入計算機。由于掃描儀可以將整頁的少數民族文字、圖形或圖像直接輸入計算機,因而在少數民族文字歷史檔案信息的輸入方面具有廣闊的應用前景。
3 .數碼相機及攝像頭。數碼相機攝制的圖像可以通過標準串/并行口輸入到計算機,內部的PC卡可以直接插入計算機使用,拍攝到的圖像可以用計算機進行處理,保持圖像的原樣而不失真,圖像質量很高。數碼相機及攝像頭可用于少數民族文字歷史檔案的拍攝、復制、存儲和傳輸利用。
通過以上各種現代化技術,即可將各種類型、各種形式、各種載體的少數民族文字歷史檔案信息輸入計算機,建立完善的數字化少數民族文字歷史檔案信息系統(tǒng)。
?。ㄈ╅_發(fā)少數民族歷史檔案數字化管理系統(tǒng)
少數民族歷史檔案數字化管理系統(tǒng)是一類可擴展的知識網絡系統(tǒng),可采集、加工、處理、存儲、組織、發(fā)布和利用少數民族文字歷史檔案信息資源,管理軟件的開發(fā)應遵循以下原則:
1 .標準化建設
?。?)編碼字符集標準、鍵盤標準、字模標準。如內蒙古自治區(qū)計算中心完成蒙文字符集、鍵盤、字模國家標準;新疆語委主持完成維、哈、柯文的字符集、鍵盤、字模國家標準;在國家語委和國家技術監(jiān)督局及電子部的直接指導下,西藏自治區(qū)藏語文指導委員會辦公室主持,西藏大學、西北民族學院、青海師范大學共同完成了藏文編碼字符集、鍵盤、字模的國家標準,這一標準正式由國際10646(即ISO\10646)大字符集討論通過,成為我國第一個進入10646國際字符集標準基本平面的少數民族文字字符集;四川省民族委辦公室主持完成了彝文字符集、鍵盤、字模的國家標準;錫伯文信息處理信息交換用七位和八位編碼圖形字符集國家標準正在編制中。此外,國際標準1%文字符集的蒙文字符集、彝文字符集、維、哈、柯文字符集的補充集和錫伯文字符集正在制定中。
?。?)術語標準化。正在制定的國家標準有蒙古語術語標準化的一般原則與方法,藏語術語標準化的一般原則與方法,維吾爾語術語標準化的一般原則與方法,朝鮮語術語標準化的一般原則與方法等,均為北方少數民族的術語標準化原則與方法。此外,還有蒙、藏、維、哈、柯、朝等語種的辭書編纂一般原則與方法國家標準正在計劃制定和修訂中。
?。?)檔案標準化。在軟件的設計與選用上,首先要看是否是在檔案管理標準指導下開發(fā)出的軟件。開發(fā)少數民族歷史檔案管理軟件可參照采用的檔案標準有《檔案著錄規(guī)則》、《文獻保密等級代碼》、《國家機關公文格式》、《檔案分類標引規(guī)則》、《計算機軟件開發(fā)規(guī)范》等。
2 .動態(tài)性原則
(1)采用新型數據庫管理系統(tǒng)。由于Windows系統(tǒng)的廣泛流行,Foxpro關系型數據庫正逐漸取代老的數據系統(tǒng),它可以高度兼容Dbase和Foxbase,具有操作更簡捷,調整修改方便,界面美觀等特點而成為軟件開發(fā)者的強有力的工具之一。
?。?)注意留有二次開發(fā)接口。在檔案管理自動化方面有一些項目有待完善與改進,如文獻主題詞的標引,不同文體之間的相互轉換,文獻全文關鍵詞檢索,以及自動組卷排列等。因此,少數民族歷史檔案管理軟件設計要先構建總體結構,留有補充功能接口,在不斷升級的過程中完善和增加各種功能。
3 . 注重系統(tǒng)的擴展性
在設計和選購軟件時,要考慮有相應功能的驅動軟件,如多媒體操作系統(tǒng),多媒體窗口系統(tǒng)和多媒體數據庫管理系統(tǒng),可增加掃描儀、光盤驅動器、可擦寫光盤機以及聲卡、視卡等硬件,并可組成一臺完整的多媒體少數民族歷史檔案管理系統(tǒng)。
?。ㄋ模┳龊脭底只贁得褡逦淖謿v史檔案的利用工作
1 .少數民族文字歷史檔案信息的檢索。目前,許多計算機信息管理軟件都有制作多種檔案檢索工具和多數據庫文獻查詢檢索的功能。各個檔案機構在開發(fā)少數民族歷史檔案管理系統(tǒng)時,應能夠進行多數據庫多線索的少數民族文字歷史檔案模糊查詢,可以按照文字類別、文獻標題、文獻主題詞、文獻載體材料、文獻所屬類別、民族類別、形成時間等項目進行多途徑檢索,并且可以將檢索出的結果由用戶自己設計打印出來。
2 .少數民族文字歷史檔案信息的輸出利用。在少數民族文字歷史檔案信息的輸出利用方面,計算機網絡具有強大的傳輸功能。在計算機網絡建設方面,根據國內外經驗,考慮到我國通信技術和通信線路設備的現狀,利用微型機靈活性強、價格較低、建網快、易于普及等條件,首先在各主要民族地區(qū)建立微機局域網絡系統(tǒng),實現一定范圍內的少數民族文字歷史檔案信息資源共享。待條件成熟時,再在局域網絡的基礎上建成全國性的大型網絡,便于社會各界對少數民族文字歷史文獻的查詢、研究和利用。