當前位置:
首頁 > 最新 > 理論探討│OFD格式在檔案領域的應用初探

理論探討│OFD格式在檔案領域的應用初探

周 楓1 呂東偉1 鄧晶京1 黃麗萍1 駱建珍2

摘 要OFD格式是我國自主可控的電子文件版式文檔格式。文章從版式文檔存在的問題著手,對OFD格式產生背景進行分析;結合OFD格式的特徵,對OFD格式在檔案領域應用場景進行探討;採用SWOT分析法,對OFD格式在檔案領域應用前景進行分析,並指出應用策略。

關鍵詞OFD 版式文檔 格式 檔案 SWOT分析法

Abstract:OFD is theself-controlled fixed layout documents format of electronic files. Firstly, thepaper analyze the creation background of OFD by summarizing the problem ofother fixed layout documents. Secondly, the paper discussing the applicationscenario of OFD format in archives by integrating the feature of OFD format. Atlast, the paper analyze the application prospect and point out the applicationstrategy of OFD format in archives by using SWOT analytical method.

Keywords:OFD; fixed layout documents; format; archives; SWOT

版式文檔是指版面呈現效果固定的電子文檔。版式文檔通過將文字、圖像、圖表等數字內容對象按一定規則進行版面固化呈現,呈現效果不因軟硬體環境、操作者的變化而變化,版面固定、不跑版、所見即所得,可以視為計算機時代的「數字紙張」。版式文檔的特點使它成為電子文檔發布、數字化信息傳播和存檔的理想文檔格式。2017年5月,國家標準《電子文件存儲與交換格式版式文檔》(GB/T 33190-2016)正式實施,該標準規定了國家版式文檔格式規範,簡稱OFD(Open Fixed-Layout Document)。然而,作為一項文檔格式的國家標準,對於OFD格式的研究主要仍局限於產品本身,因此非常有必要加強OFD格式在檔案領域的研究,從而更好地推進OFD格式在檔案工作中的進一步應用。

1 OFD格式產生背景

1.1存檔格式多樣,造成信息孤島

在OFD格式產生之前,電子文件存檔格式並沒有統一的國家或行業標準,檔案工作中普遍採用DOC、WPS、PPTX等流式文件格式。由於其存在內容易更改、遷移過程易變異和損失等不足,因此並不符合電子文件長期保存要求。同時,部分文檔以PDF、XPS、SEP、CEBX等版式格式存檔,但不同版式文件依賴某個具體軟硬體平台且格式技術未能完全打通,導致格式之間不能互通、傳遞不暢,文檔信息傳播利用受限。

1.2格式應用受限,信息失存失信

由於沒有統一標準,當前文檔格式大多不易擴展,導致各領域的應用受限。有些版式文檔不能嵌入元數據信息,從前端業務系統形成的電子文件自帶的信息量太少,導致電子文件所包含的元數據信息大量減少;部分版式文檔格式不能很好的支持數字簽名、電子印章等技術認證機制,無法滿足電子文件長久保存的要求。在對不符合長期保存要求的格式進行格式轉換時,容易出現新的問題:業務系統中的流轉、簽批等信息在轉換為歸檔格式後可能會丟失;格式轉化過程的數字簽名、印章等認證信息丟失;不同格式之間的數字簽名不能互通,不能互簽互用;大批量文件進行格式轉換用時長,轉化過程不穩定,容易出錯。

1.3現有格式壟斷,存在安全風險

一些格式依賴非自主可控技術,無法在全自主可控平台下運行,格式的使用和服務受限於外部廠商和技術,對於文檔的發展應用始終處於跟隨狀態,而當需要對文檔格式進行擴展時,又容易受制於相關廠商。格式標準不公開,私有版式文檔的格式解析、標準解釋掌握在國外企業手中,文檔信息資源容易遭到「劫持」,也無法保證對數據解析的長期技術支持。同時,國外軟體廠商的文檔格式不支持國產加密演算法應用,無法通過國密演算法保證電子文檔的安全。

2009年,中央辦公廳頒布《電子文件管理暫行辦法》,明確提出「應採用符合國家標準的文件存儲格式,確保能夠長期有效可讀」。2010年5月,全國檔案工作標準化技術委員會第十八次年會提出,與工業和信息化部一同暫緩採用以美國ADOBE公司技術為基礎的《長期保存的電子文檔文件格式第1部分:PDF1.4(PDF/A-1)的使用》作為國家標準在我國的實施,並最終與國家標準委達成協議,將該標準的使用範圍限定在「涉密文檔以及作為檔案保存的文檔」[1]以外,因此,制定適合我國電子文件長期存儲和交換的國家自主可控版式文檔應運而生。

2 OFD格式應用場景

2.1電子文件歸檔格式

對於電子文件歸檔而言,採用「原生」格式歸檔,不僅可以更好地保證電子文件的「四性」,還有利於電子檔案的長期保存和有效利用。因此,在前端即採用OFD格式生成並以OFD格式歸檔,可以視為電子文件歸檔格式的前端控制,如浙江省檔案局印發《浙江省省直單位電子公文歸檔與電子檔案管理暫行辦法》,提出電子公文採用OFD格式歸檔。

2.2元數據採集

OFD具有很強的結構化描述能力,外部系統或用戶可以通過標引的方式添加自定義的標記和信息,為在文檔中嵌入更多應用相關的結構化語義信息提供支持,同時,OFD支持語義導覽並可將內嵌語義導出為數據,從而達到與其他系統、數據交互的目的並擴展應用,而這也是OFD吸取其他格式方案發展應用中的經驗教訓而形成的獨特優勢。對於電子檔案而言,在電子公文階段利用自定義標引定義電子公文所需的元數據,構建電子公文語義樹;進入檔案部門後,可繼承電子公文中原有的前端元數據,並根據檔案管理的需要補充擴展相關檔案管理元數據,從而更好地保證電子文件全生命周期過程的「四性」。

2.3電子文件格式轉換

採用OFD進行格式轉換有兩種情況:一是歸檔時將各種主流格式的文件統一轉換為OFD格式,實現「多頭流入,單一保存」。例如,在OFD格式頒布前的試點過程中,國土資源部將文書檔案、業務檔案、網頁等進行了OFD格式電子文件歸檔,審計署對其行政及審計公文進行了轉版應用。二是由於原先格式即將被淘汰、原格式不符合國家標準、格式多樣管理不便等原因,對電子檔案的格式進行統一轉換。

2.4電子檔案長期保存

《版式電子文件長期保存格式需求》(DA/T 47-2009)中對長期保存格式需求進行了定義:長期保存是一種可靠的、科學合理的方式長期維護電子文件真實、完整、有效的行為。同時,DA/T 47給出了版式電子文件長期保存格式11項需求,可以作為電子文件長期保存格式選擇的依據:格式開放、不綁定軟硬體、文件自包含、格式自描述、顯示一致性、持續可解釋、穩健、利於存儲、支持技術認證機制、易於利用。通過將OFD版式文件的內容、特性與DA/T 47要求進行對比,其完全符合電子檔案長期保存文件格式要求,是作為電子檔案文件格式的理想選擇。

2.5電子檔案數據交換

為了維護電子檔案的完整性,數據交換一般而言並不會以單個電子文件的方式進行交換,而是以信息包的方式進行交換,包括 ASIP、TSIP、AIP、DIP等。信息包以一定的目標結構方式組織,為了交換方便的需要也會封裝成ZIP壓縮包、EEP封裝包、電子書等形式。OFD作為電子文件存儲和交換格式,採用Zip壓縮,支持以數字簽名的方式進行數據交換過程中的安全認證,可有效實現電子檔案的數據轉換。

2.6電子檔案開放利用

隨著無紙化進程的推進,越來越多的文件利用以電子形式進行,如何確保在不同的環境下文件利用的安全和便利,並始終保持所利用文件的權威性和憑證作用,是開放利用中不得不考慮的一個問題。作為一種版式文檔,OFD能夠實現存檔格式和利用格式合一,提供給用戶相同的用戶體驗,提供全面、安全、高效的文檔呈現、交換和再利用,同時結合用戶操作習慣,提供視圖、注釋、工具等功能,滿足利用過程中的文檔處理需要。OFD版式文件基於層次文本+壓縮打包的技術機制,比同樣內容的DOC、PDF等格式文件體積更小,在線閱讀時文件載入、打開速度更快,同時用戶終端不留存副本,安全性好。此外,OFD還可根據需要實現多文檔的分類合併,更好地滿足業務需求。

2.7自主可控檔案系統

在部分安全保密要求級別較高的系統中,OFD應該是唯一的版式文件格式,不管是保存、交換還是利用。OFD對於全國產環境(基於國產 CPU/OS的數字檔案信息系統)的支持相對於PDF格式也有明顯的優勢。OFD格式得到國產廠商的廣泛支持,其與CA認證、國產加密演算法、電子印章等安全防護措施的結合比PDF更有優勢。因此,在自主可控檔案系統中,OFD格式無疑是自主可控檔案系統的最好選擇。

......

(圖片來自網路)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 檔案管理雜誌 的精彩文章:

調查報告│文獻被引與全文轉載視域下的《檔案管理》學術影響力分析

TAG:檔案管理雜誌 |