一、術(shù)語和定義
1、數(shù)字化
用計算機技能將模擬信號轉(zhuǎn)化為數(shù)字信號的處理進程。
2、紙質(zhì)檔案數(shù)字化
選用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機辨認的數(shù)字圖畫或數(shù)字文本的處理進程。
3、數(shù)字圖畫
表示什物圖畫的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的接連圖畫發(fā)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣——接連函數(shù),并在采樣點上將值最小化后的陣列。
4、是非二值圖畫
只要是非兩級灰度的數(shù)字圖畫。它對應(yīng)于是非兩種狀態(tài)的文字稿、線條圖等。
5、接連色調(diào)靜態(tài)圖畫
以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖畫。在紙質(zhì)檔案數(shù)字化進程中,一般表現(xiàn)為灰度掃描和五顏六色掃描兩種方法。
6、分辨率
單位長度內(nèi)圖畫包含的點數(shù)或像素數(shù),一般用每英時點數(shù)(dpi)表示。
7、失真度
對檔案進行數(shù)字化轉(zhuǎn)化后,數(shù)字圖畫與檔案原件在顏色、幾何等方面的違背程度。
8、可懂度
數(shù)字圖畫向人或機器供給信息的才干。
9、圖畫壓縮
鏟除圖畫冗余或圖畫近似的任一種進程,其目的是對圖畫以更緊湊的方法表示。
二、紙質(zhì)檔案數(shù)字化根本要求
1、根本原則
紙質(zhì)檔案數(shù)字化的根本原則是使檔案信息資源精確方便快捷地供給使用,使能夠公開的檔案信息資源得到共享,以滿足社會對檔案使用的需求。
2、數(shù)字化對像的確定原則
應(yīng)當(dāng)對所要進行數(shù)字化的對象依照一定的原則和辦法進行承認,只要契合一定要求的紙質(zhì)檔案文獻才干進行數(shù)字化。
1)契合國家法律法規(guī)的原則
紙質(zhì)檔案的數(shù)字化,有必要契合國家檔案開放規(guī)定以及有關(guān)規(guī)定。
2)價值性原則
歸于歸檔規(guī)模且應(yīng)永久或長時間保存的、社會使用價值高的檔案可列入數(shù)字化加工的規(guī)模。
3、根本環(huán)節(jié)
紙質(zhì)檔案數(shù)字化的根本環(huán)節(jié)首要包含:檔案收拾、目錄建庫、檔案掃描、圖畫處理、圖畫存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)查驗、數(shù)據(jù)備份、作用辦理等。
4、 進程辦理
1)應(yīng)加強紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密辦理機制,保證檔案原件和數(shù)字化檔案信息的安全。
2 )紙質(zhì)檔案數(shù)字化的各個環(huán)節(jié)均應(yīng)進行詳細的掛號,并及時收拾、匯總,裝訂成冊,在數(shù)字化作業(yè)完成的同時樹立起完好、標(biāo)準(zhǔn)的記載。
三、檔案收拾
在掃描之前,依據(jù)檔案辦理情況,按下述步驟對檔案進行恰當(dāng)收拾,并視需求作出標(biāo)識,保證檔案數(shù)字化質(zhì)量。
1 目錄數(shù)據(jù)準(zhǔn)備
2 拆除裝訂
3 區(qū)分掃描件和非掃描件
4 頁面修整
5 檔案收拾掛號
6 裝訂
四、檔案掃描
1、掃描方法
1)依據(jù)檔案幅面的巨細(A4、A3、A0等)挑選相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可選用0號圖紙掃描儀)進行掃描。大幅面檔案可選用大幅面數(shù)碼平臺,或許縮微拍攝后的膠片數(shù)字化轉(zhuǎn)化設(shè)備等進行掃描,也能夠選用小幅面掃描后的圖畫拼接方法處理。
2)紙張情況較差,以及過薄、過軟或超厚的檔案,應(yīng)選用平板掃描方法;紙張情況好的檔案可選用高速掃描方法以提高作業(yè)效率。
2、掃描顏色方法
1)掃描顏色方法一般有是非二值、灰度、五顏六色等。一般選用是非二值。
2)頁面為是非兩色,并且字跡明晰、不帶插圖的檔案,可選用是非二值方法進行掃描。
3)頁面為是非兩色,但字跡明晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可選用灰度方法掃描。
4)頁面中有紅頭、印章或插有是非照片、五顏六色照片、五顏六色插圖的檔案,可視需求選用五顏六色方法進行掃描。
3 、掃描分辨率
1)掃描分辨率參數(shù)巨細的挑選,原則上以掃描后的圖畫明晰、完好、不影響圖畫的使用作用為準(zhǔn)。
2)選用是非二值、灰度、五顏六色幾種方法對檔案進行掃描時,其分辨率一般均建議挑選≥100dpi.特別情況下,如文字偏小、密布、明晰度較差等,可恰當(dāng)提高分辨率。
3)需求進行OCR漢字辨認的檔案,掃描分辨率建議挑選≥200dpi.
4、掃描登掛號
仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,掛號掃描的頁數(shù),核對每份文件的實踐掃描頁數(shù)與檔案收拾量填寫的文件頁數(shù)是否共同,不共同時應(yīng)注明具體原因和處理辦法。
五、圖畫處理
1 、圖畫數(shù)據(jù)質(zhì)量查看
1)對圖畫偏斜度、明晰度、失真度進行查看。發(fā)現(xiàn)不契合圖畫質(zhì)量要求時,應(yīng)從頭進行圖畫的處理。
2)由于操作不妥,造成掃描的圖畫文件不完好或無法明晰辨認時,應(yīng)從頭掃描。
3)發(fā)現(xiàn)文件漏掃時,應(yīng)及時補掃并正確刺進圖畫。
4)發(fā)現(xiàn)掃描圖畫的擺放順序與檔案原件不共同時,應(yīng)及時進行調(diào)整。
5)仔細填寫相關(guān)表單,記載質(zhì)檢結(jié)果和處理意見。
2、糾偏
對呈現(xiàn)偏斜的圖畫應(yīng)進行糾偏處理,以到達視覺上根本不感覺偏斜為準(zhǔn)。對方向不正確的圖畫應(yīng)進行旋轉(zhuǎn)還原,以契合閱覽習(xí)慣。
3、去污
對圖畫頁面中呈現(xiàn)的影響圖畫質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等應(yīng)進行去污處理。處理進程中應(yīng)遵從在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。
4、圖畫拼接
對大幅面檔案進行分區(qū)掃描構(gòu)成的多幅圖畫,應(yīng)進行拼接處理,合并為一個完好的圖畫,以保證檔案數(shù)字化圖畫的整體性。
5、裁邊處理
選用五顏六色方法掃描的圖畫應(yīng)進行裁邊處理,去除多余的白邊,以有用縮小圖畫文件的容量,節(jié)省存儲空間。
六、圖畫存儲
1、存儲格局
1)選用是非二值方法掃描的圖畫文件,一般選用TIFF(G4)格局存儲。選用灰度方法和五顏六色方法掃描的文件,一般選用JPEG格局存儲。存儲時的壓縮率的挑選,應(yīng)以保證掃描的圖畫明晰可讀的前提下,盡量減小存儲容量為原則。
2)供給網(wǎng)絡(luò)查詢的掃描圖畫,也可存儲為CEB、PDF或其他格局。
2、圖畫文件的命名
1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每一份文件,都有一個與之相對應(yīng)的唯一檔號,以該檔號為這份文件掃描后的圖畫文件命名。
2)多頁文件可選用該檔號樹立相應(yīng)文件夾,按頁碼順序?qū)D畫文件命名。
七、目錄建庫
1、數(shù)據(jù)格局挑選
目錄建庫應(yīng)挑選通用的數(shù)據(jù)格局。所選定的數(shù)據(jù)格局應(yīng)能直接或直接經(jīng)過XML文檔進行數(shù)據(jù)交換。
2、檔案著錄
依照《檔案著錄規(guī)則》(DA/T18)的要求進行著錄,樹立檔案目錄數(shù)據(jù)庫。
3、目錄數(shù)據(jù)質(zhì)量查看
選用人工校正或軟件主動校正的方法,對目錄數(shù)據(jù)庫的建庫質(zhì)量進行查看。核對著錄項目是否完好、著錄內(nèi)容是否標(biāo)準(zhǔn)、精確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進行修正或重錄。
八、數(shù)據(jù)掛接
1、匯總掛接
檔案數(shù)字化轉(zhuǎn)化進程中構(gòu)成的目錄數(shù)據(jù)庫與圖畫數(shù)據(jù)庫,經(jīng)過質(zhì)檢環(huán)節(jié)承以為“合格”后,經(jīng)過網(wǎng)絡(luò)及時加載到數(shù)據(jù)服務(wù)器端匯總。經(jīng)過編制程序或借助相應(yīng)軟件,可完成目錄數(shù)據(jù)對相相關(guān)的數(shù)字圖象的主動查找、參加對應(yīng)的電子地址信息等,完成批量、快速掛接。
2、數(shù)據(jù)相關(guān)
以紙質(zhì)檔案目錄數(shù)據(jù)庫為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖畫存儲為一份圖畫文件。將圖畫文件存儲到相應(yīng)文件夾時,要仔細核對每一份圖象文件的名稱與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖畫文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否共同,圖畫文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。經(jīng)過每一份圖畫文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的共同性和唯一性,樹立起一一對應(yīng)的相相關(guān)系,為完成檔案目錄數(shù)據(jù)庫與圖畫文件的批量掛接供給條件。
3、仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,記載數(shù)據(jù)相關(guān)后的頁數(shù),核對每一份文件相關(guān)后的頁數(shù)與檔案收拾、掃描時填寫的頁數(shù)是否共同,不共同時應(yīng)注明具體原因和處理辦法。
九、數(shù)據(jù)查驗
1、數(shù)據(jù)抽檢
1)以抽檢的方法查看已完成數(shù)字化轉(zhuǎn)化的所有數(shù)據(jù),包含目錄數(shù)據(jù)庫、圖畫文件及數(shù)據(jù)掛接的整體質(zhì)量。
2)一個全宗的檔案,數(shù)據(jù)查驗時抽檢的比率不得低于5%.
2、查驗?zāi)繕?biāo)
1)目錄數(shù)據(jù)庫與圖畫文件掛接錯誤碼,或目錄數(shù)據(jù)庫、圖畫文件之一呈現(xiàn)不完好、不明晰、有錯誤等質(zhì)量問題時,抽檢標(biāo)記為“不合格”。
2)一個全宗的檔案,數(shù)字化轉(zhuǎn)化質(zhì)量抽檢的合格率到達95%以上(含95%)時,給予以查驗“經(jīng)過”。
合格率:抽檢合格的文件數(shù)/抽檢文件總數(shù)×100%
3、查驗審閱
查驗“經(jīng)過”的結(jié)論,有必要經(jīng)分管領(lǐng)導(dǎo)審閱、簽字后方有用。
4、查驗掛號
仔細填寫紙質(zhì)檔案數(shù)字化查驗掛號表單。
十、數(shù)據(jù)備份
1、備份規(guī)模
經(jīng)查驗合格的完好數(shù)據(jù)應(yīng)及時進行備份。
2、備份方法
為保證數(shù)據(jù)安全,備份載體的挑選應(yīng)多樣化,可選用在線、離線相結(jié)合的方法完成多套備份,并注意異地保存。
3、數(shù)據(jù)查驗
備份數(shù)據(jù)也應(yīng)進行查驗。備份數(shù)據(jù)的查驗的內(nèi)容首要包含備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完好、文件數(shù)量是否精確等。
4、備份標(biāo)簽
數(shù)據(jù)備份后應(yīng)相應(yīng)的備份介質(zhì)上做好標(biāo)簽,以便查找和辦理。
5、備份掛號
填寫紙質(zhì)檔案數(shù)字化備份辦理掛號表單。
十一、數(shù)字化作用辦理
1、應(yīng)加強對紙質(zhì)檔案數(shù)字化作用的辦理,保證其安全、完好和長時間可用。
2、紙質(zhì)檔案數(shù)字化作用供給網(wǎng)上檢索使用時,應(yīng)有制作單位的電子標(biāo)識,并依據(jù)具體情況分別選用可下載或不行下載的數(shù)據(jù)格局。
相關(guān)文章
- 重慶檔案管理咨詢服務(wù)的特點2018年08月10日
- 重慶檔案管理的性質(zhì)作用是什么?2018年08月10日
- 重慶檔案管理的組成部分及劃分環(huán)節(jié)是什么?2018年08月10日