一、術(shù)語和定義
1、數(shù)字化
用計算機技術(shù)將模擬信號轉(zhuǎn)化為數(shù)字信號的處理進程。
2、紙質(zhì)檔案數(shù)字化
選用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機辨認的數(shù)字圖畫或數(shù)字文本的處理進程。
3、數(shù)字圖畫
表明什物圖畫的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的連續(xù)圖畫發(fā)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣——連續(xù)函數(shù),并在采樣點大將值最小化后的陣列。
4、是非二值圖畫
只要是非兩級灰度的數(shù)字圖畫。它對應于是非兩種狀態(tài)的文字稿、線條圖等。
5、連續(xù)顏色靜態(tài)圖畫
以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖畫。在紙質(zhì)檔案數(shù)字化進程中,通常表現(xiàn)為灰度掃描和五顏六色掃描兩種方法。
6、分辨率
單位長度內(nèi)圖畫包含的點數(shù)或像素數(shù),一般用每英時點數(shù)(dpi)表明。
7、失真度
對檔案進行數(shù)字化轉(zhuǎn)化后,數(shù)字圖畫與檔案原件在顏色、幾許等方面的偏離程度。
8、可懂度
數(shù)字圖畫向人或機器提供信息的能力。
9、圖畫緊縮
清除圖畫冗余或圖畫近似的任一種進程,其目的是對圖畫以更緊湊的方法表明。
二、紙質(zhì)檔案數(shù)字化根本要求
1、根本原則
紙質(zhì)檔案數(shù)字化的根本原則是使檔案信息資源精確方便快捷地提供使用,使能夠揭露的檔案信息資源得到共享,以滿意社會對檔案使用的需求。
2、數(shù)字化對像的確認原則
應當對所要進行數(shù)字化的對象依照必定的原則和辦法進行確認,只要契合必定要求的紙質(zhì)檔案文獻才能進行數(shù)字化。
1)契合國家法律法規(guī)的原則
紙質(zhì)檔案的數(shù)字化,必須契合國家檔案敞開規(guī)定以及有關(guān)規(guī)定。
2)價值性原則
屬于歸檔范圍且應永久或長時間保存的、社會使用價值高的檔案可列入數(shù)字化加工的范圍。
3、根本環(huán)節(jié)
紙質(zhì)檔案數(shù)字化的根本環(huán)節(jié)首要包含:檔案收拾、目錄建庫、檔案掃描、圖畫處理、圖畫存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)檢驗、數(shù)據(jù)備份、效果辦理等。
4、 進程辦理
1)應加強紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密辦理機制,保證檔案原件和數(shù)字化檔案信息的安全。
2 )紙質(zhì)檔案數(shù)字化的各個環(huán)節(jié)均應進行詳細的掛號,并及時收拾、匯總,裝訂成冊,在數(shù)字化工作完結(jié)的同時樹立起完整、標準的記載。
三、檔案收拾
在掃描之前,根據(jù)檔案辦理狀況,按下述進程對檔案進行恰當收拾,并視需要作出標識,保證檔案數(shù)字化質(zhì)量。
1 目錄數(shù)據(jù)預備
2 拆除裝訂
3 區(qū)分掃描件和非掃描件
4 頁面修整
5 檔案收拾掛號
6 裝訂
四、檔案掃描
1、掃描方法
1)根據(jù)檔案幅面的大小(A4、A3、A0等)挑選相應規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可選用0號圖紙掃描儀)進行掃描。大幅面檔案可選用大幅面數(shù)碼平臺,或者縮微拍照后的膠片數(shù)字化轉(zhuǎn)化設(shè)備等進行掃描,也能夠選用小幅面掃描后的圖畫拼接方法處理。
2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應選用平板掃描方法;紙張狀況好的檔案可選用高速掃描方法以進步工作效率。
2、掃描顏色方法
1)掃描顏色方法一般有是非二值、灰度、五顏六色等。通常選用是非二值。
2)頁面為是非兩色,而且筆跡明晰、不帶插圖的檔案,可選用是非二值方法進行掃描。
3)頁面為是非兩色,但筆跡明晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可選用灰度方法掃描。
4)頁面中有紅頭、印章或插有是非照片、五顏六色照片、五顏六色插圖的檔案,可視需要選用五顏六色方法進行掃描。
3 、掃描分辨率
1)掃描分辨率參數(shù)大小的挑選,原則上以掃描后的圖畫明晰、完整、不影響圖畫的使用效果為準。
2)選用是非二值、灰度、五顏六色幾種方法對檔案進行掃描時,其分辨率一般均建議挑選≥100dpi.特殊狀況下,如文字偏小、密集、明晰度較差等,可恰當進步分辨率。
3)需要進行OCR漢字辨認的檔案,掃描分辨率建議挑選≥200dpi.
4、掃描登掛號
仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,掛號掃描的頁數(shù),核對每份文件的實踐掃描頁數(shù)與檔案收拾量填寫的文件頁數(shù)是否共同,不共同時應注明詳細原因和處理辦法。
五、圖畫處理
1 、圖畫數(shù)據(jù)質(zhì)量查看
1)對圖畫偏斜度、明晰度、失真度進行查看。發(fā)現(xiàn)不契合圖畫質(zhì)量要求時,應從頭進行圖畫的處理。
2)由于操作不妥,構(gòu)成掃描的圖畫文件不完整或無法明晰辨認時,應從頭掃描。
3)發(fā)現(xiàn)文件漏掃時,應及時補掃并正確刺進圖畫。
4)發(fā)現(xiàn)掃描圖畫的排列次序與檔案原件不共同時,應及時進行調(diào)整。
5)仔細填寫相關(guān)表單,記載質(zhì)檢成果和處理意見。
2、糾偏
對呈現(xiàn)偏斜的圖畫應進行糾偏處理,以到達視覺上根本不感覺偏斜為準。對方向不正確的圖畫應進行旋轉(zhuǎn)還原,以契合閱讀習慣。
3、去污
對圖畫頁面中呈現(xiàn)的影響圖畫質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等應進行去污處理。處理進程中應遵循在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。
4、圖畫拼接
對大幅面檔案進行分區(qū)掃描構(gòu)成的多幅圖畫,應進行拼接處理,合并為一個完整的圖畫,以保證檔案數(shù)字化圖畫的整體性。
5、裁邊處理
選用五顏六色方法掃描的圖畫應進行裁邊處理,去除多余的白邊,以有用縮小圖畫文件的容量,節(jié)省存儲空間。
六、圖畫存儲
1、存儲格局
1)選用是非二值方法掃描的圖畫文件,一般選用TIFF(G4)格局存儲。選用灰度方法和五顏六色方法掃描的文件,一般選用JPEG格局存儲。存儲時的緊縮率的挑選,應以保證掃描的圖畫明晰可讀的前提下,盡量減小存儲容量為原則。
2)提供網(wǎng)絡(luò)查詢的掃描圖畫,也可存儲為CEB、PDF或其他格局。
2、圖畫文件的命名
1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每一份文件,都有一個與之相對應的唯一檔號,以該檔號為這份文件掃描后的圖畫文件命名。
2)多頁文件可選用該檔號樹立相應文件夾,按頁碼次序?qū)D畫文件命名。
七、目錄建庫
1、數(shù)據(jù)格局挑選
目錄建庫應挑選通用的數(shù)據(jù)格局。所選定的數(shù)據(jù)格局應能直接或間接經(jīng)過XML文檔進行數(shù)據(jù)交換。
2、檔案著錄
依照《檔案著錄規(guī)則》(DA/T18)的要求進行著錄,樹立檔案目錄數(shù)據(jù)庫。
3、目錄數(shù)據(jù)質(zhì)量查看
選用人工校對或軟件主動校對的方法,對目錄數(shù)據(jù)庫的建庫質(zhì)量進行查看。核對著錄項目是否完整、著錄內(nèi)容是否標準、精確,發(fā)現(xiàn)不合格的數(shù)據(jù)應要求進行修正或重錄。
八、數(shù)據(jù)掛接
1、匯總掛接
檔案數(shù)字化轉(zhuǎn)化進程中構(gòu)成的目錄數(shù)據(jù)庫與圖畫數(shù)據(jù)庫,經(jīng)過質(zhì)檢環(huán)節(jié)確認為“合格”后,經(jīng)過網(wǎng)絡(luò)及時加載到數(shù)據(jù)服務(wù)器端匯總。經(jīng)過編制程序或借助相應軟件,可完成目錄數(shù)據(jù)對相相關(guān)的數(shù)字圖象的主動搜索、參加對應的電子地址信息等,完成批量、快速掛接。
2、數(shù)據(jù)相關(guān)
以紙質(zhì)檔案目錄數(shù)據(jù)庫為根據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖畫存儲為一份圖畫文件。將圖畫文件存儲到相應文件夾時,要仔細核對每一份圖象文件的稱號與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖畫文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否共同,圖畫文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。經(jīng)過每一份圖畫文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的共同性和唯一性,樹立起一一對應的相關(guān)關(guān)系,為完成檔案目錄數(shù)據(jù)庫與圖畫文件的批量掛接提供條件。
3、仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,記載數(shù)據(jù)相關(guān)后的頁數(shù),核對每一份文件相關(guān)后的頁數(shù)與檔案收拾、掃描時填寫的頁數(shù)是否共同,不共同時應注明詳細原因和處理辦法。
九、數(shù)據(jù)檢驗
1、數(shù)據(jù)抽檢
1)以抽檢的方法查看已完結(jié)數(shù)字化轉(zhuǎn)化的一切數(shù)據(jù),包含目錄數(shù)據(jù)庫、圖畫文件及數(shù)據(jù)掛接的總體質(zhì)量。
2)一個全宗的檔案,數(shù)據(jù)檢驗時抽檢的比率不得低于5%.
2、檢驗目標
1)目錄數(shù)據(jù)庫與圖畫文件掛接過錯碼,或目錄數(shù)據(jù)庫、圖畫文件之一呈現(xiàn)不完整、不明晰、有過錯等質(zhì)量問題時,抽檢標記為“不合格”。
2)一個全宗的檔案,數(shù)字化轉(zhuǎn)化質(zhì)量抽檢的合格率到達95%以上(含95%)時,給予以檢驗“經(jīng)過”。
合格率:抽檢合格的文件數(shù)/抽檢文件總數(shù)×100%
3、檢驗審閱
檢驗“經(jīng)過”的結(jié)論,必須經(jīng)分管領(lǐng)導審閱、簽字后方有用。
4、檢驗掛號
仔細填寫紙質(zhì)檔案數(shù)字化檢驗掛號表單。
相關(guān)文章
- 重慶檔案管理咨詢服務(wù)的特點2018年08月10日
- 重慶檔案管理的性質(zhì)作用是什么?2018年08月10日
- 重慶檔案管理的組成部分及劃分環(huán)節(jié)是什么?2018年08月10日
- 檔案管理公司分享檔案主要收集了哪些相關(guān)的信息?2018年09月20日