国产欧美日韩一区二区国内-日韩 国产 欧美 三级-日韩欧美国产一区二区三区在线-一区二区三区国产日韩欧美在线

當(dāng)前位置: 首頁?信息動態(tài) ?行業(yè)動態(tài)
解析檔案數(shù)字化加工具有著那些流程呢?
來源:www.lheraulttraitlibre.com 發(fā)布時間:2018年12月29日


  一、術(shù)語和定義

  1、數(shù)字化

  用計算機技能將模擬信號轉(zhuǎn)化為數(shù)字信號的處理進程。

  2、紙質(zhì)檔案數(shù)字化

  選用掃描儀或數(shù)碼相機等數(shù)碼設(shè)備對紙質(zhì)檔案進行數(shù)字加工,將其轉(zhuǎn)化為存儲在磁帶、磁盤、光盤等載體上并能被計算機辨認的數(shù)字圖畫或數(shù)字文本的處理進程。

  3、數(shù)字圖畫

  表示什物圖畫的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的接連圖畫發(fā)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣——接連函數(shù),并在采樣點上將值最小化后的陣列。

  4、是非二值圖畫

  只要是非兩級灰度的數(shù)字圖畫。它對應(yīng)于是非兩種狀態(tài)的文字稿、線條圖等。

  5、接連色調(diào)靜態(tài)圖畫

  以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖畫。在紙質(zhì)檔案數(shù)字化進程中,一般表現(xiàn)為灰度掃描和五顏六色掃描兩種方法。

  6、分辨率

  單位長度內(nèi)圖畫包含的點數(shù)或像素數(shù),一般用每英時點數(shù)(dpi)表示。

  7、失真度

  對檔案進行數(shù)字化轉(zhuǎn)化后,數(shù)字圖畫與檔案原件在顏色、幾何等方面的違背程度。

  8、可懂度

  數(shù)字圖畫向人或機器供給信息的才干。

  9、圖畫壓縮

  鏟除圖畫冗余或圖畫近似的任一種進程,其目的是對圖畫以更緊湊的方法表示。

  二、紙質(zhì)檔案數(shù)字化根本要求

  1、根本原則

  紙質(zhì)檔案數(shù)字化的根本原則是使檔案信息資源精確方便快捷地供給使用,使能夠公開的檔案信息資源得到共享,以滿足社會對檔案使用的需求。

  2、數(shù)字化對像的確定原則

  應(yīng)當(dāng)對所要進行數(shù)字化的對象依照一定的原則和辦法進行承認,只要契合一定要求的紙質(zhì)檔案文獻才干進行數(shù)字化。

  1)契合國家法律法規(guī)的原則

  紙質(zhì)檔案的數(shù)字化,有必要契合國家檔案開放規(guī)定以及有關(guān)規(guī)定。

  2)價值性原則

  歸于歸檔規(guī)模且應(yīng)永久或長時間保存的、社會使用價值高的檔案可列入數(shù)字化加工的規(guī)模。

  3、根本環(huán)節(jié)

  紙質(zhì)檔案數(shù)字化的根本環(huán)節(jié)首要包含:檔案收拾、目錄建庫、檔案掃描、圖畫處理、圖畫存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)查驗、數(shù)據(jù)備份、作用辦理等。

  4、 進程辦理

  1)應(yīng)加強紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密辦理機制,保證檔案原件和數(shù)字化檔案信息的安全。

  2 )紙質(zhì)檔案數(shù)字化的各個環(huán)節(jié)均應(yīng)進行詳細的掛號,并及時收拾、匯總,裝訂成冊,在數(shù)字化作業(yè)完成的同時樹立起完好、標(biāo)準(zhǔn)的記載。

  三、檔案收拾

  在掃描之前,依據(jù)檔案辦理情況,按下述步驟對檔案進行恰當(dāng)收拾,并視需求作出標(biāo)識,保證檔案數(shù)字化質(zhì)量。

  1 目錄數(shù)據(jù)準(zhǔn)備

  2 拆除裝訂

  3 區(qū)分掃描件和非掃描件

  4 頁面修整

  5 檔案收拾掛號

  6 裝訂

  四、檔案掃描

  1、掃描方法

  1)依據(jù)檔案幅面的巨細(A4、A3、A0等)挑選相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可選用0號圖紙掃描儀)進行掃描。大幅面檔案可選用大幅面數(shù)碼平臺,或許縮微拍攝后的膠片數(shù)字化轉(zhuǎn)化設(shè)備等進行掃描,也能夠選用小幅面掃描后的圖畫拼接方法處理。

  2)紙張情況較差,以及過薄、過軟或超厚的檔案,應(yīng)選用平板掃描方法;紙張情況好的檔案可選用高速掃描方法以提高作業(yè)效率。

  2、掃描顏色方法

  1)掃描顏色方法一般有是非二值、灰度、五顏六色等。一般選用是非二值。

  2)頁面為是非兩色,并且字跡明晰、不帶插圖的檔案,可選用是非二值方法進行掃描。

  3)頁面為是非兩色,但字跡明晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可選用灰度方法掃描。

  4)頁面中有紅頭、印章或插有是非照片、五顏六色照片、五顏六色插圖的檔案,可視需求選用五顏六色方法進行掃描。

  3 、掃描分辨率

  1)掃描分辨率參數(shù)巨細的挑選,原則上以掃描后的圖畫明晰、完好、不影響圖畫的使用作用為準(zhǔn)。

  2)選用是非二值、灰度、五顏六色幾種方法對檔案進行掃描時,其分辨率一般均建議挑選≥100dpi.特別情況下,如文字偏小、密布、明晰度較差等,可恰當(dāng)提高分辨率。

  3)需求進行OCR漢字辨認的檔案,掃描分辨率建議挑選≥200dpi.

  4、掃描登掛號

  仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,掛號掃描的頁數(shù),核對每份文件的實踐掃描頁數(shù)與檔案收拾量填寫的文件頁數(shù)是否共同,不共同時應(yīng)注明具體原因和處理辦法。

  五、圖畫處理

  1 、圖畫數(shù)據(jù)質(zhì)量查看

  1)對圖畫偏斜度、明晰度、失真度進行查看。發(fā)現(xiàn)不契合圖畫質(zhì)量要求時,應(yīng)從頭進行圖畫的處理。

  2)由于操作不妥,造成掃描的圖畫文件不完好或無法明晰辨認時,應(yīng)從頭掃描。

  3)發(fā)現(xiàn)文件漏掃時,應(yīng)及時補掃并正確刺進圖畫。

  4)發(fā)現(xiàn)掃描圖畫的擺放順序與檔案原件不共同時,應(yīng)及時進行調(diào)整。

  5)仔細填寫相關(guān)表單,記載質(zhì)檢結(jié)果和處理意見。

  2、糾偏

  對呈現(xiàn)偏斜的圖畫應(yīng)進行糾偏處理,以到達視覺上根本不感覺偏斜為準(zhǔn)。對方向不正確的圖畫應(yīng)進行旋轉(zhuǎn)還原,以契合閱覽習(xí)慣。

  3、去污

  對圖畫頁面中呈現(xiàn)的影響圖畫質(zhì)量的雜質(zhì)如黑點、黑線、黑框、黑邊等應(yīng)進行去污處理。處理進程中應(yīng)遵從在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。

  4、圖畫拼接

  對大幅面檔案進行分區(qū)掃描構(gòu)成的多幅圖畫,應(yīng)進行拼接處理,合并為一個完好的圖畫,以保證檔案數(shù)字化圖畫的整體性。

  5、裁邊處理

  選用五顏六色方法掃描的圖畫應(yīng)進行裁邊處理,去除多余的白邊,以有用縮小圖畫文件的容量,節(jié)省存儲空間。

  六、圖畫存儲

  1、存儲格局

  1)選用是非二值方法掃描的圖畫文件,一般選用TIFF(G4)格局存儲。選用灰度方法和五顏六色方法掃描的文件,一般選用JPEG格局存儲。存儲時的壓縮率的挑選,應(yīng)以保證掃描的圖畫明晰可讀的前提下,盡量減小存儲容量為原則。

  2)供給網(wǎng)絡(luò)查詢的掃描圖畫,也可存儲為CEB、PDF或其他格局。

  2、圖畫文件的命名

  1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每一份文件,都有一個與之相對應(yīng)的唯一檔號,以該檔號為這份文件掃描后的圖畫文件命名。

  2)多頁文件可選用該檔號樹立相應(yīng)文件夾,按頁碼順序?qū)D畫文件命名。

  七、目錄建庫

  1、數(shù)據(jù)格局挑選

  目錄建庫應(yīng)挑選通用的數(shù)據(jù)格局。所選定的數(shù)據(jù)格局應(yīng)能直接或直接經(jīng)過XML文檔進行數(shù)據(jù)交換。

  2、檔案著錄

  依照《檔案著錄規(guī)則》(DA/T18)的要求進行著錄,樹立檔案目錄數(shù)據(jù)庫。

  3、目錄數(shù)據(jù)質(zhì)量查看

  選用人工校正或軟件主動校正的方法,對目錄數(shù)據(jù)庫的建庫質(zhì)量進行查看。核對著錄項目是否完好、著錄內(nèi)容是否標(biāo)準(zhǔn)、精確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進行修正或重錄。

  八、數(shù)據(jù)掛接

  1、匯總掛接

  檔案數(shù)字化轉(zhuǎn)化進程中構(gòu)成的目錄數(shù)據(jù)庫與圖畫數(shù)據(jù)庫,經(jīng)過質(zhì)檢環(huán)節(jié)承以為“合格”后,經(jīng)過網(wǎng)絡(luò)及時加載到數(shù)據(jù)服務(wù)器端匯總。經(jīng)過編制程序或借助相應(yīng)軟件,可完成目錄數(shù)據(jù)對相相關(guān)的數(shù)字圖象的主動查找、參加對應(yīng)的電子地址信息等,完成批量、快速掛接。

  2、數(shù)據(jù)相關(guān)

  以紙質(zhì)檔案目錄數(shù)據(jù)庫為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個或多個圖畫存儲為一份圖畫文件。將圖畫文件存儲到相應(yīng)文件夾時,要仔細核對每一份圖象文件的名稱與檔案目錄數(shù)據(jù)庫中該份文件的檔號是否相同,圖畫文件的頁數(shù)與檔案目錄數(shù)據(jù)庫中該份文件的頁數(shù)是否共同,圖畫文件的總數(shù)與目錄數(shù)據(jù)庫中文件的總數(shù)是否相同等。經(jīng)過每一份圖畫文件的文件名與檔案目錄數(shù)據(jù)庫中該份文件的檔號的共同性和唯一性,樹立起一一對應(yīng)的相相關(guān)系,為完成檔案目錄數(shù)據(jù)庫與圖畫文件的批量掛接供給條件。

  3、仔細填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進程交代掛號表單,記載數(shù)據(jù)相關(guān)后的頁數(shù),核對每一份文件相關(guān)后的頁數(shù)與檔案收拾、掃描時填寫的頁數(shù)是否共同,不共同時應(yīng)注明具體原因和處理辦法。

  九、數(shù)據(jù)查驗

  1、數(shù)據(jù)抽檢

  1)以抽檢的方法查看已完成數(shù)字化轉(zhuǎn)化的所有數(shù)據(jù),包含目錄數(shù)據(jù)庫、圖畫文件及數(shù)據(jù)掛接的整體質(zhì)量。

  2)一個全宗的檔案,數(shù)據(jù)查驗時抽檢的比率不得低于5%.

  2、查驗?zāi)繕?biāo)

  1)目錄數(shù)據(jù)庫與圖畫文件掛接錯誤碼,或目錄數(shù)據(jù)庫、圖畫文件之一呈現(xiàn)不完好、不明晰、有錯誤等質(zhì)量問題時,抽檢標(biāo)記為“不合格”。

  2)一個全宗的檔案,數(shù)字化轉(zhuǎn)化質(zhì)量抽檢的合格率到達95%以上(含95%)時,給予以查驗“經(jīng)過”。

  合格率:抽檢合格的文件數(shù)/抽檢文件總數(shù)×100%

  3、查驗審閱

  查驗“經(jīng)過”的結(jié)論,有必要經(jīng)分管領(lǐng)導(dǎo)審閱、簽字后方有用。

  4、查驗掛號

  仔細填寫紙質(zhì)檔案數(shù)字化查驗掛號表單。

  十、數(shù)據(jù)備份

  1、備份規(guī)模

  經(jīng)查驗合格的完好數(shù)據(jù)應(yīng)及時進行備份。

  2、備份方法

  為保證數(shù)據(jù)安全,備份載體的挑選應(yīng)多樣化,可選用在線、離線相結(jié)合的方法完成多套備份,并注意異地保存。

  3、數(shù)據(jù)查驗

  備份數(shù)據(jù)也應(yīng)進行查驗。備份數(shù)據(jù)的查驗的內(nèi)容首要包含備份數(shù)據(jù)能否打開、數(shù)據(jù)信息是否完好、文件數(shù)量是否精確等。

  4、備份標(biāo)簽

  數(shù)據(jù)備份后應(yīng)相應(yīng)的備份介質(zhì)上做好標(biāo)簽,以便查找和辦理。

  5、備份掛號

  填寫紙質(zhì)檔案數(shù)字化備份辦理掛號表單。

  十一、數(shù)字化作用辦理

  1、應(yīng)加強對紙質(zhì)檔案數(shù)字化作用的辦理,保證其安全、完好和長時間可用。

  2、紙質(zhì)檔案數(shù)字化作用供給網(wǎng)上檢索使用時,應(yīng)有制作單位的電子標(biāo)識,并依據(jù)具體情況分別選用可下載或不行下載的數(shù)據(jù)格局。

相關(guān)文章