檔案數(shù)字化如何加工?
來源:www.lheraulttraitlibre.com 發(fā)布時間:2023年09月15日>
如何加工檔案數(shù)字化?
一、定義
隨著計算機技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)字攝影技術(shù)(錄音、錄像),檔案數(shù)字化、隨著數(shù)據(jù)庫技術(shù)、多媒體技術(shù)和存儲技術(shù)的發(fā)展,一種新的文件信息形式將其轉(zhuǎn)化為存儲在磁盤、光盤等載體上的數(shù)字圖像或數(shù)字文本的處理過程,可以通過計算機識別。
文件數(shù)字化是一種新型的文件信息管理模式,它將各種載體的文件資源轉(zhuǎn)換為數(shù)字文件信息,以數(shù)字形式存儲,以網(wǎng)絡形式相互連接,利用計算機系統(tǒng)進行管理,形成有序結(jié)構(gòu)的文件信息庫,及時提供利用,實現(xiàn)資源共享。
數(shù)字化步驟二
前期檔案整理
檔案借出
從檔案室接收,填寫檔案并移交清單,一式兩份。拿到檔案后,開始檢查檔案數(shù)量,檢查數(shù)量后簽字確認,將檔案帶回加工現(xiàn)場。
準備目錄數(shù)據(jù)
根據(jù)各種檔案整理規(guī)定的要求,在檔案管理系統(tǒng)中記錄目錄數(shù)據(jù)。如有錯誤或不規(guī)范的文件標題、文件標題、責任人、日期、起止頁號等。,應進行修改。
拆除裝訂
如果沒有拆除裝訂物,會影響掃描工作的檔案,裝訂物應該被拆除。拆除裝訂物時要注意保護檔案不受損壞。
頁面修整
對于損壞嚴重、無法直接掃描的檔案,應先進行技術(shù)修復,掃描前應對影響掃描質(zhì)量的原件進行相應處理(壓平或熨平等)。).
檔案掃描
掃描方式
根據(jù)檔案幅度的大小(A4)、A3、A0等。)選擇相應規(guī)格的掃描儀或?qū)I(yè)掃描儀進行掃描(例如,0號圖紙掃描儀可以用于工程圖紙)。大型文件可以用大型數(shù)字平臺掃描,也可以用縮小拍攝后的電影數(shù)字轉(zhuǎn)換設備掃描。
(2)紙張狀況不佳,檔案太薄、太軟或太厚,應采用平板掃描;對于紙張狀況良好的檔案,可以采用高速掃描來提高工作效率。
顏色模式的掃描
(1)掃描色彩模式一般包括黑白二值、灰度、色彩等。一般采用彩色。
頁面為黑白兩色,且字跡清晰,無插圖文件,可采用黑白二值模式掃描。
(3)頁面為黑色和白色,但字跡清晰度差或帶插圖的文件,以及頁面為多色文本的文件,可以用灰度模式掃描。
頁面上有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的文件,可以通過彩色模式進行掃描。
掃描分辨率
原則上,掃描后的圖像清晰、完整、不影響圖像的使用效果,是掃描分辨率參數(shù)大小的選擇。
(2)掃描文件時,采用黑白二值、灰度、彩色等模式,其分辨率一般應設置為200-300dpi。特殊情況下,如文字小、密度大、清晰度差等。,可以適當提高分辨率。
圖像處理
圖像數(shù)據(jù)質(zhì)量檢驗
(1)檢查圖像的偏差、清晰度、失真等。當發(fā)現(xiàn)圖像質(zhì)量不符合要求時,應重新處理圖像。
如果由于操作不當,導致掃描的圖像文件不完整或無法清晰識別,則應重新掃描。
發(fā)現(xiàn)文件漏掃時,應及時補齊并正確插入圖像。
當發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時,應及時調(diào)整。
糾偏、去污、圖像拼接、切邊處理
(1)對有偏差的圖像進行偏差處理,以達到視覺上基本不感覺偏差為準。旋轉(zhuǎn)還原方向不正確的圖像,以滿足閱讀習慣。
(2)對影響圖像質(zhì)量的雜質(zhì),如黑點、黑線、黑框、黑邊等。,應進行去污處理。在處理過程中,應遵循在不影響可理解性的情況下展示文件原貌的原則。
(3)分區(qū)掃描大型文件形成的多幅圖像,應拼接合并成一個完整的圖像,以保證文件數(shù)字圖像的整體性。
采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白色邊緣,以有效地減少圖像文件的容量,節(jié)省存儲空間。
圖像存儲
存儲格式
圖像文件采用黑白二值模式掃描,一般采用PDF格式存儲。
采用灰度模式和彩色模式掃描的文件,一般采用PDF格式存儲。
圖像文件命名
(1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每個文件都有相應的檔號,掃描后的圖像文件被該檔號命名為該檔號。如果圖像文件較大,不方便網(wǎng)絡瀏覽,可以拆分成多個圖像文件,文件名稱后增加A、B、C等區(qū)別。
分別設置文件夾,以文件檔號命名,并存儲相應的圖像文件。
數(shù)據(jù)掛接
在將每個紙質(zhì)文件掃描獲得的圖像存儲在相應文件號的文件夾中后,仔細檢查每個圖像文件的名稱是否與文件目錄數(shù)據(jù)庫中文件的文件號相同,圖像文件的頁數(shù)是否與文件目錄數(shù)據(jù)庫中文件的總頁數(shù)相同。通過每個圖像文件所在文件夾的名稱與文件目錄數(shù)據(jù)庫中文件號的一致性,建立相應的關(guān)聯(lián)關(guān)系,為實現(xiàn)文件目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。
一、定義
隨著計算機技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)字攝影技術(shù)(錄音、錄像),檔案數(shù)字化、隨著數(shù)據(jù)庫技術(shù)、多媒體技術(shù)和存儲技術(shù)的發(fā)展,一種新的文件信息形式將其轉(zhuǎn)化為存儲在磁盤、光盤等載體上的數(shù)字圖像或數(shù)字文本的處理過程,可以通過計算機識別。
文件數(shù)字化是一種新型的文件信息管理模式,它將各種載體的文件資源轉(zhuǎn)換為數(shù)字文件信息,以數(shù)字形式存儲,以網(wǎng)絡形式相互連接,利用計算機系統(tǒng)進行管理,形成有序結(jié)構(gòu)的文件信息庫,及時提供利用,實現(xiàn)資源共享。
數(shù)字化步驟二
前期檔案整理
檔案借出
從檔案室接收,填寫檔案并移交清單,一式兩份。拿到檔案后,開始檢查檔案數(shù)量,檢查數(shù)量后簽字確認,將檔案帶回加工現(xiàn)場。
準備目錄數(shù)據(jù)
根據(jù)各種檔案整理規(guī)定的要求,在檔案管理系統(tǒng)中記錄目錄數(shù)據(jù)。如有錯誤或不規(guī)范的文件標題、文件標題、責任人、日期、起止頁號等。,應進行修改。
拆除裝訂
如果沒有拆除裝訂物,會影響掃描工作的檔案,裝訂物應該被拆除。拆除裝訂物時要注意保護檔案不受損壞。
頁面修整
對于損壞嚴重、無法直接掃描的檔案,應先進行技術(shù)修復,掃描前應對影響掃描質(zhì)量的原件進行相應處理(壓平或熨平等)。).
檔案掃描
掃描方式
根據(jù)檔案幅度的大小(A4)、A3、A0等。)選擇相應規(guī)格的掃描儀或?qū)I(yè)掃描儀進行掃描(例如,0號圖紙掃描儀可以用于工程圖紙)。大型文件可以用大型數(shù)字平臺掃描,也可以用縮小拍攝后的電影數(shù)字轉(zhuǎn)換設備掃描。
(2)紙張狀況不佳,檔案太薄、太軟或太厚,應采用平板掃描;對于紙張狀況良好的檔案,可以采用高速掃描來提高工作效率。
顏色模式的掃描
(1)掃描色彩模式一般包括黑白二值、灰度、色彩等。一般采用彩色。
頁面為黑白兩色,且字跡清晰,無插圖文件,可采用黑白二值模式掃描。
(3)頁面為黑色和白色,但字跡清晰度差或帶插圖的文件,以及頁面為多色文本的文件,可以用灰度模式掃描。
頁面上有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的文件,可以通過彩色模式進行掃描。
掃描分辨率
原則上,掃描后的圖像清晰、完整、不影響圖像的使用效果,是掃描分辨率參數(shù)大小的選擇。
(2)掃描文件時,采用黑白二值、灰度、彩色等模式,其分辨率一般應設置為200-300dpi。特殊情況下,如文字小、密度大、清晰度差等。,可以適當提高分辨率。
圖像處理
圖像數(shù)據(jù)質(zhì)量檢驗
(1)檢查圖像的偏差、清晰度、失真等。當發(fā)現(xiàn)圖像質(zhì)量不符合要求時,應重新處理圖像。
如果由于操作不當,導致掃描的圖像文件不完整或無法清晰識別,則應重新掃描。
發(fā)現(xiàn)文件漏掃時,應及時補齊并正確插入圖像。
當發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時,應及時調(diào)整。
糾偏、去污、圖像拼接、切邊處理
(1)對有偏差的圖像進行偏差處理,以達到視覺上基本不感覺偏差為準。旋轉(zhuǎn)還原方向不正確的圖像,以滿足閱讀習慣。
(2)對影響圖像質(zhì)量的雜質(zhì),如黑點、黑線、黑框、黑邊等。,應進行去污處理。在處理過程中,應遵循在不影響可理解性的情況下展示文件原貌的原則。
(3)分區(qū)掃描大型文件形成的多幅圖像,應拼接合并成一個完整的圖像,以保證文件數(shù)字圖像的整體性。
采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白色邊緣,以有效地減少圖像文件的容量,節(jié)省存儲空間。
圖像存儲
存儲格式
圖像文件采用黑白二值模式掃描,一般采用PDF格式存儲。
采用灰度模式和彩色模式掃描的文件,一般采用PDF格式存儲。
圖像文件命名
(1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每個文件都有相應的檔號,掃描后的圖像文件被該檔號命名為該檔號。如果圖像文件較大,不方便網(wǎng)絡瀏覽,可以拆分成多個圖像文件,文件名稱后增加A、B、C等區(qū)別。
分別設置文件夾,以文件檔號命名,并存儲相應的圖像文件。
數(shù)據(jù)掛接
在將每個紙質(zhì)文件掃描獲得的圖像存儲在相應文件號的文件夾中后,仔細檢查每個圖像文件的名稱是否與文件目錄數(shù)據(jù)庫中文件的文件號相同,圖像文件的頁數(shù)是否與文件目錄數(shù)據(jù)庫中文件的總頁數(shù)相同。通過每個圖像文件所在文件夾的名稱與文件目錄數(shù)據(jù)庫中文件號的一致性,建立相應的關(guān)聯(lián)關(guān)系,為實現(xiàn)文件目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。
相關(guān)文章
- 你知道重慶檔案整理是什么嗎?2018年09月20日
- 重慶檔案數(shù)字化的思考講解2020年03月06日