電 話:18937133779
網(wǎng) 址:http://www.yourfinanceinfo.com
郵 箱:zboao@qq.com
在進(jìn)行檔案數(shù)字化加工掃描時(shí),需要特別注意一些重要的事項(xiàng),以確保掃描效果和數(shù)字化結(jié)果的質(zhì)量,同時(shí)也要注意保護(hù)原始檔案的完整性和安全性。下面中博奧小編將為您介紹檔案數(shù)字化加工掃描的一些主要內(nèi)容:
鐵嶺檔案數(shù)字化加工掃描
1.紙質(zhì)檔案的準(zhǔn)備。許多檔案工作人員有著強(qiáng)烈的工作積極性和責(zé)任感,希望盡早把工作完成,這樣的思想是好的,但不能盲目推進(jìn),在紙質(zhì)檔案沒有準(zhǔn)備好之前最好不要進(jìn)入下一階段,必須在紙質(zhì)檔案已按檔案整理規(guī)則完成規(guī)范的歸檔整理后進(jìn)行。若紙質(zhì)檔案整理不合格就開展數(shù)字化掃描,那么一旦紙質(zhì)檔案需要重新調(diào)整必然牽動(dòng)相應(yīng)的數(shù)字化檔案的調(diào)整。檔案整理人員要能夠熟練掌握各階段檔案整理規(guī)則,整理工作包括歸檔與不歸檔鑒定、保管期限鑒定、文件頁正確排序、頁碼正確編寫在正確位置、按檔案整理方案歸檔排序、每一件蓋好歸檔章并準(zhǔn)確填寫、全年檔案完成編目并準(zhǔn)確無誤等工作,確保即將進(jìn)行數(shù)字化加工的檔案齊全、完整、真實(shí)、準(zhǔn)確、規(guī)范,同時(shí)要注意有些檔案需要進(jìn)行拆除裝訂物,修整頁面,修補(bǔ)褪變、破損檔案等工作,才能進(jìn)行數(shù)字化加工。
2.基礎(chǔ)設(shè)施的準(zhǔn)備。紙質(zhì)檔案數(shù)字化工作需要相應(yīng)的設(shè)備和場(chǎng)所,數(shù)字化加工場(chǎng)所應(yīng)空間充足,布局合理,有條件的可配備消防系統(tǒng)和門禁、防盜、視頻監(jiān)控等安全系統(tǒng)。數(shù)字化加工設(shè)備需要計(jì)算機(jī)、檔案掃描儀、刻錄機(jī)及存儲(chǔ)介質(zhì)(如磁帶、磁盤、光盤等),有條件的單位可以配置服務(wù)器、備份設(shè)備、數(shù)碼相機(jī)等,數(shù)字化加工工作同樣需要相應(yīng)的軟件系統(tǒng)支撐,如操作系統(tǒng)、檔案管理軟件、掃描程序、刻錄軟件、備份軟件、病毒查殺軟件等,來保障數(shù)字化加工工作安全有保障。
3.人員的準(zhǔn)備。檔案數(shù)字化加工人員需要具備一定的計(jì)算機(jī)知識(shí)和檔案管理知識(shí)。檔案工作人員要積極向單位領(lǐng)導(dǎo)匯報(bào)反映此項(xiàng)工作的程序和需求,做好工作計(jì)劃,確定工作形式(自主加工或業(yè)務(wù)外包),制定實(shí)施方案,成立檔案數(shù)字化工作領(lǐng)導(dǎo)小組,工作人員要求責(zé)任心強(qiáng),細(xì)心細(xì)致,能夠嚴(yán)格把好質(zhì)量關(guān),實(shí)行數(shù)字化加工過程的全流程管理。
4.管理制度的完善??茖W(xué)、規(guī)范、可行的工作制度能夠保障此項(xiàng)工作的順利有序開展,紙質(zhì)檔案數(shù)字化加工工作涉及崗位、場(chǎng)地、設(shè)備、數(shù)據(jù)、檔案實(shí)體等,要做好這項(xiàng)工作,應(yīng)從這幾個(gè)方面制定相應(yīng)的制度,如《檔案數(shù)字化工作管理辦法》《數(shù)字化工作流程》《檔案信息保密管理制度》《檔案數(shù)字化驗(yàn)收工作細(xì)則》《數(shù)字化工作制度》《設(shè)備管理制度》等,并在紙質(zhì)檔案數(shù)字化工作過程嚴(yán)格執(zhí)行,確保檔案的安全和工作的有機(jī)銜接。
如何進(jìn)行檔案數(shù)字化加工掃描
(1)掃描色彩模式
掃描色彩模式一般分為黑白二值、灰度、彩色等,通常采用黑白二值。頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進(jìn)行掃描。
頁面為黑白兩色,但字跡清晰度差或者帶有插圖的檔案,以及頁面為多色文字的檔案,可采用灰度模式掃描。
頁面中帶有紅頭、印章或者插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進(jìn)行掃描。
底灰較深的紙張(如草漿紙、油印紙),如采用黑白二值應(yīng)將掃描對(duì)比度及亮度適當(dāng)調(diào)低,調(diào)節(jié)效果不理想則采用灰度掃描。
字跡較淺(如鉛筆字)的紙張:如采用黑白二值掃描應(yīng)調(diào)節(jié)臨界值,拉大字跡與原稿的反差,效果不理想則采用灰度掃描。見圖2掃描色彩模式。
(2)掃描分辨率
掃描分辨率參數(shù)大小的選擇,原則上是以掃描后的圖像清晰、完整、不影響圖像的利用效果為準(zhǔn)。為了方便以后OCR識(shí)別,掃描分辨率建議選擇大于等于300dpi。一般情況下,分辨率越高識(shí)別率也就會(huì)越高。但這也不是絕對(duì)的,對(duì)于一些過大過粗的字體,設(shè)置過高的分辨率,識(shí)別率可能會(huì)降低,而且設(shè)置高分辨率后,掃描速度會(huì)大大降低。見圖3掃描分辨率選擇。
(3)亮度和對(duì)比度
在掃描過程中,適當(dāng)?shù)卣{(diào)整好掃描儀的亮度和對(duì)比度值,對(duì)識(shí)別率的高低影響比較大,在進(jìn)行掃描亮度和對(duì)比度的設(shè)定時(shí),以掃描后的圖像中文字的筆畫較細(xì)、均勻,且沒有明顯斷點(diǎn)為準(zhǔn)。如果掃描后的文字圖像存在有黑點(diǎn)、黑斑或者文字線條很粗很黑,分不清楚筆畫的情況下,說明亮度值太小,應(yīng)該增加亮度值再重新掃描。如果文字線條凹凸不平,有斷線甚至圖像中漢字輪廓?dú)埲睍r(shí),說明亮度太大,應(yīng)減小亮度后再重新掃描。
(4)掃描登記
認(rèn)真填寫紙質(zhì)檔案數(shù)字化掃描過程中交接登記表單,登記掃描的頁數(shù),核對(duì)每份文件的實(shí)際掃描頁數(shù)和檔案整理時(shí)填寫的文件頁數(shù)是否一致,不一致時(shí)應(yīng)注明具體原因和處理方法。
檔案數(shù)字化加工掃描流程
檔案數(shù)字化加工利用信息技術(shù)把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲(chǔ),網(wǎng)絡(luò)化的形式互相連接,利用計(jì)算機(jī)系統(tǒng)進(jìn)行管理,形成一個(gè)有序結(jié)構(gòu)的檔案信息庫,及時(shí)提供利用,實(shí)現(xiàn)資源共享。
數(shù)字化加工包括數(shù)字化前準(zhǔn)備、檔案掃描、圖像處理、圖像存儲(chǔ)、目錄建庫、數(shù)據(jù)掛接、檔案還原裝訂、數(shù)據(jù)驗(yàn)收等內(nèi)容。
1、數(shù)字化前期準(zhǔn)備
前期準(zhǔn)備包括選定數(shù)字化處理場(chǎng)所,篩選需要掃描的紙質(zhì)檔案。其中處理場(chǎng)所應(yīng)確??臻g布局合理,掃描設(shè)備完善,數(shù)字化處理軟件齊備,并具備合格的消防和安防系統(tǒng)。準(zhǔn)備紙質(zhì)檔案,需要按類型、日期或其他相關(guān)標(biāo)準(zhǔn)對(duì)文件進(jìn)行排序,并確保沒有任何污垢其他可能影響掃描圖像質(zhì)量的損壞,以保障掃描過程順利、有效的進(jìn)行。
2、檔案掃描
檔案掃描是紙質(zhì)檔案轉(zhuǎn)化數(shù)字檔案的關(guān)鍵步驟。檔案掃描可以使用各種不同的掃描設(shè)備來完成,例如:平板掃描儀、工程掃描儀或鼓式掃描儀。具體使用什么掃描儀將取決于所掃描文件的類型和數(shù)量,以及所需的分辨率和其他因素。原件的掃描與存儲(chǔ)格式應(yīng)完全按照國家檔案管理的統(tǒng)一標(biāo)準(zhǔn)進(jìn)行,對(duì)實(shí)際掃描卷數(shù)、每卷的頁數(shù)要做好登記。
3、圖像處理
(1)圖像數(shù)據(jù)質(zhì)量檢驗(yàn):
對(duì)圖像偏斜度、清晰度、失真度等進(jìn)行檢查。發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像的處理。
由于操作不當(dāng),造成掃描的圖像文件不完整或無法清晰識(shí)別時(shí),應(yīng)重新掃描。
發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確插入圖像。
發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。
認(rèn)真填寫相關(guān)表單,記錄質(zhì)檢結(jié)果和處理意見
?。?)糾偏:對(duì)出現(xiàn)偏斜的圖像應(yīng)進(jìn)行糾偏處理,以達(dá)到視覺上基本不感覺偏斜為準(zhǔn)。對(duì)方向不正確的圖像應(yīng)進(jìn)行旋轉(zhuǎn)還原,以符合閱讀習(xí)慣。
(3)去污:對(duì)圖像頁面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì)如黑點(diǎn)、黑線、黑框、黑邊等應(yīng)進(jìn)行去污處理。處理過程中應(yīng)遵循在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。
(4)圖像拼接:對(duì)大幅面檔案進(jìn)行分區(qū)掃描形成的多幅圖像,應(yīng)進(jìn)行拼接處理,合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性。
(5)裁邊處理:采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲(chǔ)空間。
4、圖像存儲(chǔ)
?。?)存儲(chǔ)格式:批量掃描后形成的圖像文件在存儲(chǔ)時(shí)一般應(yīng)進(jìn)行壓縮。圖像壓縮指消除圖像冗余或?qū)D像近似的任一種過程,其目的是對(duì)圖像以更緊湊的形式表示。紙質(zhì)檔案數(shù)字化過程中,較常見的有TIFF(G4)、JPEG等壓縮格式。采用黑白二值模式掃描的圖像文件,一般采用TIFF(G4)格式存儲(chǔ)。采用灰模式和彩色模式掃描的文件,一般采用JPEG格式存儲(chǔ)。存儲(chǔ)時(shí)壓縮率的選擇,應(yīng)以保證掃描的圖像清晰可讀的前提下,盡量減小存儲(chǔ)容量為準(zhǔn)則。提供網(wǎng)絡(luò)查詢的掃描圖像,也可存儲(chǔ)為CEB、PDF或其他格式。
?。?)圖像文件的命名:紙質(zhì)檔案目錄數(shù)據(jù)庫中的每一份文件,都有一個(gè)與之相對(duì)應(yīng)的唯一檔號(hào),以該檔號(hào)為這份文件掃描后的圖像文件命名。多頁文件可采用該檔號(hào)建立相應(yīng)文件夾,按頁碼順序?qū)D像文件命名。
5、目錄建庫
?。?)數(shù)據(jù)格式選擇:目錄建庫選擇通用的數(shù)據(jù)格式。所選定的數(shù)據(jù)格式應(yīng)能直接或間接通過XML文檔進(jìn)行數(shù)據(jù)交換。
?。?)檔案著錄:按照《檔案著錄規(guī)則》(DA/T18)的要求進(jìn)行著錄,建立檔案目錄數(shù)據(jù)庫。
?。?)目錄數(shù)據(jù)質(zhì)量檢查:采用人工校對(duì)或軟件自動(dòng)校對(duì)的方式,對(duì)目錄數(shù)據(jù)庫的建庫質(zhì)量進(jìn)行檢查。核對(duì)著錄項(xiàng)目是否完整、著錄內(nèi)容是否規(guī)范、準(zhǔn)確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進(jìn)行修改或重錄。
6、數(shù)據(jù)掛接
數(shù)據(jù)掛接又稱數(shù)據(jù)匹配,是數(shù)字歸檔中為保證數(shù)字檔案的準(zhǔn)確性和完整性所需要的流程。借助軟件對(duì)數(shù)據(jù)庫中的目錄數(shù)據(jù)與對(duì)應(yīng)的數(shù)字檔案進(jìn)行匹配掛接,并逐條對(duì)掛接結(jié)果進(jìn)行檢查,包括目錄數(shù)據(jù)與數(shù)字檔案對(duì)應(yīng)的準(zhǔn)確性、已掛接數(shù)字檔案與實(shí)際掃描數(shù)量的一致性、數(shù)字檔案是否能正常打開等,以實(shí)現(xiàn)準(zhǔn)確關(guān)聯(lián)。
7、檔案還原裝訂
掃描工作完成后,拆除過裝訂物的檔案應(yīng)按檔案保管的要求重新裝訂?;謴?fù)裝訂時(shí),應(yīng)注意保持檔案的排列順序不變,做到安全、準(zhǔn)確、無遺漏。檔案裝訂分為整卷裝訂和按件裝訂兩種。通常采用三孔一線方法裝訂;文件很薄時(shí),也可采用縫紉機(jī)扎線裝訂,但線腳不宜過密,以免出現(xiàn)折斷檔案現(xiàn)象。
8、數(shù)據(jù)驗(yàn)收
項(xiàng)目驗(yàn)收是檔案數(shù)字化加工中,用于確保數(shù)字化后的檔案符合所需質(zhì)量標(biāo)準(zhǔn)和規(guī)范的過程。這通常涉及對(duì)數(shù)字檔案進(jìn)行一系列測(cè)試和檢查,以驗(yàn)證它們具有足夠的質(zhì)量并符合指定的標(biāo)準(zhǔn)。這其中包括圖像掃描、檢查處理數(shù)據(jù)匹配步驟中可能存在的錯(cuò)誤、遺漏或其他問題。在某些情況下,項(xiàng)目驗(yàn)收測(cè)試還可能涉及使用專門的軟件工具來完成該過程,以確保符合所需標(biāo)準(zhǔn)。
9、數(shù)據(jù)移交
可以通過各種不同的存儲(chǔ)技術(shù)來實(shí)現(xiàn),例如:硬盤驅(qū)動(dòng)器、網(wǎng)絡(luò)連接的存儲(chǔ)設(shè)備或云服務(wù)器等。所使用的具體技術(shù)將取決于傳輸圖像的數(shù)量,以及相關(guān)檔案管理部門的要求。這樣就可以確保數(shù)字檔案被妥善存儲(chǔ)和保護(hù),并可供將來訪問和使用。
檔案數(shù)字化加工掃描常見設(shè)備
1.檔案紙張不太好,比較薄、易破損,或者掃描量較少,選擇平板掃描儀。
平板掃描儀(flatbed scanner),又稱平臺(tái)式掃描儀、臺(tái)式掃描儀,是指由CCD或CIS等光學(xué)器件來完成掃描工作的掃描設(shè)備。掃描時(shí)需要掀開掃描儀的蓋子,檔案資料平鋪透光玻璃上再蓋上蓋子,鏡頭在透光玻璃下左右移動(dòng),達(dá)到掃描成像目的。
普通企業(yè)日常辦公用的較多的掃描儀就是平板掃描儀,它能夠?qū)4、A3紙張進(jìn)行掃描,是常用的辦公小助手。
平板掃描儀知名品牌有愛普生、佳能,國產(chǎn)的中晶也是掃描儀的老品牌,掃描質(zhì)量不輸日本品牌,另外,精益的平板掃描儀性價(jià)比也是極高的。
2.如果檔案紙張可以拆訂,質(zhì)量相對(duì)較好,沒有太多褶皺,沒有粘貼票據(jù),且掃描量相對(duì)較大的項(xiàng)目,可以選擇饋紙式掃描儀。
饋紙式掃描儀(sheetfed scanner)俗稱高速掃描儀,將單張的整齊的紙張放到饋紙?zhí)帲瑨呙鑳x會(huì)自動(dòng)一頁一頁的將紙張進(jìn)行掃描。市面上應(yīng)用較廣的有愛普生、佳能、惠普等進(jìn)口品牌,國產(chǎn)有方正、紫光、中晶等。
相對(duì)來說,高速掃描儀,效率高,速度快,掃描的圖片質(zhì)量好,但成本相對(duì)較高。
3.在掃描的檔案中,有些難以拆卷或者不允許拆卷的情況,這個(gè)時(shí)候零邊距掃描儀可以派上用場(chǎng)了。
零邊距掃描儀可以不用拆卷就能夠?qū)n案進(jìn)行掃描,在掃描裝訂成冊(cè)的對(duì)象時(shí),紙張不必緊貼玻璃面板,并且掃描后的圖像能夠做到不變形,不失真。主要品牌有富士通、漢王、紫光、中晶等。
4.如果須對(duì)工程類的檔案或者大型圖紙進(jìn)行加工,可以選擇大幅面掃描儀。
大幅面掃描儀能夠?qū)0、A1這類的大型圖紙進(jìn)行掃描,保持圖像的完整性。
市面上大幅面掃描儀主要有卡萊泰克(ColorTrac)、金翔(kinghum)、卡萊奇(ColorGiant)、康泰克斯(Contex)和日?qǐng)D(Graphtec)五種品牌。
5.如果檔案紙張粘貼有票據(jù),或者項(xiàng)目有一些特殊要求,可以選擇高拍儀。
高拍儀(high-speed photographic apparatus)可以通過拍照的方式,對(duì)圖像畫面進(jìn)行掃描。高拍儀具有OCR文字識(shí)別功能,可以將掃描的圖片識(shí)別轉(zhuǎn)換成可編輯的word文檔。市場(chǎng)口碑較高的品牌有紫光、楓林、良田、方正等。
6.對(duì)于已經(jīng)裝訂成冊(cè),不方便拆訂的書籍、卷宗等,可以選擇非接觸式掃描儀。
非接觸式掃描儀也稱為書刊掃描儀,它通常指掃描元件與被掃描物品不進(jìn)行直接接觸,被掃描的書籍、檔案、卷宗等擺放在置物臺(tái)上,線性CCD的掃描方式對(duì)圖像進(jìn)行采集。主要品牌有亞博通、賽數(shù)、i2s、bookeye。
非接觸式掃描儀具有OCR文字識(shí)別功能,是專門為書籍、檔案、賬本、卷宗這種已經(jīng)裝訂成冊(cè),不方便拆訂的紙張而設(shè)計(jì)的一種特殊結(jié)構(gòu)的掃描儀。
綜上所述,在進(jìn)行檔案數(shù)字化加工掃描時(shí),嚴(yán)格遵循以上注意事項(xiàng),可以有效提高數(shù)字化檔案的質(zhì)量,保護(hù)原始檔案的完整性,確保數(shù)字化工作的順利進(jìn)行和長期保存價(jià)值。
(全國總部)河南省鄭州市金水區(qū)農(nóng)業(yè)路71號(hào)中州國際飯店1617-1618
+18937133779
zboao@qq.com
中博奧技術(shù)有限公司& 版權(quán)所有
工信部備案號(hào):豫ICP備11015869號(hào)-8