亚洲精品国产精品国自产_2020亚洲国产精品无码_欧美换爱交换爱乱理论片_俄罗斯肥胖女bbwbbw

歡迎來(lái)到中博奧技術(shù)有限公司官網(wǎng)

數(shù)字檔案館可以沒(méi)有全文數(shù)據(jù)庫(kù)嗎?

時(shí)間:2022-04-02 作者: 來(lái)源:網(wǎng)絡(luò) 點(diǎn)擊量:

 建設(shè)數(shù)字檔案館的目的,除了適應(yīng)現(xiàn)代信息技術(shù)發(fā)展的環(huán)境而信息化外,“數(shù)字檔案館的建設(shè)的最終目的不是保存,而是以有效利用為目的”

  [1]“數(shù)字檔案館信息服務(wù)是提高檔案信息資源利用率,實(shí)現(xiàn)檔案信息價(jià)值的直接手段。”

  [2]“建設(shè)數(shù)字檔案館的目的之一是直接向用戶提供所需的最終信息,而不只是獲得信息的線索,即二次信息,如目錄、索引等,因而沒(méi)有最終全文信息的系統(tǒng)也不是數(shù)字檔案館?!?/p>

  [3]“檔案信息數(shù)字化的關(guān)鍵內(nèi)容是檔案全文數(shù)字化,只有將檔案全文信息公布于網(wǎng)上,才能真正發(fā)揮檔案信息網(wǎng)絡(luò)的現(xiàn)實(shí)功能,構(gòu)建現(xiàn)代意義上的數(shù)字檔案館,使檔案用戶在足不出戶的情況下借助網(wǎng)絡(luò)查閱檔案,獲取檔案信息?!?/p>

  [4]“理想的檔案全文庫(kù)必須具備對(duì)超大規(guī)模分布式多媒體檔案信息庫(kù)的有序組織和跨庫(kù)快速查詢功能?!薄澳軌虬凑沾_定的知識(shí)結(jié)構(gòu)有效組織大量分布式的、不同類型、不同數(shù)據(jù)結(jié)構(gòu)的數(shù)字化檔案信息庫(kù),并為之建立有效的檢索系統(tǒng)?!薄鞍〝?shù)據(jù)庫(kù)檢索技術(shù)、全文檢索技術(shù)、圖像內(nèi)容查詢技術(shù)以及數(shù)字化音頻和視頻信息的查詢技術(shù)等?!?/p>

  [5]“對(duì)于社會(huì)用戶,數(shù)字檔案館實(shí)現(xiàn)檔案全文檢索,遠(yuǎn)程借閱和查看,可以將檔案信息發(fā)布到互聯(lián)網(wǎng)及其他公共網(wǎng)上,與檔案館Web網(wǎng)站信息進(jìn)行集成,以建立信息服務(wù)與共享的平臺(tái),供用戶查詢?yōu)g覽?!?/p>

  [6]“檢索功能是數(shù)字檔案館發(fā)展的基礎(chǔ)和關(guān)鍵”,

  [7]“數(shù)字檔案館采用帶有先進(jìn)檢索功能的全文數(shù)據(jù)庫(kù),用戶可通過(guò)對(duì)元數(shù)據(jù)的檢索獲取檔案全文,是一種目前應(yīng)用較為普遍的方式?!?/p>

  [8]通過(guò)以上的闡述,可以看出建設(shè)數(shù)字檔案館的目的是為了利用并且能夠提高利用效率,而要達(dá)到這一目的,建設(shè)檔案全文數(shù)據(jù)庫(kù)是基礎(chǔ),實(shí)現(xiàn)全文檢索是手段。檔案全文數(shù)據(jù)庫(kù)是前提,沒(méi)有檔案全文數(shù)據(jù)庫(kù)就無(wú)法實(shí)施全文檢索,沒(méi)有全文檢索就不能體現(xiàn)數(shù)字檔案館提高檔案信息資源利用率的優(yōu)越性。這樣來(lái)看檔案全文數(shù)據(jù)庫(kù)不僅是數(shù)字檔案館的基礎(chǔ),甚至是數(shù)字檔案館的核心、靈魂,而如果沒(méi)有檔案全文數(shù)據(jù)庫(kù)的數(shù)字檔案館就是失去了核心、靈魂,甚至就變得沒(méi)有意義。

  然而,在實(shí)際中有一種讓人說(shuō)不清的現(xiàn)象,就是建設(shè)數(shù)字檔案館中,并不十分關(guān)注檔案全文數(shù)據(jù)庫(kù)建設(shè)的問(wèn)題,其表現(xiàn):一是忽略檔案全文數(shù)據(jù)庫(kù)建設(shè)。如國(guó)家檔案局的《數(shù)字檔案館建設(shè)指南》雖然指出:“數(shù)字檔案資源建設(shè)是數(shù)字檔案館建設(shè)的核心內(nèi)容”,

  但是,在整部《數(shù)字檔案館建設(shè)指南》中沒(méi)有提及檔案全文數(shù)據(jù)庫(kù)建設(shè)的問(wèn)題,根本沒(méi)有對(duì)檔案全文數(shù)據(jù)庫(kù)建設(shè)的要求。在國(guó)家檔案局《數(shù)字檔案館系統(tǒng)測(cè)試辦法》中也同樣沒(méi)有提及檔案全文數(shù)據(jù)庫(kù)的問(wèn)題,也沒(méi)有對(duì)檔案全文數(shù)據(jù)庫(kù)建設(shè)的要求,而僅僅有對(duì)檔案目錄數(shù)據(jù)庫(kù)的要求。二是誤讀檔案全文數(shù)據(jù)庫(kù)。

  在許多數(shù)字檔案館建設(shè)的地方,大都稱已建立了檔案全文數(shù)據(jù)庫(kù),但是,也不知是不理解什么是檔案全文數(shù)據(jù)庫(kù),還是誤解檔案全文數(shù)據(jù)庫(kù),實(shí)際并沒(méi)有建立檔案全文數(shù)據(jù)庫(kù),而是將檔案全文掃描圖像誤認(rèn)為是檔案全文數(shù)據(jù)庫(kù)。實(shí)際只是對(duì)檔案原文進(jìn)行圖像數(shù)字化掃描,生成的只是一幅幅圖像,并不能對(duì)其內(nèi)容進(jìn)行直接檢索,而是通過(guò)掛接到檔案目錄數(shù)據(jù)庫(kù),靠檢索檔案目錄來(lái)指引查閱檔案原文。這種現(xiàn)象從一些地方數(shù)字檔案館的建設(shè)費(fèi)用上就可以看出來(lái)。例如,一個(gè)通過(guò)國(guó)家示范數(shù)字檔案館測(cè)試的檔案館,共投資560萬(wàn)元,包括機(jī)房、軟硬件平臺(tái)、數(shù)字檔案館管理軟件、“加工檔案96779卷,建成了159萬(wàn)條目錄數(shù)據(jù)庫(kù)、1085萬(wàn)頁(yè)全文數(shù)據(jù)庫(kù)、36027張照片數(shù)據(jù)庫(kù)、11160分鐘的多媒體數(shù)據(jù)庫(kù),12809條圖書資料目錄數(shù)據(jù)庫(kù)”

  [9]等。一般加工一頁(yè)全文檔案(掃描、文字識(shí)別、校對(duì))至少1元,而且年代越遠(yuǎn)的檔案其加工成本會(huì)更高。那么,僅1085萬(wàn)頁(yè)全文就需要資金1085萬(wàn),僅此一項(xiàng)幾乎是總投資2倍。所以,可以肯定其不是全文數(shù)據(jù)庫(kù),而只是全文圖像數(shù)據(jù)庫(kù),也就是無(wú)法進(jìn)行檔案全文檢索的檔案信息。三是對(duì)檔案全文數(shù)據(jù)庫(kù)文字識(shí)別的標(biāo)準(zhǔn)問(wèn)題。

  對(duì)于檔案全文數(shù)據(jù)庫(kù)最基礎(chǔ)的紙質(zhì)檔案資源的數(shù)字化加工,檔案行業(yè)標(biāo)準(zhǔn)《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》(DA/T31—2017)根本沒(méi)有有關(guān)檔案全文文字識(shí)別的問(wèn)題,該規(guī)范只對(duì)紙質(zhì)檔案數(shù)字化掃描圖像的分辨率做了規(guī)定。也就是對(duì)于檔案全文的數(shù)字化文字識(shí)別的問(wèn)題根本沒(méi)有標(biāo)準(zhǔn)。對(duì)于文字識(shí)別率的問(wèn)題,有專家認(rèn)為:“識(shí)別率一般達(dá)到90%以上,已經(jīng)基本滿足檔案全文檢索的需要了。有的人片面追求識(shí)別率,一定要求識(shí)別率達(dá)到98%-99%的,反復(fù)校對(duì),實(shí)際上是浪費(fèi)人力物力。”

  [10]實(shí)際90%的識(shí)別率對(duì)檔案全文檢索還是有相當(dāng)影響的,達(dá)到98%-99%可能有些要求高,至少應(yīng)該在95-98%以內(nèi)。但是,OCR只能對(duì)現(xiàn)代正規(guī)的打印體識(shí)別率較高,對(duì)于手寫體、鋼板刻字以及打字機(jī)打字蠟紙油印的字體的識(shí)別率并不高,特別是前兩者。至于豎版的檔案就更別說(shuō)了。而在市縣級(jí)檔案館保存的檔案中,現(xiàn)代正規(guī)的打印體的并不多,大部分都是后者。就像計(jì)算機(jī)的普及一樣,先省后市,然后才是縣鄉(xiāng),先經(jīng)濟(jì)發(fā)達(dá)地方,后經(jīng)濟(jì)落后地方,從手寫到鋼板刻字再到打字機(jī)打字,也是如此。

  目前,大多數(shù)建成的數(shù)字檔案館其實(shí)都沒(méi)有建設(shè)檔案全文數(shù)據(jù)庫(kù),都是只做了檔案目錄數(shù)據(jù)庫(kù),而是將掃描的檔案全文圖像掛接到檔案目錄數(shù)據(jù)庫(kù)中,靠檢索檔案目錄來(lái)指引查閱檔案原文。這樣的檢索功能,其實(shí)不論是計(jì)算機(jī)的Windows,還是excel都能夠做到。如果,數(shù)字檔案館沒(méi)有檔案全文數(shù)據(jù)庫(kù),而只是靠檔案目錄數(shù)據(jù)庫(kù)檢索,似乎既失去了靈魂,又白白地投入了巨資。

  如果,沒(méi)有檔案全文信息的系統(tǒng)不是數(shù)字檔案館的話,那么,現(xiàn)在大多數(shù)建成的數(shù)字檔案館似乎就不是數(shù)字檔案館了。當(dāng)然,這樣簡(jiǎn)單的否定似乎并沒(méi)有意義,這種現(xiàn)象值得探討。國(guó)家檔案局的《數(shù)字檔案館建設(shè)指南》和《數(shù)字檔案館系統(tǒng)測(cè)試辦法》中沒(méi)有提及檔案全文數(shù)據(jù)庫(kù)建設(shè)的問(wèn)題,也沒(méi)有對(duì)檔案全文數(shù)據(jù)庫(kù)建設(shè)的要求,應(yīng)該不是隨隨便便忽略的,應(yīng)該是有考量的,可能認(rèn)為檔案目錄數(shù)據(jù)庫(kù)外掛檔案全文掃描圖像的形式就是數(shù)字檔案館,如果是這樣,那么,認(rèn)為沒(méi)有檔案全文信息的系統(tǒng)不是數(shù)字檔案館的觀點(diǎn)就不一定正確,或者說(shuō)這兩種觀點(diǎn)都正確,只是對(duì)檔案全文的認(rèn)識(shí)不同,檔案全文掃描圖像是檔案全文,檔案全文進(jìn)行文字識(shí)別的也是檔案全文,它們沒(méi)有區(qū)別。問(wèn)題是它們真的沒(méi)有區(qū)別嗎?信息化的優(yōu)勢(shì)是什么?也就是數(shù)字檔案館的優(yōu)勢(shì)是什么?

  數(shù)字檔案館(信息化)的優(yōu)勢(shì)是不是實(shí)現(xiàn)全文級(jí)的檢索?當(dāng)然,也可能檔案達(dá)到目錄級(jí)檢索就可以了,沒(méi)有必要進(jìn)行全文級(jí)的檢索。如果是這樣,數(shù)字檔案館還需要不需要這樣從軟硬件方面大量投巨資一個(gè)一個(gè)地單獨(dú)建設(shè)呢?另外的問(wèn)題是面對(duì)數(shù)字檔案館不能提高檔案利用率的問(wèn)題,又該如何解釋呢?是不是由于數(shù)字檔案館沒(méi)有實(shí)現(xiàn)全文級(jí)的檢索造成的呢?如果不是,那又是什么原因呢?難道檔案這種信息不適合信息化?

我是中博奧客服:小奧
中博奧技術(shù)有限公司& 版權(quán)所有工信部備案號(hào):豫ICP備11015869號(hào)-8 Copyright ? 2023-2024

檔案整理檔案數(shù)字化

檔案掃描檔案管理軟件系統(tǒng)

TEL:18937133779

To Top