国产欧美日韩一区二区国内-日韩 国产 欧美 三级-日韩欧美国产一区二区三区在线-一区二区三区国产日韩欧美在线

當(dāng)前位置: 首頁(yè)?信息動(dòng)態(tài) ?行業(yè)動(dòng)態(tài)
介紹在大數(shù)據(jù)的網(wǎng)絡(luò)時(shí)代的檔案信息檢索
來(lái)源:www.lheraulttraitlibre.com 發(fā)布時(shí)間:2019年06月10日

  一,信息網(wǎng)絡(luò)環(huán)境

  下文件信息檢索的特點(diǎn)

  與傳統(tǒng)的手工檢索和常規(guī)計(jì)算機(jī)檢索相比,信息網(wǎng)絡(luò)環(huán)境下的檔案信息檢索在檢索對(duì)象,檢索方法,檢索軟件,檢索服務(wù)類(lèi)型和檢索效率方面存在顯著差異。

  (1)檢索對(duì)象

  傳統(tǒng)的檔案信息檢索對(duì)象僅限于部門(mén)和系統(tǒng)擁有的特定信息資源,網(wǎng)絡(luò)信息檢索對(duì)象的范圍更廣,面向龐大的在線共享資源。 可以檢索關(guān)于在web上分發(fā)的各種數(shù)據(jù)庫(kù)的信息。從信息的內(nèi)容,除了技術(shù)和社會(huì)科學(xué)知識(shí),它還包括廣告,風(fēng)格,電影和電視,娛樂(lè)等商業(yè)和娛樂(lè)信息。從信息的形式, 除了文本信息,它還包括各種多媒體信息。

  (2)搜索方法

  傳統(tǒng)的計(jì)算機(jī)文件信息檢索主要采用人機(jī)交互文本檢索方法,用戶界面單一。在實(shí)際檢索之前,有必要制定仔細(xì)的搜索策略,準(zhǔn)備搜索公式,并輸入搜索命令。 然后,可以在計(jì)算機(jī)文檔中進(jìn)行查詢。搜索結(jié)果通常只是文本信息,如參考書(shū)目,摘要和數(shù)值,檢索速度慢。 Web信息檢索使用超文本和超媒體檢索方法。 它具有統(tǒng)一和友好的用戶界面。它不需要制定搜索類(lèi)型。它使用自然語(yǔ)言搜索來(lái)執(zhí)行標(biāo)題和內(nèi)容的自動(dòng)搜索。除了文本信息之外,搜索結(jié)果還包括諸如音頻信息和視頻信息之類(lèi)的非文本信息。 檢索速度很快。

  (3)搜索軟件

  普通文件信息檢索軟件一般是封閉式專(zhuān)用軟件,每個(gè)文件檢索軟件不能普遍使用,用戶使用不方便。網(wǎng)絡(luò)信息檢索軟件是開(kāi)放的公共軟件,只要它是在線用戶即可。 各種搜索軟件可用于共享因特網(wǎng)上的所有信息資源。

  (4)搜索服務(wù)

  傳統(tǒng)的計(jì)算機(jī)信息檢索服務(wù)方法包括追溯檢索,離線和在線預(yù)定服務(wù),復(fù)制,在線打印,訂購(gòu)原始文本等,收費(fèi)高。 服務(wù)范圍狹窄。除了提供一般的在線搜索服務(wù)之外,因特網(wǎng)上的各種類(lèi)型的服務(wù)器還可以提供諸如瀏覽和檢索,超文本檢索和自動(dòng)內(nèi)容搜索之類(lèi)的服務(wù)。這些服務(wù)器對(duì)用戶完全開(kāi)放。 無(wú)論用戶的瀏覽和選擇如何,一些服務(wù)都是免費(fèi)的,服務(wù)范圍非常廣泛。

  (5)搜索效率

  在傳統(tǒng)的計(jì)算機(jī)檢索中,用戶租用特殊的信息通道,信息傳輸順暢,但由于一般的計(jì)算機(jī)檢索系統(tǒng)數(shù)據(jù)庫(kù)數(shù)量有限,信息來(lái)源狹窄, 信息資源共享水平低,召回率低。在信息網(wǎng)絡(luò)中,用戶使用公共信息通道。由于在線用戶數(shù)量眾多,傳輸?shù)男畔⒘烤薮?,信息通道容易被阻塞?它對(duì)檢索速度有影響,但在線信息的來(lái)源非常廣泛。用戶可以在全球范圍內(nèi)交換信息,檢索相關(guān)信息并共享信息資源。召回率自然很高。此外, 大多數(shù)網(wǎng)絡(luò)信息檢索采用自然語(yǔ)言。它不需要像傳統(tǒng)的計(jì)算機(jī)檢索那樣編譯搜索公式。用戶的知識(shí)水平低,并且用戶不需要知道存儲(chǔ)所需信息的文檔。 您不必選擇搜索標(biāo)識(shí)符,可以使用您熟悉的語(yǔ)言直接在計(jì)算機(jī)終端上查詢所需信息,避免將自然語(yǔ)言轉(zhuǎn)換為搜索標(biāo)記并構(gòu)建搜索時(shí)可能出現(xiàn)的各種錯(cuò)誤配方,提高精度。 檢索的便利性也大大增加。

  可以看出,隨著信息傳輸速度和網(wǎng)絡(luò)功能的進(jìn)一步提高以及網(wǎng)絡(luò)用戶的增加,網(wǎng)絡(luò)信息檢索將逐步取代傳統(tǒng)的人工檢索和傳統(tǒng)的計(jì)算機(jī)檢索。 占據(jù)信息檢索的主導(dǎo)地位。

  二、網(wǎng)絡(luò)信息檢索工具

  在信息網(wǎng)絡(luò)環(huán)境下, 信息組織與檢索方式有了很大改變, 檢索工具的運(yùn)行環(huán)境與前迥異, 原有的信息檢索工具已不能適應(yīng)新的需要, 各種專(zhuān)門(mén)用于網(wǎng)絡(luò)環(huán)境的檢索工具應(yīng)運(yùn)而生。網(wǎng)絡(luò)信息檢索工具目前主要有下面幾種:

  1 . 交互式檢索工具

  提供類(lèi)似商用聯(lián)機(jī)檢索的信息檢索服務(wù), 可分為Gopher 和WWW 兩大類(lèi)。

介紹在大數(shù)據(jù)的網(wǎng)絡(luò)時(shí)代的檔案信息檢索

 

  (1 ) Gopher

  是一種菜單式的檢索工具, 用戶只要在成樹(shù)型結(jié)構(gòu)排列的菜單上選擇特定的項(xiàng)目( 可以是目錄名, 也可以是文件名) , 就可直接檢索所需信息, 而不必考慮這些信息的存儲(chǔ)方式和存儲(chǔ)地點(diǎn), 它是目前最常用的網(wǎng)絡(luò)信息檢索工具之一。

  (2 ) WWW

  是一種基于超文本的交互式瀏覽型檢索工具, 是目前因特網(wǎng)上最先進(jìn)的信息檢索工具。它覆蓋了約2 000 萬(wàn)個(gè)大小不等的信息源, 可幫助用戶查找各服務(wù)器在網(wǎng)上的地址, 通過(guò)該地址訪問(wèn)該服務(wù)器提供的信息。對(duì)用戶來(lái)說(shuō), 文件的格式及其存儲(chǔ)方式均是透明的, 這些文件既可來(lái)自WWW 服務(wù)器, 又可來(lái)自F TP、Gopher 或WAIS 服務(wù)器。

  2.目錄搜索工具

  字典,電話簿和人員目錄等功能用于查詢?cè)诰€用戶信息以及有關(guān)Internet上各種服務(wù)和提供商的信息。例如,當(dāng)前在因特網(wǎng)上運(yùn)行的常用的基于目錄的網(wǎng)絡(luò)信息檢索工具具有WH OIS,NETFIND,X。500等。

  (1)WH OIS

  互聯(lián)網(wǎng)的用戶信息服務(wù)一般用于查找互聯(lián)網(wǎng)上用戶的電子郵件地址,郵政地址,電話號(hào)碼等,結(jié)構(gòu)簡(jiǎn)單,使用方便。目前,有一種稱(chēng)為WHOIS + +新的目錄服務(wù)通信協(xié)議正在開(kāi)發(fā)中,可能會(huì)構(gòu)建一個(gè)覆蓋整個(gè)Internet的分布式目錄服務(wù)系統(tǒng)。

  (2)NETFIND

  可以基于已知人員的姓名和關(guān)于他或她的工作地點(diǎn)的信息找到用戶愿意發(fā)布的人的電子郵件地址和電話號(hào)碼以及其他信息。

  (3)X。500

  它是由國(guó)際電信和電信咨詢委員會(huì)(CCIT T)開(kāi)發(fā)的目錄服務(wù)通信協(xié)議,為用戶提供分布式標(biāo)準(zhǔn)化目錄服務(wù)。 它不僅提供有關(guān)個(gè)人和機(jī)構(gòu)的信息,還提供有關(guān)網(wǎng)絡(luò)資源,應(yīng)用程序,硬件等的信息。

  3.索引搜索工具

  索引在線信息資源,為用戶提供文件檢索服務(wù),檢索結(jié)果可以是文件的存儲(chǔ)地址,并且可以通過(guò)檢索工具進(jìn)一步獲得原始信息。前者是Archie, 后者包括Veronica,Jughead和WAIS。

  (1)Archie

  建立Archie服務(wù)器的組織定期從每個(gè)FTP主機(jī)收集存儲(chǔ)在其中的所有公共文件的目錄,并將此信息存儲(chǔ)在Archie中 索引數(shù)據(jù)庫(kù)供用戶檢索?;ヂ?lián)網(wǎng)上已經(jīng)建立了數(shù)十個(gè)Archie服務(wù)器,這些服務(wù)器共存儲(chǔ)了大約210萬(wàn)個(gè)文件的目錄,這些文件分布在全球約1,200臺(tái)主機(jī)上。

  (2)Veronica

  該功能類(lèi)似于Archie的功能,Archie是Gopher的搜索工具。 Veronica服務(wù)器定期聯(lián)系每個(gè)Gopher服務(wù)器并復(fù)制所有菜單。 存儲(chǔ)在數(shù)據(jù)庫(kù)中,用戶可以通過(guò)Velonica搜索服務(wù)程序自動(dòng)搜索相關(guān)的Gophe服務(wù)器菜單到數(shù)據(jù)庫(kù),這極大地改善了Gophe r 檢索速度。

  (3)Jughead

  它是一個(gè)類(lèi)似于Veronica的搜索工具。區(qū)別在于J ughead的搜索范圍是預(yù)定義的,例如僅檢索大學(xué)或某種類(lèi)型的Gopher服務(wù)器。

  (4)WAIS

  使用因特網(wǎng)上的各種文本數(shù)據(jù)庫(kù)作為檢索對(duì)象,自然語(yǔ)言全文檢索方法允許用戶快速檢索大范圍的信息。 可以在屏幕上顯示文件的全文信息,供用戶在線瀏覽。

相關(guān)文章