社科信息檢索工具
*,單擊此處編輯母版標(biāo)題樣式,單擊此處編輯母版文本樣式,第二級(jí),第三級(jí),第四級(jí),第五級(jí),社科文獻(xiàn)檢索,“新的力量源泉不是少數(shù)人手中的金錢,而是多數(shù)人手中的信息?!?-約翰.奈斯比特,第二 章 社科信息檢索工具,第一節(jié) 信息檢索的概念,1、檢索的起源,信息檢索起源于圖書館的參考咨詢和文摘索引工作.從19世紀(jì)下半葉開始發(fā)展,至20世紀(jì)40年代.索引和檢索已成為圖書館獨(dú)立的工具和用戶服務(wù)項(xiàng)目。20世紀(jì)中葉以前,信息存儲(chǔ)和傳播主要以紙質(zhì)介質(zhì)為載體,信息檢索活動(dòng)也圍繞著文獻(xiàn)的獲取和控制展開。,2、檢索的基本原理,信息檢索,是指將信息按照一定的方式組織 和存儲(chǔ)起來,并根據(jù)用戶的需要,找出所需信息的過程。,廣義,的信息檢索包括信息的存儲(chǔ)和檢索兩個(gè)過程,而,狹義,的信息檢索只包括后一個(gè)過程,即為處理解決各種問題而查找,信息的存儲(chǔ)過程就是按照主題詞表或分類表及使用原則對(duì)原始信息資源進(jìn)行處理,形成信息特征標(biāo)識(shí),為檢索提供經(jīng)過整序的信息集合的過程。,信息檢索的過程往往需要一個(gè)評(píng)價(jià)反饋途徑,多次比較匹配,以獲得最終的檢索結(jié)果。其圖示如下:,3、信息檢索手段,從技術(shù)手段上分:手工檢索(手檢)和計(jì)算機(jī)檢索(機(jī)檢),手工檢索(manual retrieval)使用的多為印刷型或書本型檢索(paper-based retrieval)工具,早些有檢索卡片,現(xiàn)在使用最多的是檢索刊,它們定期地將最新收集到的信息、文獻(xiàn)加以匯總、組織和報(bào)道。手檢的技術(shù)要求不高,以人的勞動(dòng)為本,由人來翻閱,由人來進(jìn)行比較、選擇,完成匹配。手檢工具能提供的檢索點(diǎn)十分有限,檢索結(jié)果往往不盡人意。,計(jì)算機(jī)檢索(computer-based retrieval),它通過數(shù)據(jù)庫(kù)系統(tǒng)來實(shí)現(xiàn)的。檢索系統(tǒng)包括:計(jì)算機(jī)主機(jī)設(shè)備、外部存貯器、輸入輸出設(shè)備、終端設(shè)備、通信設(shè)備等硬件設(shè)施,還需要控制、提供檢索的軟件系統(tǒng),包括:通信軟件、操作系統(tǒng)、應(yīng)用程序等,以實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的信息存取。檢索過程是在人與機(jī)器的合作、協(xié)同下完成的,它們經(jīng)常用實(shí)時(shí)的(real time)、交互的(interactive)的方式從計(jì)算機(jī)存貯的大量數(shù)據(jù)中自動(dòng)分揀出用戶所需要的信息。計(jì)算、比較、選擇的匹配任務(wù)是由機(jī)器來執(zhí)行的,而人則是整個(gè)檢索方案的設(shè)計(jì)者和操縱者。,計(jì)算機(jī)檢索的優(yōu)勢(shì),計(jì)算機(jī)檢索明顯優(yōu)于手工檢索,主要表現(xiàn):,檢索的信息量大、,數(shù)據(jù)更新快、,檢索功能強(qiáng)、,檢索結(jié)果輸出的多樣性。,第二節(jié)社科信息檢索工具,2.1.1 檢索工具的定義,檢索工具是人們用來報(bào)道、存儲(chǔ)和查找各類信息的工具。包括傳統(tǒng)的二次、三次印刷型檢索工具,縮微閱讀檢索工具,基于計(jì)算機(jī)的光盤檢索系統(tǒng)、聯(lián)機(jī)檢索系統(tǒng),以及基于Internet的網(wǎng)絡(luò)信息檢索系統(tǒng)、網(wǎng)上工具書、搜索引擎、Archie、Wais等各種信息檢索工具和檢索系統(tǒng)。,檢索工具的類型,按照檢索手段的不同,檢索工具可分為,手工檢索工具、,機(jī)械檢索工具,和,計(jì)算機(jī)檢索系統(tǒng),。,按照著錄形式的不同可分為:目錄型檢索工具、題錄型檢索工具、索引型檢索工具、文摘型檢索工具、全文型檢索工具等。,按照載體形式的不同可分為:書本式檢索工具、卡片式檢索工具、縮微式檢索工具和機(jī)讀式檢索工具等。,2.1.2 手工檢索工具,手工檢索工具是傳統(tǒng)的檢索工具,主要是各種類型的工具書。工具書是人們根據(jù)一定的需要,廣泛收集某一范圍的有關(guān)資料,按特定體例或方式編排,提供基本知識(shí)和文獻(xiàn)線索的一種特殊類型的圖書,是檢索文獻(xiàn)信息的重要工具。,根據(jù)工具書的體例和功用,可分為,檢索類工具書,、,詞語類工具書,、,資料類工具書,、,表譜類工具書,、,圖錄類工具書,和,邊緣類工具書,六種類型。,下面對(duì)此分別介紹,2.1.2.1 檢索類工具書,按著錄內(nèi)容劃分,檢索類工具書大致可分為以下四種:目錄、題錄、文摘、索引。,目錄(Bibliography/Catalogue):通常是以文獻(xiàn)的“本”、“種”、“件”等為單位,對(duì)一批相關(guān)文獻(xiàn)外表特征的揭示和報(bào)道。例如:全國(guó)新書目、全國(guó)總書目、全國(guó)報(bào)刊簡(jiǎn)明目錄等。,題錄(Title):它報(bào)道和揭示單篇文獻(xiàn)的外表特征,是在目錄的基礎(chǔ)上發(fā)展起來的一種檢索工具。它與目錄的主要不同點(diǎn)在于著錄的對(duì)象不同,目錄的著錄對(duì)象是整部文獻(xiàn),而題錄的著錄對(duì)象是文獻(xiàn)中的論文或部分內(nèi)容。例如:美國(guó)化學(xué)題錄、中文科技期刊題錄數(shù)據(jù)庫(kù)等。,文摘(Abstract):是系統(tǒng)著錄、報(bào)道、積累和揭示文獻(xiàn)信息外表特征和內(nèi)容特征的檢索工具,是重要的二次文獻(xiàn)。它是對(duì)文獻(xiàn)中的論文或內(nèi)容進(jìn)行濃縮,概括地描述其主要論點(diǎn)、數(shù)據(jù)、結(jié)論等,并著名其出處,按一定的規(guī)則編排起來的一種檢索工具。文摘分三種:指示性文摘、報(bào)道性文摘和評(píng)論性文摘。例如:新華文摘、經(jīng)濟(jì)學(xué)文摘等。,索引(Index):是將文獻(xiàn)信息中的題名、人名、地名、字句及參考文獻(xiàn)等分別摘錄出來,并著名出處,按一定的規(guī)則編排起來的一種檢索工具。例如:經(jīng)濟(jì)科學(xué)論文索引、社會(huì)科學(xué)引文索引(Social Science Citation Index,SSCI)等。,傳統(tǒng)的手工目錄卡片,現(xiàn)在傳統(tǒng)目錄卡片已被電子目錄替代,電子目錄各項(xiàng)著錄有序,有標(biāo)目,館藏目錄還常帶有館藏地點(diǎn)、館藏狀態(tài)、索書號(hào)等項(xiàng)列表,以下是INNOPAC的中英文電子目錄。,題錄(bibliography,bibliographic citation),也是對(duì)文獻(xiàn)外部特征的描述,由一組數(shù)據(jù)項(xiàng)的固定組合形成題錄型條目,書寫、印刷型條目如“文獻(xiàn)類型的識(shí)別”一節(jié)中的樣例。題錄一般以內(nèi)容上獨(dú)立的文獻(xiàn)單元,如一篇文章或書中某一部分、某一章節(jié)或整個(gè)出版物作為其著錄的基本單位。以下是一條電子條目。,題錄通常包括:作者(或含其所在單位)、篇名和來源出處及文種等,由出處導(dǎo)向原文。,文摘Abstract,(原意“抽取”),文摘分:,1)指示性文摘指示性文摘側(cè)重揭示文獻(xiàn)的主題、研究方法、結(jié)論、用途和參考價(jià)值,不涉及具體的內(nèi)容。,2)報(bào)導(dǎo)性文摘報(bào)導(dǎo)性文摘比較詳細(xì)地報(bào)導(dǎo)文獻(xiàn)的主要內(nèi)容、觀點(diǎn)、方法、設(shè)施,以及必要的數(shù)據(jù)、圖表和參考資料。,3)評(píng)論性文摘(critical abstract),其中包括文摘評(píng)論員的分析與評(píng)介。,文摘是對(duì)一份文獻(xiàn)的內(nèi)容做實(shí)質(zhì)性的簡(jiǎn)略、準(zhǔn)確的描述,無須補(bǔ)充解釋和評(píng)論。它用少量的文字將文獻(xiàn)濃縮加工,以揭示文獻(xiàn)的主要觀點(diǎn)、論據(jù)、數(shù)據(jù)等,是當(dāng)代報(bào)導(dǎo)學(xué)術(shù)動(dòng)態(tài)的簡(jiǎn)捷明快的方法。,檢索者可以從文摘中直接找到所需信息,如果不滿足,再去查找原文。從這個(gè)意義上說,,文摘是集書目、索引和一次文獻(xiàn),三者于一體的特殊檢索工具。,文獻(xiàn)的文摘型電子條目如下:,2.1.2.2 詞語類工具書,詞語類工具書包括各類字典、詞典,主要提供字詞的形、音、義和使用方法,以及學(xué)科名詞術(shù)語的含義、演變和發(fā)展。字典以字為單位,按一定次序排列,說明形體、讀音、意義和用法;詞典,也作辭典,以詞語為單位,按一定次序排列,解釋詞匯的概念、含義和用法。例如:辭海、漢語成語大詞典、社會(huì)科學(xué)大詞典等。,2.1.2.3 資料類工具書,資料類工具書能夠?yàn)樽x者提供各種基本知識(shí)或某一課題的具體資料。主要包括,百科全書、年鑒、手冊(cè)、名錄、類書、政書等。,百科全書是人類知識(shí)的總匯,是記錄人類知識(shí)最全面、最系統(tǒng)的大型綜合性工具書。它概述了人類切知識(shí)領(lǐng)域的基本資料,對(duì)每一學(xué)科提供定義、原理、方法、歷史及現(xiàn)狀、系統(tǒng)和參考書目等方面的資料,被譽(yù)為“工具書之王”、“沒有圍墻的大學(xué)”。年鑒是匯輯一年內(nèi)時(shí)事動(dòng)態(tài)、學(xué)科發(fā)展和各項(xiàng)統(tǒng)計(jì)資料等重要資料,按年度出版的工具書。手冊(cè)也稱指南、便覽、大全等,是把某一學(xué)科或某一專題的概括性又具體實(shí)用的知識(shí)、資料和數(shù)據(jù)匯編在一起。名錄是專門收錄人名、地名、機(jī)構(gòu)名以及其他事物名,按照一定規(guī)則進(jìn)行排序,并予以簡(jiǎn)要揭示和介紹的工具書。類書是收錄古代文獻(xiàn)資料,按類別或韻目編排,提供檢索、征引使用的工具書。政書是匯集歷代或某一朝代的政治、軍事、經(jīng)濟(jì)、文化、外交等方面的法律、法令和法規(guī)制度史料的工具書。,表譜類工具書,表譜類工具書是以表格或其他較為整齊的形式,記錄史實(shí)、時(shí)間、地理等資料,并附以簡(jiǎn)略的文字說明,以反映史實(shí)和時(shí)間。主要包括年表、歷表和專門性歷史表譜3種類型。年表是按年代順序編制,專供查考?xì)v史年代、歷史紀(jì)元及歷史大事的檢索工具。如中華人民共和國(guó)大事記等。歷表是一種把不同歷法的歷日按一定的次序匯編在一起,以相互對(duì)照的表格,提供查找和換算不同歷法的年、月、日的工具書。專門性歷史表譜主要用于查考人物、職官、地理和數(shù)據(jù)等專題資料,如中西回史日歷等。,圖錄類工具書,圖錄類工具書是以圖形、圖像、符號(hào)等為主體,附以簡(jiǎn)略的文字說明,以反映各種事物、人物的空間特征和形象特征的工具書。它包括地圖、歷史圖錄、文物圖錄、人物圖錄、藝術(shù)圖錄、科技圖像等。地圖是地球表面自然和社會(huì)現(xiàn)象在平面圖上的縮影,以反映各種事物和景象的地理分布及其在空間與時(shí)間上的相互制約、內(nèi)在聯(lián)系和發(fā)展動(dòng)態(tài)。歷史圖錄是以圖形、圖像等揭示歷史人物和事物的工具書。,邊緣類工具書,邊緣類工具書主要指那些介于工具書與非工具書之間,既具有一般圖書的閱讀功能,又具有工具書的查檢功用的文獻(xiàn)。它主要包括資料匯編、史書、方志等。資料匯編有針對(duì)性地摘編文獻(xiàn)信息的片斷或全文,按專題或?qū)W科分類編排,提供讀者閱讀或查檢。包括法規(guī)資料匯編、條約資料匯編、統(tǒng)計(jì)資料匯編等。,2.1.3 機(jī)械檢索工具,機(jī)械檢索工具是手工檢索工具向計(jì)算機(jī)檢索系統(tǒng)過渡的中間檢索工具。它主要包括兩種類型:機(jī)電檢索工具(如打孔機(jī))和光電檢索工具(如縮微機(jī))。機(jī)械檢索工具利用機(jī)械裝置改進(jìn)信息資源的存儲(chǔ)和檢索方式,但是只能對(duì)某一固定存儲(chǔ)形式的信息資源進(jìn)行特定檢索,過分依賴于設(shè)備,檢索操作復(fù)雜,成本很高,并且檢索質(zhì)量和效率也不理想。所以很快被計(jì)算機(jī)檢索系統(tǒng)所取代。,2.1.4 數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)的類型:,數(shù)據(jù)庫(kù)的類型多種多樣。數(shù)據(jù)庫(kù)有網(wǎng)狀數(shù)據(jù)庫(kù)、層次數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)、Web數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)、移動(dòng)數(shù)據(jù)庫(kù)、智能數(shù)據(jù)庫(kù)、實(shí)時(shí)數(shù)據(jù)庫(kù)、并行數(shù)據(jù)庫(kù)、分布式數(shù)據(jù)庫(kù)、聯(lián)邦式數(shù)據(jù)庫(kù)、模糊數(shù)據(jù)庫(kù)、演繹數(shù)據(jù)庫(kù)和統(tǒng)計(jì)數(shù)據(jù)庫(kù)等。,數(shù)據(jù)庫(kù)的類型1,1.按信息處理層次劃分,數(shù)據(jù)庫(kù)可分為書目數(shù)據(jù)庫(kù)、文摘數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)。,全文數(shù)據(jù)庫(kù):全文數(shù)據(jù)庫(kù)(Full-text database)是將文獻(xiàn)全文以機(jī)讀版的形式存儲(chǔ)起來,并可與相應(yīng)的軟件配合提供文中檢索和全文輸出的數(shù)據(jù)庫(kù)。,數(shù)據(jù)庫(kù)的類型2,2.按照收錄的文獻(xiàn)類型劃分,分為期刊論文數(shù)據(jù)庫(kù)、書目及圖書全文數(shù)據(jù)庫(kù)、專利數(shù)據(jù)庫(kù)、學(xué)位論文數(shù)據(jù)庫(kù)和產(chǎn)品數(shù)據(jù)庫(kù)等。,3.根據(jù)收錄文獻(xiàn)信息的范圍劃分,分為綜合性數(shù)據(jù)庫(kù)和專業(yè)性數(shù)據(jù)庫(kù)。,4.按媒體信息劃分,分為文本數(shù)據(jù)庫(kù)、數(shù)值數(shù)據(jù)庫(kù)、聲音數(shù)據(jù)庫(kù)、圖像數(shù)據(jù)庫(kù)、視頻數(shù)據(jù)庫(kù)和多媒體數(shù)據(jù)庫(kù)。,數(shù)據(jù)庫(kù)的結(jié)構(gòu),數(shù)據(jù)庫(kù)一般由文檔、記錄、字段這三個(gè)自上而下的層次構(gòu)成。,通常一個(gè)數(shù)據(jù)庫(kù)至少包括一個(gè)順排文檔和一個(gè)倒排文檔。順排文檔是按文獻(xiàn)記錄的輸入順序(即文獻(xiàn)序號(hào))排列的文檔,又稱為主文檔。它將全部記錄按照存取號(hào)的大小順序依次排列形成文獻(xiàn)信息集合,是數(shù)據(jù)庫(kù)的主體內(nèi)容。,倒排文檔,倒排文檔是把順排文檔中的標(biāo)引詞抽出,按標(biāo)引詞的字母順序依次排列而成的文檔。如果將順排文檔看作是某種印刷型檢索工具的正文部分,那么倒排文檔就相當(dāng)于它的輔助索引。,字段(Field),在文摘數(shù)據(jù)庫(kù)中,一條記錄應(yīng)包含原始文獻(xiàn)的題名、作者、出處、出版時(shí)間、分類號(hào)、文摘、主題詞或關(guān)鍵詞等字段。每一個(gè)字段都有一個(gè)相應(yīng)的標(biāo)識(shí)符,以便計(jì)算機(jī)識(shí)別。例如在Dialog系統(tǒng)中,常用標(biāo)識(shí)符及含義為:,標(biāo)識(shí)符 字段名,au=作者字段,jn=期刊名稱字段,py=出版年字段,cs=機(jī)構(gòu)名稱字段,dt=文獻(xiàn)類型字段,la=語種字段,計(jì)算機(jī)檢索系統(tǒng),計(jì)算機(jī)檢索系統(tǒng)一般可分為光盤檢索系統(tǒng)、聯(lián)機(jī)檢索系統(tǒng)和網(wǎng)絡(luò)檢索系統(tǒng)等。,聯(lián)機(jī)檢索(Online Retrieval)是20世紀(jì)60年代發(fā)展起來的一種提供人機(jī)對(duì)話的檢索技術(shù),是指用戶利用終端設(shè)備(包括檢索終端、調(diào)制解調(diào)器和打印機(jī)),通過國(guó)際(衛(wèi)星)通信網(wǎng)絡(luò),與本地計(jì)算機(jī)檢索系統(tǒng)或遠(yuǎn)程計(jì)算機(jī)檢索系統(tǒng)的主機(jī)聯(lián)結(jié),從而檢索世界各地存儲(chǔ)在計(jì)算機(jī)數(shù)據(jù)庫(kù)中的信息資料。,聯(lián)機(jī)檢索系統(tǒng),聯(lián)機(jī)檢索系統(tǒng)主要有以下四種服務(wù)方式:,(1)