《社科信息檢索工具》由會員分享,可在線閱讀,更多相關(guān)《社科信息檢索工具(39頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、*,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,社科文獻檢索,“新的力量源泉不是少數(shù)人手中的金錢,而是多數(shù)人手中的信息。”,-約翰.奈斯比特,第二 章 社科信息檢索工具,第一節(jié) 信息檢索的概念,1、檢索的起源,信息檢索起源于圖書館的參考咨詢和文摘索引工作.從19世紀下半葉開始發(fā)展,至20世紀40年代.索引和檢索已成為圖書館獨立的工具和用戶服務(wù)項目。20世紀中葉以前,信息存儲和傳播主要以紙質(zhì)介質(zhì)為載體,信息檢索活動也圍繞著文獻的獲取和控制展開。,2、檢索的基本原理,信息檢索,是指將信息按照一定的方式組織 和存儲起來,并根據(jù)用戶的需要,找出所需信息的過程。,
2、廣義,的信息檢索包括信息的存儲和檢索兩個過程,而,狹義,的信息檢索只包括后一個過程,即為處理解決各種問題而查找,信息的存儲過程就是按照主題詞表或分類表及使用原則對原始信息資源進行處理,形成信息特征標識,為檢索提供經(jīng)過整序的信息集合的過程。,信息檢索的過程往往需要一個評價反饋途徑,多次比較匹配,以獲得最終的檢索結(jié)果。其圖示如下:,3、信息檢索手段,從技術(shù)手段上分:手工檢索(手檢)和計算機檢索(機檢),手工檢索(manual retrieval)使用的多為印刷型或書本型檢索(paper-based retrieval)工具,早些有檢索卡片,現(xiàn)在使用最多的是檢索刊,它們定期地將最新收集到的信息、文獻
3、加以匯總、組織和報道。手檢的技術(shù)要求不高,以人的勞動為本,由人來翻閱,由人來進行比較、選擇,完成匹配。手檢工具能提供的檢索點十分有限,檢索結(jié)果往往不盡人意。,計算機檢索(computer-based retrieval),它通過數(shù)據(jù)庫系統(tǒng)來實現(xiàn)的。檢索系統(tǒng)包括:計算機主機設(shè)備、外部存貯器、輸入輸出設(shè)備、終端設(shè)備、通信設(shè)備等硬件設(shè)施,還需要控制、提供檢索的軟件系統(tǒng),包括:通信軟件、操作系統(tǒng)、應(yīng)用程序等,以實現(xiàn)對數(shù)據(jù)庫的信息存取。檢索過程是在人與機器的合作、協(xié)同下完成的,它們經(jīng)常用實時的(real time)、交互的(interactive)的方式從計算機存貯的大量數(shù)據(jù)中自動分揀出用戶所需要的信息
4、。計算、比較、選擇的匹配任務(wù)是由機器來執(zhí)行的,而人則是整個檢索方案的設(shè)計者和操縱者。,計算機檢索的優(yōu)勢,計算機檢索明顯優(yōu)于手工檢索,主要表現(xiàn):,檢索的信息量大、,數(shù)據(jù)更新快、,檢索功能強、,檢索結(jié)果輸出的多樣性。,第二節(jié)社科信息檢索工具,2.1.1 檢索工具的定義,檢索工具是人們用來報道、存儲和查找各類信息的工具。包括傳統(tǒng)的二次、三次印刷型檢索工具,縮微閱讀檢索工具,基于計算機的光盤檢索系統(tǒng)、聯(lián)機檢索系統(tǒng),以及基于Internet的網(wǎng)絡(luò)信息檢索系統(tǒng)、網(wǎng)上工具書、搜索引擎、Archie、Wais等各種信息檢索工具和檢索系統(tǒng)。,檢索工具的類型,按照檢索手段的不同,檢索工具可分為,手工檢索工具、,機
5、械檢索工具,和,計算機檢索系統(tǒng),。,按照著錄形式的不同可分為:目錄型檢索工具、題錄型檢索工具、索引型檢索工具、文摘型檢索工具、全文型檢索工具等。,按照載體形式的不同可分為:書本式檢索工具、卡片式檢索工具、縮微式檢索工具和機讀式檢索工具等。,2.1.2 手工檢索工具,手工檢索工具是傳統(tǒng)的檢索工具,主要是各種類型的工具書。工具書是人們根據(jù)一定的需要,廣泛收集某一范圍的有關(guān)資料,按特定體例或方式編排,提供基本知識和文獻線索的一種特殊類型的圖書,是檢索文獻信息的重要工具。,根據(jù)工具書的體例和功用,可分為,檢索類工具書,、,詞語類工具書,、,資料類工具書,、,表譜類工具書,、,圖錄類工具書,和,邊緣類工
6、具書,六種類型。,下面對此分別介紹,2.1.2.1 檢索類工具書,按著錄內(nèi)容劃分,檢索類工具書大致可分為以下四種:目錄、題錄、文摘、索引。,目錄(Bibliography/Catalogue):通常是以文獻的“本”、“種”、“件”等為單位,對一批相關(guān)文獻外表特征的揭示和報道。例如:全國新書目、全國總書目、全國報刊簡明目錄等。,題錄(Title):它報道和揭示單篇文獻的外表特征,是在目錄的基礎(chǔ)上發(fā)展起來的一種檢索工具。它與目錄的主要不同點在于著錄的對象不同,目錄的著錄對象是整部文獻,而題錄的著錄對象是文獻中的論文或部分內(nèi)容。例如:美國化學題錄、中文科技期刊題錄數(shù)據(jù)庫等。,文摘(Abstract)
7、:是系統(tǒng)著錄、報道、積累和揭示文獻信息外表特征和內(nèi)容特征的檢索工具,是重要的二次文獻。它是對文獻中的論文或內(nèi)容進行濃縮,概括地描述其主要論點、數(shù)據(jù)、結(jié)論等,并著名其出處,按一定的規(guī)則編排起來的一種檢索工具。文摘分三種:指示性文摘、報道性文摘和評論性文摘。例如:新華文摘、經(jīng)濟學文摘等。,索引(Index):是將文獻信息中的題名、人名、地名、字句及參考文獻等分別摘錄出來,并著名出處,按一定的規(guī)則編排起來的一種檢索工具。例如:經(jīng)濟科學論文索引、社會科學引文索引(Social Science Citation Index,SSCI)等。,傳統(tǒng)的手工目錄卡片,現(xiàn)在傳統(tǒng)目錄卡片已被電子目錄替代,電子目錄各
8、項著錄有序,有標目,館藏目錄還常帶有館藏地點、館藏狀態(tài)、索書號等項列表,以下是INNOPAC的中英文電子目錄。,題錄(bibliography,bibliographic citation),也是對文獻外部特征的描述,由一組數(shù)據(jù)項的固定組合形成題錄型條目,書寫、印刷型條目如“文獻類型的識別”一節(jié)中的樣例。題錄一般以內(nèi)容上獨立的文獻單元,如一篇文章或書中某一部分、某一章節(jié)或整個出版物作為其著錄的基本單位。以下是一條電子條目。,題錄通常包括:作者(或含其所在單位)、篇名和來源出處及文種等,由出處導向原文。,文摘Abstract,(原意“抽取”),文摘分:,1)指示性文摘指示性文摘側(cè)重揭示文獻的主題
9、、研究方法、結(jié)論、用途和參考價值,不涉及具體的內(nèi)容。,2)報導性文摘報導性文摘比較詳細地報導文獻的主要內(nèi)容、觀點、方法、設(shè)施,以及必要的數(shù)據(jù)、圖表和參考資料。,3)評論性文摘(critical abstract),其中包括文摘評論員的分析與評介。,文摘是對一份文獻的內(nèi)容做實質(zhì)性的簡略、準確的描述,無須補充解釋和評論。它用少量的文字將文獻濃縮加工,以揭示文獻的主要觀點、論據(jù)、數(shù)據(jù)等,是當代報導學術(shù)動態(tài)的簡捷明快的方法。,檢索者可以從文摘中直接找到所需信息,如果不滿足,再去查找原文。從這個意義上說,,文摘是集書目、索引和一次文獻,三者于一體的特殊檢索工具。,文獻的文摘型電子條目如下:,2.1.2.
10、2 詞語類工具書,詞語類工具書包括各類字典、詞典,主要提供字詞的形、音、義和使用方法,以及學科名詞術(shù)語的含義、演變和發(fā)展。字典以字為單位,按一定次序排列,說明形體、讀音、意義和用法;詞典,也作辭典,以詞語為單位,按一定次序排列,解釋詞匯的概念、含義和用法。例如:辭海、漢語成語大詞典、社會科學大詞典等。,2.1.2.3 資料類工具書,資料類工具書能夠為讀者提供各種基本知識或某一課題的具體資料。主要包括,百科全書、年鑒、手冊、名錄、類書、政書等。,百科全書是人類知識的總匯,是記錄人類知識最全面、最系統(tǒng)的大型綜合性工具書。它概述了人類切知識領(lǐng)域的基本資料,對每一學科提供定義、原理、方法、歷史及現(xiàn)狀、
11、系統(tǒng)和參考書目等方面的資料,被譽為“工具書之王”、“沒有圍墻的大學”。年鑒是匯輯一年內(nèi)時事動態(tài)、學科發(fā)展和各項統(tǒng)計資料等重要資料,按年度出版的工具書。手冊也稱指南、便覽、大全等,是把某一學科或某一專題的概括性又具體實用的知識、資料和數(shù)據(jù)匯編在一起。名錄是專門收錄人名、地名、機構(gòu)名以及其他事物名,按照一定規(guī)則進行排序,并予以簡要揭示和介紹的工具書。類書是收錄古代文獻資料,按類別或韻目編排,提供檢索、征引使用的工具書。政書是匯集歷代或某一朝代的政治、軍事、經(jīng)濟、文化、外交等方面的法律、法令和法規(guī)制度史料的工具書。,表譜類工具書,表譜類工具書是以表格或其他較為整齊的形式,記錄史實、時間、地理等資料,
12、并附以簡略的文字說明,以反映史實和時間。主要包括年表、歷表和專門性歷史表譜3種類型。年表是按年代順序編制,專供查考歷史年代、歷史紀元及歷史大事的檢索工具。如中華人民共和國大事記等。歷表是一種把不同歷法的歷日按一定的次序匯編在一起,以相互對照的表格,提供查找和換算不同歷法的年、月、日的工具書。專門性歷史表譜主要用于查考人物、職官、地理和數(shù)據(jù)等專題資料,如中西回史日歷等。,圖錄類工具書,圖錄類工具書是以圖形、圖像、符號等為主體,附以簡略的文字說明,以反映各種事物、人物的空間特征和形象特征的工具書。它包括地圖、歷史圖錄、文物圖錄、人物圖錄、藝術(shù)圖錄、科技圖像等。地圖是地球表面自然和社會現(xiàn)象在平面圖上
13、的縮影,以反映各種事物和景象的地理分布及其在空間與時間上的相互制約、內(nèi)在聯(lián)系和發(fā)展動態(tài)。歷史圖錄是以圖形、圖像等揭示歷史人物和事物的工具書。,邊緣類工具書,邊緣類工具書主要指那些介于工具書與非工具書之間,既具有一般圖書的閱讀功能,又具有工具書的查檢功用的文獻。它主要包括資料匯編、史書、方志等。資料匯編有針對性地摘編文獻信息的片斷或全文,按專題或?qū)W科分類編排,提供讀者閱讀或查檢。包括法規(guī)資料匯編、條約資料匯編、統(tǒng)計資料匯編等。,2.1.3 機械檢索工具,機械檢索工具是手工檢索工具向計算機檢索系統(tǒng)過渡的中間檢索工具。它主要包括兩種類型:機電檢索工具(如打孔機)和光電檢索工具(如縮微機)。機械檢索工
14、具利用機械裝置改進信息資源的存儲和檢索方式,但是只能對某一固定存儲形式的信息資源進行特定檢索,過分依賴于設(shè)備,檢索操作復雜,成本很高,并且檢索質(zhì)量和效率也不理想。所以很快被計算機檢索系統(tǒng)所取代。,2.1.4 數(shù)據(jù)庫,數(shù)據(jù)庫的類型:,數(shù)據(jù)庫的類型多種多樣。數(shù)據(jù)庫有網(wǎng)狀數(shù)據(jù)庫、層次數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、Web數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、移動數(shù)據(jù)庫、智能數(shù)據(jù)庫、實時數(shù)據(jù)庫、并行數(shù)據(jù)庫、分布式數(shù)據(jù)庫、聯(lián)邦式數(shù)據(jù)庫、模糊數(shù)據(jù)庫、演繹數(shù)據(jù)庫和統(tǒng)計數(shù)據(jù)庫等。,數(shù)據(jù)庫的類型1,1.按信息處理層次劃分,數(shù)據(jù)庫可分為書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫和全文數(shù)據(jù)庫。,全文數(shù)據(jù)庫:全文數(shù)據(jù)庫(Full-text database)是
15、將文獻全文以機讀版的形式存儲起來,并可與相應(yīng)的軟件配合提供文中檢索和全文輸出的數(shù)據(jù)庫。,數(shù)據(jù)庫的類型2,2.按照收錄的文獻類型劃分,分為期刊論文數(shù)據(jù)庫、書目及圖書全文數(shù)據(jù)庫、專利數(shù)據(jù)庫、學位論文數(shù)據(jù)庫和產(chǎn)品數(shù)據(jù)庫等。,3.根據(jù)收錄文獻信息的范圍劃分,分為綜合性數(shù)據(jù)庫和專業(yè)性數(shù)據(jù)庫。,4.按媒體信息劃分,分為文本數(shù)據(jù)庫、數(shù)值數(shù)據(jù)庫、聲音數(shù)據(jù)庫、圖像數(shù)據(jù)庫、視頻數(shù)據(jù)庫和多媒體數(shù)據(jù)庫。,數(shù)據(jù)庫的結(jié)構(gòu),數(shù)據(jù)庫一般由文檔、記錄、字段這三個自上而下的層次構(gòu)成。,通常一個數(shù)據(jù)庫至少包括一個順排文檔和一個倒排文檔。順排文檔是按文獻記錄的輸入順序(即文獻序號)排列的文檔,又稱為主文檔。它將全部記錄按照存取號的大
16、小順序依次排列形成文獻信息集合,是數(shù)據(jù)庫的主體內(nèi)容。,倒排文檔,倒排文檔是把順排文檔中的標引詞抽出,按標引詞的字母順序依次排列而成的文檔。如果將順排文檔看作是某種印刷型檢索工具的正文部分,那么倒排文檔就相當于它的輔助索引。,字段(Field),在文摘數(shù)據(jù)庫中,一條記錄應(yīng)包含原始文獻的題名、作者、出處、出版時間、分類號、文摘、主題詞或關(guān)鍵詞等字段。每一個字段都有一個相應(yīng)的標識符,以便計算機識別。例如在Dialog系統(tǒng)中,常用標識符及含義為:,標識符 字段名,au=作者字段,jn=期刊名稱字段,py=出版年字段,cs=機構(gòu)名稱字段,dt=文獻類型字段,la=語種字段,計算機檢索系統(tǒng),計算機檢索系統(tǒng)一般可分為光盤檢索系統(tǒng)、聯(lián)機檢索系統(tǒng)和網(wǎng)絡(luò)檢索系統(tǒng)等。,聯(lián)機檢索(Online Retrieval)是20世紀60年代發(fā)展起來的一種提供人機對話的檢索技術(shù),是指用戶利用終端設(shè)備(包括檢索終端、調(diào)制解調(diào)器和打印機),通過國際(衛(wèi)星)通信網(wǎng)絡(luò),與本地計算機檢索系統(tǒng)或遠程計算機檢索系統(tǒng)的主機聯(lián)結(jié),從而檢索世界各地存儲在計算機數(shù)據(jù)庫中的信息資料。,聯(lián)機檢索系統(tǒng),聯(lián)機檢索系統(tǒng)主要有以下四種服務(wù)方式:,(1)