《人工智能在第二語言教學中的應(yīng)用—提高對于偏誤的意識》導(dǎo)讀一
《《人工智能在第二語言教學中的應(yīng)用—提高對于偏誤的意識》導(dǎo)讀一》由會員分享,可在線閱讀,更多相關(guān)《《人工智能在第二語言教學中的應(yīng)用—提高對于偏誤的意識》導(dǎo)讀一(14頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、— 提高對于偏誤的意識》導(dǎo)讀 馮志偉 ICALL 的發(fā)展歷程 本書是關(guān)于“人工智能計算機輔助語言教學” ( Intelligent Computer Assisted Language Learning ,簡稱 ICALL )的專著。 ICALL 是由“計算機輔助語言教學” ( Computer Assisted Language Learning ,簡稱 CALL )發(fā)展來的,而 CALL 又是“計算機輔助教學” ( Computer Assisted Learning ,簡稱 CAL )的一個領(lǐng)域。為了幫助讀者理解 ICALL 的基本原理和方法, 我們有必要介紹一下從 CAL
2、 到 CALL ,再由 CALL 到 ICALL 的發(fā)展歷程。 在電子計算機問世之初,就有人設(shè)想把它用于教學。在 20 世紀 50 年代和 60 年代之 交,美國就開始研究“計算機輔助教學” ( CAL )的問題了。 美國最早開始 CAL 試驗的是 IBM 公司的沃斯頓研究中心。該中心于 1958 年設(shè)計了第 一個計算機輔助教學系統(tǒng), 利用一臺 IBM650 計算機連接一臺電傳打字機來教小學生學習二 進制算術(shù),并能根據(jù)小學生的要求自動地生成練習題。 1959 年,美國伊利諾依大學研制出 PLATO 計算機輔助教學系統(tǒng)( Programmed Logic for Automatic
3、Teaching Operation, 簡稱 PLATO ) ,該系統(tǒng)在 CDC 計算機公司的協(xié)助下,經(jīng)過二十多年的努力,從一次只能處理一 個終端的 PLATO-I 系統(tǒng)發(fā)展到帶有四百多個終端的 PLATO-II 系統(tǒng),可以講授幾百種課程。 美國斯坦福大學從 1963 年開始,利用計算機講授邏輯學導(dǎo)輪、集合論、程序設(shè)計、俄語、 德語等課程,并與 IBM 公司合作,在 1966 年研制出 IBM1500 教學系統(tǒng),這個系統(tǒng)除了能 開設(shè)數(shù)理邏輯、多種外國語、哲學、數(shù)學、音樂理論等課程之外,還有一些為小學生和聾啞 學生準備的課程,提供全國性服務(wù)。 1971 年,德克薩斯大學與猶他州的楊伯
4、翰大學和梅特 ( MITRE ) 公司合作, 設(shè)計出 TICCIT 計算機輔助教學系統(tǒng) ( Time-shared Interactive Computer Controlled Information Television, 簡稱 TICCIT ) ,這個系統(tǒng)以電視技術(shù)為基礎(chǔ),配合兩臺 NOVA-800 小型計算機,帶有 75 兆字節(jié)的磁盤存貯器,終端為經(jīng)過改裝的配有鍵盤的彩色 電視機,其主機通過同軸電纜與 128 臺彩色電視機終端相連接。 TICCIT 系統(tǒng)主要用于社會 大學的數(shù)學和英語教學。 加拿大、英國、日本等國也開展了 CAL 的研究。加拿大國家研究院、安大略教育研究
5、所和女王大學等 11 所大聯(lián)合開展計算機輔助語言教學系統(tǒng) CAN 的研制,開發(fā)了數(shù)學、工 程、醫(yī)學、商業(yè)等學科的課件( course ware ) 。英國在開放大學中推廣使用計算機輔助教學, 開放大學有 280 個學習中心,各個學習中心都設(shè)有終端,通過全國計算機網(wǎng)絡(luò)與該大學的 計算中心相連, 為學生解答各種問題。 日本機器工業(yè)促進會研制了一個計算機輔助教學系統(tǒng), 該系統(tǒng)能同時控制 30 個學習終端,開設(shè)了計算機原理、計算機語言、數(shù)控機床等課程。 在計算機輔助教學 CAL 的諸多領(lǐng)域中, 與語言學最為密切的是 “計算機輔助語言教學” ( CALL ) ,在進行計算機輔助語言教學 CA
6、LL 的時候,計算機要按照人們事先安排好的語 言教學計劃進行課堂教學和輔助課外操練。前面介紹過的 PLATO 系統(tǒng)除了進行一般的計算 機輔助教學之外,也能進行計算機輔助語言教學, PLATO 可以講授漢語、英語、法語、俄 語、希臘語、拉丁語、西班牙語和世界語等八種語言課程。斯坦福大學的系統(tǒng)也可以講授俄 語、德語等語言課程, TICCIT 系統(tǒng)也可以進行英語教學。在這個時期,還設(shè)計了一些用于 CALL 的教學軟件,如 ECLIPSE , SEQUITUR 等,這些軟件對于計算機硬件的要求不高, 程序也比較容易掌握,逐漸在 CALL 教學中普及開來。 當時從事 CALL 的一些專家,
7、如 Higgins, Tim Jones, Graham, Tony Williams 等,他們原 來都是語言教師,但是,他們在實踐中更新了知識,很快掌握了 CALL 技術(shù),成為了 CALL 教學的開創(chuàng)人。 CALL 是一種新型的語言教學方式,是對于傳統(tǒng)語言教學方式的具有重大意義的改革。 美國的語言教學在第一次世界大戰(zhàn)前后,主要采用傳統(tǒng)的“教授語法加翻譯”的方式,培養(yǎng) 讀和寫的能力。在第二次世界大戰(zhàn)前后,由于錄音機的使用, “聽說”教學的方式應(yīng)運而生, 各地學校都設(shè)置了語言實驗室。 由于社會語言學、 心理語言學、 計算語言學這些邊緣學科的 發(fā)展, 人們對于語言交際有了更深的認識,
8、在外語教學中更加強調(diào)人與人之間的語言交際本 領(lǐng)及其心理、 文化基礎(chǔ)。 在這種情況下, 計算機就成了一種非常適合的語言教學的培訓工具, 因此, CALL 受到了語言教學工作者的普遍歡迎。 CALL 一般可以分為四種類型: ①講授型: 計算機向?qū)W生提供講授的教材, 學生通過計算機顯示屏上顯示的課文進行學 習。 ②操練型:計算機向?qū)W生提供各種練習題,學生即時回答,計算機作出評價,并決定學 生是復(fù)習前一課的課文,還是學習下一課。 ③模擬型:利用計算機的動畫、語聲、圖形顯示、圖表繪制等功能,通過逼真地模擬人 們?nèi)粘I畹膶嶋H情景,讓學生在這種環(huán)境的刺激和誘導(dǎo)下,作出恰當?shù)恼Z言反應(yīng)。 講
9、授型、操練型和模擬型的計算機軟件都是“課件” ( courseware) 。 ④工具型: 由計算機給語言教師的教學或研究工作提供必要的智力工具, 它是面向教師 的, 而不是面向?qū)W生的。 工具型軟件又可以分為兩類: 一類是為教師編制上述三種課件提供 特殊的程序設(shè)計語言,稱為“編著語言” ,一類是能給教師起智力助手作用的軟件,例如, 幫助教師自動地編制索引,統(tǒng)計詞匯,分析句型,擬出試題,分析考試結(jié)果等。 由于運行課件所形成的計算機輔助語言教學環(huán)境,在教育方面具有下面的優(yōu)點: ①自定步調(diào): 學生的學習能力自然地決定了課件運行的速度, 能力強的學生可學習得快 一些,能力差的學生可學習得慢
10、一些,做到了“因材施教” 。 ②減輕學生的心理負擔: 計算機總是耐心地、 循循善誘地指導(dǎo)學生學習, 鼓勵學生達到 預(yù)期的效果,從不會表露出任何的喜怒哀樂,這樣便大大地減輕了學生的心理負擔。 ③課件能夠博采眾長,吸收多位專家和教師的經(jīng)驗。 ④便于積累教學資料和保存學生學習檔案。 工具型軟件的優(yōu)點是能提高教師備課、 教學、 研究等活動的效率, 使他們的精力集中到 更有創(chuàng)造性的方面去。 CALL 課件的典型工作過程如下: ①計算機把信息,如課文、語法說明等,通過計算機顯示屏設(shè)備呈現(xiàn)在學生面前,讓他 們閱讀、學習。 ②計算機根據(jù)顯示的教材,向?qū)W生提出有關(guān)問題,讓學生作練習,并等待學生回
11、答。 ③學生使用鍵盤等輸入設(shè)備回答問題, 計算機對學生的答案做出 “對” 或“錯” 等判斷。 ④如果答案為 “錯” , 計算機指示學生重做, 或者重新學習原來的課程; 如果答案為 “對” , 計算機會對學生給予某種鼓勵,并轉(zhuǎn)入下一步的聯(lián)系或?qū)W習新的課文。 體現(xiàn)上述功能的 CALL 課件,是語言學家、語言教師、心理學家和計算機科學家密切 合作的產(chǎn)物。 語言學家首先根據(jù)學科內(nèi)容提出某一課題的教材, 再由語言教師指出學習重點 和教學方法, 心理學家則制定編寫教學方案和評定學習效果的原則, 然后由計算機科學家把 上述材料編制成課件,經(jīng)過反復(fù)演示、修改,成為投放技術(shù)市場的課件。 CALL
12、所需要的技術(shù)是廣泛而多樣的,計算機和信息處理的許多技術(shù)都可以在 CALL 中大顯身手。 計算機圖象和動畫已經(jīng)成了課件的重要組成部分, 言語合成促使計算機逼真地 模仿教師的聲音,語音識別則使學生的口答信息有可能進入計算機。 多媒體( multimedia )技術(shù)是計算機技術(shù)關(guān)注的熱點之一,所謂多媒體技術(shù),就是交互 式綜合處理文本、圖形、圖像、聲音等多種媒體信息,使多種信息之間建立邏輯連接,集成 為一個系統(tǒng), 把計算機技術(shù)、 聲像技術(shù)和通訊技術(shù)融為一體。 多媒體技術(shù)能使信息傳播者和 接受者之間實時地進行交換, 它的集成性高, 交互性強。 由于多媒體的數(shù)據(jù)類型不僅包括文 本, 而且還包括
13、仿真圖像、 立體聲音響、 運動視頻圖像等人類最習慣的視聽媒體信息, 所以, 多媒體技術(shù)為 CALL 開辟了一個新的天地。在 CALL 教學中,為了便于學生直接地向計算 機輸入答案或信息, 可以使用 “觸摸屏” 設(shè)備, 利用手指在顯示屏上的觸感而輸入信息。 計 算機與光盤 CD-ROM 的結(jié)合,使得 CALL 所需要的文字、語音與圖像可以存貯在同一介質(zhì) 里,應(yīng)用起來極為方便。數(shù)據(jù)庫的發(fā)展,使得課件、智能助手等的研制和利用有了更好的軟 件工具。 一些著名的 CALL 課件,如歐洲的 LINGUA 、澳大利亞的 CUTSD 等,都以多媒 體 CD-ROM 的形式作為商品在世界各地出售。
14、 CALL 代表著一種新的語言教育方式, 它具有很強的個別化教學功能, 可同時對一批學 生因材施教, 最能適應(yīng)以學生為中心的開放式教學。 隨著科學技術(shù)的進一步發(fā)展, 以計算機 為主體, 配以光纖通訊和衛(wèi)星傳播, 可組成計算機輔助教學的局域網(wǎng)絡(luò), 使眾多的學習者不 僅可以共享局域網(wǎng)絡(luò)中所有的教育資源,而且還可以在家里用微機采用通訊的方式進行學 習,這必將使教育發(fā)生巨大的變化,對于普及教育大有好處。 CALL 充分地利用了計算機科學、 信息技術(shù)、 心理學和自然語言處理 ( Natural Language Processing 簡稱 NLP )的新成果,進一步提高了軟件的性能。許多自然
15、語言處理的方法和技 術(shù)都可以在 CALL 中找到自己的用途。例如,將教師的智能助手逐步擴充為一個能夠理解 自然語言的系統(tǒng), 計算機可以自動命題, 可以對學生的回答進行簡單的自動句法分析, 可以 通過語音識別來理解學生用自然語言口頭形式做出的回答, 并通過語音合成向?qū)W生提供評分 結(jié)果,等等。 傳統(tǒng) CALL 的教材和各種資料,或者存儲在計算機的數(shù)據(jù)庫里面,或者以課件的形式 存儲 CD-ROM 里,在教學中,語言學習者與計算機的交互,主要通過查詢數(shù)據(jù)庫或者 CD-ROM 來進行,數(shù)據(jù)庫或 CD-ROM 本身只能存儲數(shù)據(jù),進行查詢的時候,一般應(yīng)用簡單 的模式匹配技術(shù)就可以得到查詢的結(jié)
16、果,盡管某些 CALL 系統(tǒng)也使用了自然語言處理中的 自動分析技術(shù),但是,自動分析的針對性不強,沒有充分注意提高學習者對于偏誤的意識, 而且, CALL 教學網(wǎng)絡(luò)基本上都是局域網(wǎng)絡(luò),網(wǎng)絡(luò)之間只能在局部范圍內(nèi)鏈接,鏈接的范圍 受到限制,更不能在非常廣闊的范圍甚至在全世界范圍內(nèi)聯(lián)網(wǎng)。所以,這樣的 CALL 的智 能( Intelligent )不強。 如果 CALL 系統(tǒng)采用自然語言處理的技術(shù)來自動地分析句子,對于各種提問和回答的 句子有針對性地進行自動分析, 指出學習者的偏誤, 幫助他們糾正這樣的偏誤; 并且在 CALL 中使用互聯(lián)網(wǎng) WWW ,針對不同學習者的特點,通過 WWW
17、與語言學習者進行個性化的自 由交互,進一步使用人工智能( Artificial Intelligent )技術(shù),那么,這樣的 CALL 系統(tǒng)就具 備了較高的智能,就可以把它叫做“智能計算機輔助語言教學系統(tǒng)” ( ICALL ) 。 CALL 把語言教學與計算機結(jié)合起來, ICALL 又進一步把語言教學與人工智能技術(shù)結(jié) 合起來。 這些情況清楚地說明, 語言教學這個古老的學科正在走向現(xiàn)代化, 語言教學已經(jīng)與 當代最先進的計算機技術(shù)和人工智能技術(shù)結(jié)合起來。 這是語言教學中具有歷史意義的重大變 化,而這樣的變化,是科學家們長期艱苦探索的結(jié)果。 早在計算機出現(xiàn)以前, 英國數(shù)學家 A. M.
18、 Turing 就預(yù)見到未來的計算機將會對語言研究 提出新的問題。 他在 1936 年發(fā)表的《機器能思維嗎》一文中指出: “我們可以期待,總有一天機器會 同人在一切的智能領(lǐng)域里競爭起來。 但是, 以哪一點作為競爭的出發(fā)點呢?這是一個很難決 定的問題。 許多人以為可以把下棋之類的極為抽象的活動作為最好的出發(fā)點, 不過, 我更傾 向于支持另一種主張, 這種主張認為, 最好的出發(fā)點是制造出一種具有智能的、 可用錢買到 的機器, 然后, 教這種機器理解英語并且說英語。 這個過程可以仿效小孩子說話的那種辦法 來進行。 ” Turing 提出, 檢驗計算機智能高低的最好辦法是讓計算機來講英語和
19、理解英語, 他天才地預(yù)見到計算機和語言研究將會結(jié)下不解之緣。 美國語言學家 N. Chomsky 在計算機出現(xiàn)的初期也不約而同地把計算機程序設(shè)計語言與 自然語言置于相同的平面上,用統(tǒng)一的觀點進行研究和界說。 N. Chomsky 在 1963 年發(fā)表的《自然語言形式分析導(dǎo)論》一文中,從數(shù)學的角度給語 言提出了新的定義, 指出: “ 這個定義既適用于自然語言, 又適用于邏輯和計算機程序設(shè)計 理論中的人造語言” 。在同年發(fā)表的《語法的形式特性》一文中,他專門用了一節(jié)的篇幅來 論述程序設(shè)計語言,討論了有關(guān)程序設(shè)計語言的編譯程序問題,這些問題,是作為“組成成 分結(jié)構(gòu)的語法的形式研究”
20、,從數(shù)學的角度提出來,并從計算機科學理論的角度來探討的。 他在《上下文無關(guān)語言的代數(shù)理論》一文中提出: “我們這里要考慮的是各種生成句子的裝 置, 它們又以各種各樣的方式, 同自然語言的語法和各種人造語言的語法二者都有著密切的 聯(lián)系。我們將把語言直接地看成在符號的某一有限集合 V 中的符號串的集合,而 V 就叫 做該語言的詞匯 ,我們把語法看成是對程序設(shè)計語言的詳細說明,而把符號串看成是程 序。 ”在這里喬姆斯基把自然語言和程序設(shè)計語言放在同一平面上,從數(shù)學和計算機科學的 角度,用統(tǒng)一的觀點來加以考察,對“語言” 、 “詞匯”等語言學中的基本概念,獲得了高度 抽象化的認識。
21、 Turing 和 Chomsky 都是當代第一流的學者。 Turing 是現(xiàn)代計算機科學理論的奠基人, 而 Chomsky 則是生成語法學派的奠基人。他們以學術(shù)大師特有的遠見卓識,指出了計算機 與語言的密切聯(lián)系,他們的思想成為了爾后 CALL 和 ICALL 研究取之不盡的源泉。 在 1956 年夏天,美國計算機科學界、信息工程界的幾位頂尖級學者 John McCarthy , Marvin Minsky , Claude Shannon 和 Nathaniel Rochester 等匯聚到一起,組成了一個為期兩個 月的研究組,討論關(guān)于他們稱之為“人工智能” ( Artificia
22、l Intelligence ,簡稱 AI )的問題, 從此, “人工智能”這個新學科便誕生了。盡管有少數(shù)的 AI 研究者著重于研究隨機算法和 統(tǒng)計算法(包括概率模型和神經(jīng)網(wǎng)絡(luò)) ,但是大多數(shù)的 AI 研究者著重研究推理和邏輯問題。 典型的例子是 Newell 和 Simon 關(guān)于“邏輯理論家” ( Logic Theorist )和“通用問題解答器” ( General Problem Solver )的研究工作。這些簡單的系統(tǒng)把模式匹配和關(guān)鍵詞搜索與簡單試 探的方法結(jié)合起來進行推理和自動問答,它們都只能在某一個領(lǐng)域內(nèi)使用。在 20 世紀 60 年代末期, 學者們又研制了更多的形
23、式邏輯系統(tǒng)。 人工智能的一個重要研究方向是自然語言 理解( Natural Language Understanding ,簡稱 NLU ) 。由于人類的智能活動與語言有密切的 關(guān)系,語言往往成為觀察人類智能活動的窗口,這就為在 CALL 中導(dǎo)入人工智能的方法提 供了有利的條件, ICALL 的研究便成為理所當然的了。 ICALL 與 CALL 的差別主要體現(xiàn)在兩個方面: 第一, ICALL 使用的句子的自動分析技術(shù),能夠針對第二語言學習者的特點,對 于他們造出的句子進行自動分析,給出句子的自動分析結(jié)果,并指出偏誤 的所在,從而提高第二語言學習者對于學習中偏誤的意識,自覺地糾正偏
24、 誤; 而 CALL 主要使用數(shù)據(jù)庫或 CD-ROM 的存儲技術(shù)來存儲 CALL 的信息, 并使用簡單的模式匹配技術(shù)來判別學習者的回答是否正確,盡管有一些 CALL 系統(tǒng)也使用了自然語言處理的自動分析技術(shù)來進行簡單的自動句法 分析,但是,對于第二語言學習者在學習中偏誤注意不夠,針對性不強。 第二, ICALL使用互聯(lián)網(wǎng)(Web)在非常廣闊的范圍內(nèi)甚至在世界各地進行聯(lián)網(wǎng), 廣泛使用超文本(Hypertext)技術(shù)和超鏈接(Hyperlink)技術(shù),而 CALL 的網(wǎng)絡(luò)只能在局部范圍內(nèi)鏈接,可以使用多媒體技術(shù),但是,沒有使用超 文本技術(shù)和超鏈接技術(shù)。 因此,不論是 CALL 還是
25、 ICALL ,它們與自然語言的自動分析技術(shù)都有著非常密切的 關(guān)系,而 ICALL 是使用 Web 來進行教學,與 Web 有密切關(guān)系。為了幫助讀者理解本書中 有關(guān)自然語言自動分析和 Web 的內(nèi)容,我們介紹一下有關(guān)的背景知識。 二、 有關(guān)背景知識 自然語言的自動分析主要是以 Chomsky 的“形式語言理論” ( Formal Language Theory ) 作為理論基礎(chǔ)的。 Chomsky 的形式語言理論是影響最大的自然語言處理的句法理論。喬姆 斯基定義了 0 型語法(0 type grammar)、上下文無關(guān)語法( context free grammar)、上下文 有關(guān)語
26、法(context sensitive grammar)和正則語法(regular grammar)四種類型的形式語法。 其中的上下文無關(guān)語法又叫做"短語結(jié)構(gòu)語法" (Phrase Structure Grammar,簡稱PSG)。這 種短語結(jié)構(gòu)語法廣泛地應(yīng)用于自然語言的自動分析和生成中, 基于短語結(jié)構(gòu)語法的自動句法 分析技術(shù)有移進 -規(guī)約分析法( shift-reduce parse) 、自底向上分析法( top-down parse ) 、自頂 向下分析法( bottom-up parse) 、線圖分析法( chart parse) 、 Earley 算法( Earley algor
27、ithm ) 、 左角分析法 (left corner parse)、 富田算法 (Tomita parse) 等。 但是,人們不久就發(fā)現(xiàn),短語結(jié)構(gòu)語法的分析能力不高,分析時難以區(qū)分大量的歧義 句子, 短語結(jié)構(gòu)語法的生成能力過強, 往往會生成大量的不合語法的句子。 就是喬姆斯基本 人,也認為短語結(jié)構(gòu)語法不能充分地描述自然語言。于是 Chomsky 提出轉(zhuǎn)換語法來克服短 語結(jié)構(gòu)語法的這些弱點,后來轉(zhuǎn)換語法逐漸發(fā)展成為轉(zhuǎn)換生成語法, Chomsky 又提出管約 理論( Government Binding Theory ,簡稱 GB 理論) ,原則參數(shù)理論( Principle-Par
28、ameters Theory,簡稱PPT理論)和最間方案(Minimalism Project ,簡稱 MP),不斷地改善生成轉(zhuǎn) 換語法。盡管 Chomsky 的理論在語言學上有深刻的價值,不過,這種生成轉(zhuǎn)換語法的分析 效率不高,并沒有在實際的自然語言處理系統(tǒng)中受到歡迎。 由于短語結(jié)構(gòu)語法結(jié)構(gòu)清晰,易于操作,自然語言處理的學者們拋棄了轉(zhuǎn)換生成語法, 又轉(zhuǎn)向短語結(jié)構(gòu)語法,于是出現(xiàn)了各種增強的短語結(jié)構(gòu)語法。例如,受限語言( restricted language)和擴充轉(zhuǎn)移網(wǎng)絡(luò)(Augemented Transition Network ,簡稱 ATN )。受限語言的表層 結(jié)構(gòu)分析和深層結(jié)構(gòu)
29、生成是分別進行的, 而 ATN 的表層結(jié)構(gòu)分析和深層結(jié)構(gòu)生成是同時進 行的。 60 年代后期, Chastellier 把程序設(shè)計語言的 W- 語法引進了自然語言處理中,他證 實了英語和法語的轉(zhuǎn)換語法都可以通過這樣的 W- 語法來重寫。 美國語言學家J. Bresnan主張建立面向詞匯的非轉(zhuǎn)換的語法,她和 R. M. Kaplan一起, 于 1983 年提出了詞匯功能語法( Lexical-Functional Grammar ,簡稱 LFG ) 。 Martin Kay 于 1983 年提出了“合一語法” (Unification Grammar, 簡稱 UG ) ,于 1985 年提
30、出了“功能合 一語法” ( Functional Unificational Grammar, 簡稱 FUG ) 。 G. Gazdar、 E. Klein 、 I. Sag 和 G. Pullum 等人于 1985 年提出了 “廣義短語結(jié)構(gòu)語法” ( Generalized Phrase Structure Grammar , 簡稱 GPSG ) 。 C. Pollard 于 1984 年在他的博士論文中,提出了“中心詞語法” ( Head Grammar) , 1985 年又和他的同事們一起提出了 “中心詞驅(qū)動的短語結(jié)構(gòu)語法 ( Head-Driven Phrase Structure
31、Grammar ,簡稱 HPSG ) 。這些語法都采用復(fù)雜特征結(jié)構(gòu)( complex feature structure )來改進短語結(jié)構(gòu)語法,采用合一運算( unification )來改進傳統(tǒng)的集合運算,從而 有效地克服了短語結(jié)構(gòu)語法的缺點,保持了短語結(jié)構(gòu)語法的優(yōu)點。此外,還有定子句語法 ( Definite Clause Grammar ,簡稱 DCG ) ,這種形式語法也是對于短語結(jié)構(gòu)語法的重要改進。 以上都是基于規(guī)則 ( rule-based) 的 自 然語言分 析技術(shù) 。 此 外 , 還有基于概 率 ( probability-based )的自然語言分析技術(shù),如 N 元語法(
32、 N-gram Grammar ) 、隱馬爾科夫模 型( Hidden Markov Model ,簡稱 HMM ) 、最大熵模型( Maximum Entropy Model ,簡稱 ME ) 、支持向量機( Support Vector Machine ,簡稱 SVM ) 、條件隨機場( Conditional Random Fields, 簡稱 CRF )等。 這些自動句法分析方法對于 CALL 顯然是很有價值的,很多 CALL 的學者已經(jīng)注意到 這個問題。事實上,近年來,在 CALL 中已經(jīng)開始注意借鑒自然語言處理中的自動句法分 析方法,并且發(fā)表了不少的論文。 但是,自然語言處
33、理的這些分析技術(shù)是針對母語說話者( Native Speaker,簡稱NS)的 語言分析而提出的, 它們一般只能分析正確的句子, 如果句子出現(xiàn)錯誤, 這些分析技術(shù)的容 錯能力都比較差。對于非母語說話者( Non-Native Speaker ,簡稱 NNS )來說,他們在第二 語言學習中往往出現(xiàn)偏誤, 或者出現(xiàn)化石化的現(xiàn)象, 如果他們說出的句子出現(xiàn)偏誤, 這些分 析技術(shù)就往往顯得無能為力了。因此, ICALL 有必要在這些自然語言分析技術(shù)的基礎(chǔ)上, 進一步研究如何讓計算機也能夠分析 NNS 說出的有偏誤的英語句子, 并指出 NNS 學習者偏 誤的所在, 以幫助他們提高對于偏誤的意識。 這
34、是 ICALL 研究的一個重要任務(wù), 也是 ICALL 對于原有的自然語言處理分析技術(shù)的發(fā)展和創(chuàng)新。 ICALL 還與 Web 有著密切的關(guān)系。我們前面說過,多媒體( multimedia )技術(shù)能夠綜 合地處理文本、圖形、圖像、聲音等多種媒體信息,為 ICALL 中使用除了文本之外的圖形、 圖像、聲音等多種媒體信息提供的可能,使得 ICALL 能夠做到有聲有色、圖文并茂。 Web 可以進一步為 ICALL 提供“超文本技術(shù)” ( Hypertext ) ,使得 ICALL 可以在網(wǎng)絡(luò)上進行。這 是 ICALL 最為突出的特點。 我們現(xiàn)在所指 Web就是WWW。WWW是基于Inter
35、net的計算機網(wǎng)絡(luò),用戶使用WWW , 可以通過互聯(lián)網(wǎng)( Internet )訪問存貯在世界范圍內(nèi)的 Internet 上的海量信息。 WWW 是根據(jù) “客戶端 -服務(wù)器” ( Client-Server )的模式來進行工作的。客戶通過叫做 “客戶端” ( Client ) 的程序與遠程存儲著數(shù)據(jù)的 “服務(wù)器” (Server)連接,Web的瀏覽通過叫做 “瀏覽器” (browser)的 Client 程序來進行(例如, Navigator, Internet Explorer 等)。Web 瀏覽器把用 戶的提問傳送給遠程的服務(wù)器搜索有關(guān)的信息,然后返回搜索到的文件,這些文件使用 HTM
36、L ( Hyper Text Makeup Language , 超文本標記語言) 書寫,最后在客戶端用戶的計算機 屏幕上顯示出來。 Web 的操作依賴于超文本文件的結(jié)構(gòu)。超文本可以讓網(wǎng)頁的作者把他們的文件與 Web 的其他文件進行 “超鏈接” ( Hyperlink ) ,從而看到 Web 上的有關(guān)的文件。 Web 的概念最早是 Tim Berners-Lee 于 1989年提出的。 當時他在瑞士的歐洲核研究中心 ( Centre European pour la Recherche Nucleaire, 簡稱 CERN )工作,他寫了第一個 WWW 的 Server 和 Clie
37、nt 程序,并且把它們叫做 World Wide Web 。 1989 年三月, Tim Berners-Lee 給 CERN 的高層領(lǐng)導(dǎo)提交了一個建議。 在這個建議中, 他分析了當時使用的層級式信息組織方 法(hierarchical organization of information )的缺點, 同時又指出了基于超文本系統(tǒng) (Hypertext System)的優(yōu)點,初步提出了建立“分布式超文本系統(tǒng)” (Distribution Hypertext System )的 基本方法??上倪@個建議沒有得到 CERN 高層必要的支持。 1900 年, Berners-Lee 又再次
38、向 CERN 提出他的建議,這一次他的建議得到了 CERN 的 支持。于是, Berners-Lee 和他在 CERN 的同事們立即采用分布式超文本系統(tǒng)的思想來研究 Web,為Web將來的發(fā)展做了奠基性的工作。他們?yōu)榇搜兄屏?Web的服務(wù)器,瀏覽器,并 研制了客戶端和服務(wù)器之間的通信模型,超文本傳輸協(xié)議( HyperText Transfer Protocol ,簡 稱 HTTP ),超文本標記語言( HyperText Makeup Language ,簡稱 HTML ),通用資源定位器 ( Universal Resources Locator ,簡稱 URL ,也就是網(wǎng)址) 。 19
39、93 年 2 月,美國 Illinois 大學國家超級計算機應(yīng)用中心( National Center of Supercomputer Application ) 的 Marc Andereeson 和他的研究小組設(shè)計了使用 Mosaic 技術(shù)的用 戶圖形界面,并把它用來作為 Unix的Web瀏覽器,短短的幾個月之內(nèi),Macintosh和Windows 的操作系統(tǒng)都先后使用了 Mosaic 的用戶圖形界面技術(shù)。 用戶只要點擊計算機屏幕上的圖形, 就可以對計算機進行各種操作。 1994 年, Jim Clarc 與 Marc Andereeson 合作, 成立了 Mosaic Communi
40、cation 公司,后來改名為 Natscape Communication 公司,在幾個月之內(nèi),他們就研 制出了 Natscape 的瀏覽器,并在 Web 用戶中普及。 1995 年 8 月,微軟公司公布了他們的 Web瀏覽器Internet Explorer,并向Netscape挑戰(zhàn)。從此,用戶就可以通過瀏覽器在 Web上 隨心所欲地漫游了。 Tim Berners-Lee 創(chuàng)立的 World Wide Web 以及 Mosaic 瀏覽器的出現(xiàn),是 Web 發(fā)展歷史 上兩個最重要的事件,它們使得 Web 能夠迅速地在用戶中得到推廣和普及。 Internet 是 Web 的通信網(wǎng)絡(luò)
41、。沒有 Internet , Web 是不可能發(fā)揮其功能的。 Internet 的前 身是計算機網(wǎng)絡(luò) ARPANET ,這個計算機網(wǎng)絡(luò)是在美國國防部高等研究計劃處( Advanced Research Project Agency簡稱ARPA)的支持下研制的。早在 1969年ARPANET就建成了。 1972 年, ARPANET 在計算機與通信第一次國際會議上表演, ARPA 的科學家們出色地利用 ARPANET 把處于 40 多個不同的地方的計算機連接在一起。后來,這個 ARPANET 進一步 發(fā)展成為當今的 Internet 。 在 1973 年, Vinton Cerf 和 B
42、ob Kahn 就開始研究網(wǎng)絡(luò)協(xié)議 ( Internet Protocol ) , 1974 年, 他們發(fā)表了《傳輸控制協(xié)議》 ( Transmission Control Protocol )的文章,正式把他們提出的協(xié) 議叫做 TCP/IP 協(xié)議( Transmission Control Protocol / Internet Protocol ) , TCP/IP 協(xié)議可以使 的計算機網(wǎng)絡(luò)彼此連接起來,彼此進行通信。但是,直到 1982 年, TCP/IP 協(xié)議才正式得到 采用, Internet 使用 TCP/IP 協(xié)議把不同網(wǎng)絡(luò)聯(lián)系起來了。 為了有效地獲取分布在全世界網(wǎng)絡(luò)上的信息,
43、需要研制“搜索引擎” ( search engine) 。 1993年,美國Stanford大學的6個學生研制了搜索系統(tǒng) Excite; 1994年,美國Texas大學研 制了 EINet Calaxy ;同年,著名的搜索引擎 YAHOO 問世。 1998 年, Stanford 大學的 Sergey Brim 和 Larry Page 推出了搜索引擎 Google , 2005 年,微軟推出了搜索引擎 MSN 。 為了促進 Web 在全世界范圍內(nèi)的推廣和使用, 美國麻省理工學院 ( MIT ) 和瑞士的 CERN 在 1994 年成立了萬維網(wǎng)協(xié)會( The World Wide Web
44、 Consortium ,簡稱 W3C) , W3C 是萬維 網(wǎng)的國際性組織, W3C 的成立使得 Web 在國際范圍內(nèi)迅速地得到普及,幾乎每一個現(xiàn)代人 的生活和工作,都與 Web 息息相關(guān)。自 1994 年第一次 W3C 會議召開以來,每年都召開一 次 W3C 的國際會議。 90% 以上的網(wǎng)絡(luò)信息都是文本信息,它們都是以語言為載體的信息,這些都為 ICALL 在Web上的發(fā)展提供了非常有利的條件。使用 Web,可以在遠程甚至在全世界范圍內(nèi)進行 ICALL 的教學,使得 ICALL 如虎添翼。 三、 本書主要內(nèi)容 本書是 MULTILINGUAL MATIERS LTD 公司出版的
45、《第二語言習得》 ( Second Language Acquisition ) 系列叢書中專門介紹 ICALL 的專著。 根據(jù) Amazon 圖書網(wǎng)站的統(tǒng)計, 本書英文 本包括字符 572,635 個,單詞 100,914 個,句子 3939 個,每個單詞的平均音節(jié)長度為 1.8 個 音節(jié),每個句子的平均單詞數(shù)為 25.6 個單詞。這些統(tǒng)計數(shù)字表明,本書的可讀性較強。本 書文字流暢,實例豐富,內(nèi)容通俗易懂,是一本值得向讀者推薦的好書。 作者 Marina Dodigovic 是阿拉伯聯(lián)合酋長國沙加的美利堅大學 ( American University ) 的助教授,專門教授英語和 T
46、ESOL ( Teachers of English for Speakers of Other Languages )的 課程。 Marina Dodigovic Marina Dodigovic 曾經(jīng)做過學術(shù)英語和應(yīng)用語言學的研究,又做過計算機的程序員。 她的研究興趣主要是 CALL、學術(shù)英語(English for Academic Purpose ,簡稱EAP)、英語學 習者需求分析,她曾經(jīng)制作過 CALL的軟件包,發(fā)表過有關(guān)論文。在本書中,她把自己在 英語教學和計算機程序設(shè)計中積累的各種知識結(jié)合起來, 專門討論人工智能在第二語言教學 中的應(yīng)用問題。 本書從第二語言教學的
47、角度,介紹了人工智能在第二語言教學中的應(yīng)用, 特別強調(diào)在第 二語言教學中應(yīng)當特別注意對于語言學習者的偏誤分析, 提高對于偏誤的意識,從而幫助學 習者糾正他們的偏誤。作者認為,只要第二語言的學習者能夠認識他們在語言學習中偏誤的 類型,系統(tǒng)地糾正他們的偏誤,并且選擇他們自己喜歡的方式進行學習,那么,他們是可以 學好第二語言的。作者認為,為了達到這個目的,可以使用人工智能中的研究成果,本書介 紹了 “學術(shù)英語智能教學系統(tǒng)”,通過實例說明了人工智能方法對于學術(shù)英語教學是有效的。 本書共分6章,各章篇名全部都是疑問句: 第一章《學習另一種語言是可能的嗎?》 第二章《研究在哪里停止,CALL的開發(fā)在
48、哪里開始?》 第三章《為什么使用 Web?》 第四章《計算機能夠糾正語言的偏誤嗎?》 第五章《怎樣研制一個人工智能語言教學系統(tǒng)?》 第六章《系統(tǒng)怎樣工作?》 下面,我們根據(jù)各章的順序,一一討論這些問題。 第一章《學習另一種語言是可能的嗎?》討論了第二語言習得( Second Language Acquisition ,簡稱SLA)的理論,特別是討論了中介語(Interlanguages)理論以及這種理論 對于SLA的啟示。 作者首先介紹了普遍語法( Universal Grammar ,簡稱 UG )與語言學習(Language Learning )的理論,并討論了語言學習中的行
49、為主義觀點( behaviourist view ),語言學習中 的認知方法(cognitive approach ),以及語言學習中的功能主義理論( functionalist theory )、 交互主義理論(interactionist theory )、社會文化學理論(sociocultural theory )和社會語言學 理論(sociolinguistic theory ),使得讀者對于 SLA的理論獲得鳥瞰式的認識。 然后,本章著重介紹了 Larry Selinker 提出的中介語理論(interlanguage theory ) ( L. Selinker, Interl
50、anguage, International Review of Applied Linguistics , 10(3), p209-231, 1972.),分 析了中介語依賴于 SLA的五個中心因素:①語言轉(zhuǎn)換過程②第二語言規(guī)則的過度生成過程 ③訓練轉(zhuǎn)換過程 ④第二語言學習的策略 ⑤交際的策略。Selinker提出了中介語的獨立的語 法,考察了導(dǎo)致中介語產(chǎn)生的心理過程。中介語的概念來源于“化石化" (fossilisation )的 概念。所謂化石化,就是語言學習者在學習一種新的語言的時候, 往往會建立起一個像化石 一樣頑固的化石化系統(tǒng), 在這個化石化的系統(tǒng)中, 目標語言的一些信息特征
51、或者來自學習者 的母語規(guī)則的影響,或者來自學習者已經(jīng)學過的某些目標語規(guī)則的“過度生成” (overgeneration)或"過度簡化"(oversimplifying )的影響,都會導(dǎo)致偏誤的形成,而這些 偏誤可以通過系統(tǒng)化的途徑存在于中介語當中,嚴重影響第二語言學習的效果。因此,在 SLA的過程中,學習者會形成一種介于母語和目標語言之間的中介語。在中介語中,化石 化的現(xiàn)象是普遍存在的。 由于化石化現(xiàn)象在中介語中的存在, 嚴重地影響第二語言學習的效 果,在某一段學習時間之內(nèi),學習者似乎很難取得 SLA 的任何進步,而總是處于停滯不前 的狀況。 N .Ellis 最新的研究表明( N.
52、 Ellis, Unconscious and conscious sources of language acquisition, The Sixth International Conference for Language Awareness , ALA2002, Umea, Sweden, 2002. ) ,影響克服 SLA 中語言偏誤的因素有兩個:一個是提高對于偏誤的自覺性 ( Consciousness Raising ,簡稱 CR ) ,分析偏誤產(chǎn)生的原因,一個是提高對于偏誤的語言意 識(Language Awareness,簡稱LA),時刻警惕偏誤的發(fā)生。針對化石化的現(xiàn)象,
53、如果我們 提高對于 SLA 中的偏誤的分析和警覺,及時地糾正 SLA 中的偏誤,將會大大改善 SLA 的 效果,一方面,它可以防止已經(jīng)化石化了的偏誤繼續(xù)發(fā)生,另一方面,它可以幫助學習者對 于已經(jīng)化石化的偏誤“消除化石化” ( de-fossilisation ) 。 在本章的最后,作者簡單地討論了 SLA 中的人工智能方法。她指出,在 SLA 中,可以 使用人工智能的方法, 設(shè)計糾正偏誤的軟件工具, 就可以防止偏誤的發(fā)生, 消除化石化造成 的后果。 對于不熟悉 SLA 理論的讀者,閱讀本章可以增加他們對于 SLA 的理論知識。 第二章《研究在哪里停止, CALL 的開發(fā)在哪里開始
54、?》主要討論 CALL 的“研究” (research) 與 "開發(fā)" (development) 的關(guān)系。 作者分析了 CALL 研究中的各種關(guān)系,例如,研究和開發(fā)的關(guān)系,系統(tǒng)分析和系統(tǒng)評 測的關(guān)系,理論和實踐的關(guān)系, CALL 與 SLA 的關(guān)系,面向開發(fā)( development oriented )與 面向效果 ( effect oriented ) 的關(guān)系、 決策驅(qū)動 ( decision driven ) 與知識驅(qū)動 (knowledge driven ) 的關(guān)系、數(shù)據(jù)驅(qū)動( data driven )與理論驅(qū)動( theory driven )的關(guān)系、線性開發(fā)( line
55、ar ) 與環(huán)形開發(fā)( circular )的關(guān)系。她認為,很難想象,一個好的 CALL 系統(tǒng)的開發(fā)工作能夠 與研究工作完全脫離開來,因此,應(yīng)該把 CALL 系統(tǒng)的開發(fā)與研究緊密地聯(lián)系在一起。 CALL 的研究可以分為“開發(fā)前的研究” ( pre-developmental research )和“開發(fā)后的研 究” ( post-developmental research )兩種。作者指出,從 CALL 的文獻來看,對于開發(fā)前的 研究重視不夠,很多 CALL 系統(tǒng)的開發(fā)常常忽視開發(fā)前的研究,這是應(yīng)當引以為訓的。 作者還指出,由于 CALL 系統(tǒng)的開發(fā)過程往往是環(huán)形的,在開發(fā)過程中
56、常常需要回過 頭來檢查原來已經(jīng)做過的工作,因此,很難在 CALL 的開發(fā)和研究之間,劃一條明確的界 限,在 CALL 中,開發(fā)和研究是密切地結(jié)合在一起的。 所有的讀者對于本章都會有興趣,不管其背景如何。 第三章《為什么使用 Web?》討論 Web在CALL中的應(yīng)用問題。由于 Web使用超文本 和超鏈接的技術(shù)把各種不同的文本鏈接起來,又使用 HTTP 協(xié)議和 TCP/IP 協(xié)議把不同的網(wǎng) 絡(luò)聯(lián)系起來, 它正如一個無比巨大的虛擬圖書館, 其中蘊藏著無比豐富的語言資源和語言信 息,因此 Web 是信息時代的一種新發(fā)明( innovation ) 。 作者介紹了 E. Rogers 于 1
57、983 年提出的關(guān)于新發(fā)明傳播和接受的理論( E. Rogers, Diffusion of Innovations, London, Macmillan, 1983 ) 。 E. Rogers 認為,一種新發(fā)明要得到社會 的接受并在社會上傳播開來應(yīng)當滿足 5 個要求: ⑴相對的優(yōu)越性(relative advantage):它應(yīng)當比以前的在社會上已經(jīng)存在的東西更好; ⑵兼容性(compatibility ):它應(yīng)當與現(xiàn)存的價值觀和過去的經(jīng)驗兼容; ⑶較低的復(fù)雜性(low complexity ):它不能太復(fù)雜,應(yīng)當便于理解和使用; ⑷易學性(triability ):它應(yīng)當容易學習
58、; ⑸可觀察性(observability ):它的使用結(jié)果應(yīng)當是直觀的、可以觀察到的、 。 Web 恰恰可以滿足這 5 個要求,因此, Web 很快地在 CALL 中受到普遍的歡迎。 為了從 CALL 發(fā)展到 ICALL ,作者正在研制一個叫做“學術(shù)英語智能教學系統(tǒng)” Intelligent Tutor of Academic English )的課題,她把“學術(shù)英語智能教學系統(tǒng)”也看成一 種新發(fā)明,因此,如果“學術(shù)英語智能教學系統(tǒng)”使用 Web,也就可以滿足上面的 5個要 求,這樣,作為新發(fā)明的“學術(shù)英語智能教學系統(tǒng)”就可以得到社會的接受并且在社會上廣 泛地傳播開來。 M.
59、 Levy 提出了“以計算機為媒介的交際” ( Computer Mediated Communication ,簡稱 CMC ) 的概念 ( M. Levy, Computer Assisted Language Learning, Context and Conceptualization, Oxford: Clarendon Press, 1997 ),他把 CMC 定義為“兩個或多個交際的參加者通過進行的交 際”,CMC也是CALL的一種教學方式。顯而易見, CMC也可以使用 Web來進行。 近年來, Web 和 CMC 在 CALL 中得到了普遍的使用,不僅語言教師使用,語言的學
60、習 者也使用;不僅用于遠程教學,也用于面對面的教學;不僅用于課堂內(nèi)的教學,也用于課堂 外的教學;不僅用于語法教學,也用于詞匯教學。實踐證明, Web 和 CMC 對于提高學生的 聽說讀寫能力的“四會”訓練也很有幫助。 任何背景的讀者對于本章都會有興趣。 第四章《計算機能夠糾正語言的偏誤嗎?》討論了自然語言處理技術(shù)在 CALL 使用的 可能性問題。作者對于這個問題給出了正面的回答,并指出了它的不足。 作者首先詳細地分析了在人工智能和自然語言處理研究中自然語言分析技術(shù)的現(xiàn)狀, 介 紹了擴充轉(zhuǎn)移網(wǎng)絡(luò) (ATN ) 、 定子句語法 ( DCG )、 原則參數(shù)理論 (PPT)、 詞匯功能語法
61、 ( LFG) 和中心語驅(qū)動的短語結(jié)構(gòu)語法( HPSG )等自然語言分析技術(shù)的基本原理以及它們在 CALL 中的應(yīng)用情況,還介紹了語音識別技術(shù)在 CALL 的口語教學中的應(yīng)用情況。作者指出,這 些自然語言處理中使用的技術(shù), 都或多或少地忽視了對于語言中偏誤的處理。 那些所謂 “基 于規(guī)則”的分析技術(shù),它們的“規(guī)則”中很少有能夠識別語言偏誤的規(guī)則,而那些“基于概 率”的分析技術(shù),也不能準確地識別出語言中的偏誤,因此,盡管在 CALL 中使用了自然 語言的各種分析技術(shù),事實上并不能給第二語言教學提供切實有效的“反饋” ( feedback) , 從而準確地指出學習者的偏誤,并改善第二語言學習
62、的效果。這是 CALL 教學中的一個嚴 重問題,產(chǎn)生這個問題的根本原因在于,在 CALL 中使用的這些分析技術(shù)都是針對母語說 話者(NS)的,而不是針對非母語說話者( NNS)的。 作者強調(diào)地說明, 適合第二語言教學的自然語言自動分析技術(shù)必須能夠發(fā)現(xiàn)并糾正語言 學習中的偏誤。這樣的分析技術(shù)必須根據(jù) NNS 語言學習者的中介語來訓練。只有根據(jù) NNS 語言學習者中介語訓練出來的分析技術(shù),才有能力識別 NNS 語言學習者的語言偏誤,并以 適當?shù)姆绞浇o學習者提出糾正偏誤的建議。另外,智能計算機還能夠評測 NNS 語言學習者 的寫作和說話能力。 本書作者一直致力于研究如何使用計算機來糾正 N
63、NS 語言學習者偏誤, 為此,她研制了“學術(shù)英語智能教學系統(tǒng)” ( Intelligent Tutor of Academic English )。 本章內(nèi)容豐富,不僅對于那些熟悉語言教學但不熟悉人工智能的讀者會有幫助,而且, 對于那些熟悉人工智能但不熟悉語言教學的讀者也會大有裨益。 第五章 《怎樣研制一個人工智能語言教學系統(tǒng)?》 是本書的重點內(nèi)容, 討論了人工智能 語言教學系統(tǒng)研制中的基本問題。人工智能寫作教學程序可以很好地處理不同學習者的差 別, 這樣的程序要充分地考慮了學習者的個人特點、 他們各自的學習風格、 他們在第二語言 或外語學習環(huán)境下容易產(chǎn)生的各種典型的偏誤。 這樣一來,
64、 每一個學習者就能夠采用適合他 們特點的不同的學習策略來進行個性化的學習, 這對于他們的語言習得是非常有幫助的。 為 了研制這樣的程序, 需要做一些前導(dǎo)性的研究工作, 因此, 本章還討論了學習者風格的研究, 教學中目標語言的研究,學習者的中介語的研究等問題。作者認為,在目前的背景之下,人 工智能語言教學系統(tǒng)的目標語言應(yīng)當是學術(shù)英語( Academic English ) ,因此,人工智能語言 教學系統(tǒng)的學習者應(yīng)當是 EAP 學習者,作者以符號學為理論框架,對于學術(shù)英語進行了理 論上的探討。 作者使用一種叫做 SICSTUS PROLOG 的程序語言實現(xiàn)了學術(shù)英語智能教學系統(tǒng), 本章
65、給出了有關(guān)的研究數(shù)據(jù)和實例。 例如, 人工智能語言教學系統(tǒng)用英語就關(guān)于瘧疾的醫(yī)學問題向?qū)W生提問, 要求學生用英 語做出正確的回答。 系統(tǒng)問: Malaria can be a terminal disease. What does malaria cause? (瘧疾是一種致命的疾病。瘧疾會引起什么后果?) 學生回答: Malaria causes a die. 這是一個錯誤的句子,沒有使用名詞 death 而錯誤地使用了動詞 die 。名詞和動詞無清 楚的分別,這是一些 NNS 學生常出現(xiàn)的偏誤,一般說來,在這些 NNS 學生的母語中,動詞 和名詞的區(qū)分不是涇渭分明的。于是,系
66、統(tǒng)根據(jù)這些 NNS 學生的偏誤特點,指出學生的回 答有錯誤: 系統(tǒng)說: Sorry, that was incorrect. You can try another version or get a hint. (對不起,這是錯誤的。你可以作另外的回答,或者要求提示。 ) 然后,系統(tǒng)根據(jù)這一類的偏誤,舉出 causes之后帶名詞賓語的例子,給出如下的提示: You need a sentence pattern like this: Malaria causes eOth亡) 在這個句子里,作為 causes賓語的應(yīng)當是名詞 death,而不是動詞die。 為了讓學生深刻地理解他們的偏誤以及這一類句子的結(jié)構(gòu)規(guī)律,系統(tǒng)進一步做出反饋, 對于正確回答的句子進行自動句法分析, 給出表示分析結(jié)果的層級結(jié)構(gòu)以及每一個單詞的有 關(guān)特征和特征值: Structure of your phrase: Malaria causes death (瘧疾引起死亡) Sentence: np: det: [ _ ] n: malaria [sg, 3, nomin] vp :
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 初中語文作文素材:30篇文學名著開場白
- 初中語文答題技巧:現(xiàn)代文閱讀-說明文閱讀知識點總結(jié)
- 初中語文作文十大??荚掝}+素材
- 初中語文作文素材:描寫冬天的好詞、好句、好段總結(jié)
- 初中語文必考名著總結(jié)
- 初中語文作文常見主題總結(jié)
- 初中語文考試常考名著總結(jié)
- 初中語文必考50篇古詩文默寫
- 初中語文易錯易混詞總結(jié)
- 初中語文228條文學常識
- 初中語文作文素材:30組可以用古詩詞當作文標題
- 初中語文古代文化常識七大類別總結(jié)
- 初中語文作文素材:100個文藝韻味小短句
- 初中語文閱讀理解33套答題公式
- 初中語文228條文學常識總結(jié)