現(xiàn)代教育測量與評價學
《現(xiàn)代教育測量與評價學》由會員分享,可在線閱讀,更多相關《現(xiàn)代教育測量與評價學(11頁珍藏版)》請在裝配圖網(wǎng)上搜索。
現(xiàn)代教育測量與評價學 1、一次考試中某生在50名學生中排名第13名,則該生的百分等級應該是【 B 】A.13 B. 26 C. 50 D. 74 2、在現(xiàn)代測驗理論的諸多模式中,最具有優(yōu)越性的是 【 B 】A.經典測驗理論B.項目反應理論C.心理測驗理論D.智力測驗理論 3、適合于某些用于選拔和分類的職業(yè)測驗的效度是【 B 】 A.時間效度 B.內容效度 C.效標關聯(lián)效度 D.結構效度 4、韋克斯勒智力測驗屬于 【 B 】 A.限時測驗和典型作為測驗 B.限時測驗和最高成就測驗 C.非限時測驗和典型作為測驗 D.非限時測驗和最高成就測驗 5、測驗被試回憶或辨認某些特定事實的能力的認知層次是【A 】A.知識 B.應用 C.分析 D.綜合 6、學生成績測驗的主要類型有安置性測驗、形成性測驗、診斷性測驗和【 D 】 A.智力測驗 B.能力傾向測驗 C.人格測驗D.總結性測驗 7、學業(yè)成績是一個 【 D 】 A.名義變量 B.順序變量 C.等距變量 D.比率變量 8、通常認為|r|<0.2時稱為 【 A 】 A.極低相關 B.低相關 C.中等相關 D.高相關 9、根據(jù)測驗編制程序的嚴格程度,可以簡單地把學業(yè)成就測驗分成教師自編課堂成就測驗和 【 D 】 A.標準參照測驗 B.紙筆測試 C.安置性測驗 D.標準化成就測驗 10、下面題型中屬于客觀題的是 【 D 】 A.計算題B.證明題 C.作圖題 D.選擇題 11、最重要的測驗質量指標是 【 A 】 A.難度 B.區(qū)分度 C.梯度D.效度 12、評價的重點在于“過程”的評價是 【 B 】 A.診斷性評價 B.形成性評價 C.總結性評價 D.整體性評價 13、在布魯姆認知領域教育目標分類中,層次最低的是【 D 】 A.領會 B.應用 C.分析 D.知識 14、學生的英語測驗成績屬于 【 B 】 A.名義量尺 B.順序量尺 C.等距量尺 D.比率量尺 15、內容效度的評估方法不包含 【 B 】 A、專家判斷法 B、雙向細目表法C、統(tǒng)計分析法 D、經驗推測法 . 16、下列幾種效度中,不具有效度真正意義的是 【 C 】 A.結構效度 B.內容效度 C.表面效度 D.效標關聯(lián)效度 17、學期初或單元教學開始時使用的測驗是 【 A 】 A.安置性測驗 B.形成性測驗 C.終結性測驗 D.能力傾向性測驗 18、標準化考試產生于 【 C 】 A.19世紀末 B.20世紀初 C.20世紀40年代 D.20世紀60年代 19、教育測量專家格蘭朗德認為,一個完整的評價計劃,可用公式形象地表達,其公式是 【 C 】 A.評價=測量+評定+價值判斷B.評價=測量+定量描述+定性判斷 C.評價=測量+非測量+價值判斷 D.評價=測量+非測量+統(tǒng)計推斷 20、百分等級反映數(shù)據(jù)在其次數(shù)分布中的 【 A 】 A.相對地位 B.集中趨勢 C.誤差大小 D.差異程度 21、一個隨機變量所有取值點的概率之和為 【 B 】 A. 0 B. 1 C. 2 D. 3 二、填空題 1、教育調查依據(jù)目的可分為兩類:一是( 常模調查 ),一是比較調查。 2、“記”是一種感知過程,心理學上也稱為識記,可分為有意識記與無意識記,也可分為( 機械識記 )與理解識記等。 3、泰勒指出:“評價過程在本質上是確定課程和教學大綱在實際上實現(xiàn)( 教育目標 )的程度的過程” 4、所謂指標結構性教育評價表,就是根據(jù)評價目標逐層分解評價指標,形成具有評價指標體系、( 指標權重結構 )以及定性定量具體評價標準的教育評價表。 5、有代表性的樣組,也稱為( 常模團體 ),指的是在建立測驗常模過程中實際受測被試樣組,他們代表著一個有明確定義的人群。 6、人們在解釋教育測量和評價的結果時,總是要選擇某種參照點。這樣,教育測量評價可大致分成常模參照、 ( 標準參照 )和潛力參照三種。 7、以教育目標或標準為參照來評價學生發(fā)展,需要貫徹“多元的教育目標與(多元的評價方法)相適應”的原則。 8、所謂量表或量尺,指的是確定了測量單位和參照點并具有( 取值系統(tǒng) )的測量工具。 9、教育評價表在結構上是由評價指標、指標權重及( 評價標準 )三部分組成的。 10、同質性信度也叫( 內部一致性系數(shù) )信度,它是指測驗內部所有題目間的一致性程度。 三、名詞解釋 1、教育測量 答:教學測量是考核教學成效的一種方法,是一種收集資料數(shù)據(jù)的過程。它是借助于一定的教育測量工具及其操作,根據(jù)某種標準和一定的操作程序,將學生的學習行為與結果確定為一種量值,以表示學生對所測問題了解的多少。即通過觀察少數(shù)具有代表性的行為或現(xiàn)象來量化描述人的心理特征,為了減少誤差,測驗在編制、施測、評分以及解釋等方面都必須遵循一套系統(tǒng)的程序。 2.句子完成測驗答:又稱作填句測驗,去完成的句子(詞干)構成,并且這些語句多為 情境性、情緒性的。 2、 品德情境測評法 答:指測評者設置一定的情境和標準,并觀察被測評者在該情境中的反應,根據(jù)事先規(guī)定的標準對被測評者的品德發(fā)展狀況做出評價的方法。簡而言之,是指對個體品德的測量與評價。 3、 效度 答:即有效性,它是指測量工具或手段能夠準確測出所需測量的事物的程度。效度是指所測量到的結果反映所想要考察內容的程度,測量結果與要考察的內容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:內容效度、準則效度和結構效度。 4、 高考標準分數(shù)制度 答:高考標準分數(shù)制度由常模量表分數(shù)(包括全國常模和省常模)、等值量表分數(shù)組成。 5.難度 答:難度即測試題目的難易程度.一般在能力方面的測試中,它作為衡量測試題目質量的主要指標之一。它是衡量試題質量的一個重要指標參數(shù),它和區(qū)分度共同影響并決定試卷的鑒別性。 難度:難度指被試完成測驗或量表時所遇到題目的難易程度記為P。 難度:指試題的難易程度,即某個試題的通過率(答對或通過試題的人數(shù)比例) 5、 常模 答:常模是一種供比較的標準量數(shù),由標準化樣本測試結果計算而來,即某一標準化樣本的平均數(shù)和標準差。 7.教育目標 答:教育目標(educational goal)就是指所培養(yǎng)的人才應達到的標準.這個目標可高可低按需而定(教育目標是培養(yǎng)人的方向和規(guī)格)。是反映教育目的的,具體而可觀測的變化(或進步)。 7.真分數(shù) 答:值小于1的分數(shù),即分子小于分母(二者都是正整數(shù))的分數(shù)稱為真分數(shù),但等于1不算(那屬于假分數(shù))。真分數(shù):被試在所測特質上客觀具有的水平值。 四、簡答題 1、簡述羅杰斯關于健康人格的具體特征 答:①情感和態(tài)度上是無拘無束的、開放性的,沒有任何東西需要防備;②對新的經驗有很強的適應性,能夠自由地分享這些經驗;③信任自己的感覺;④有自由感;⑤具有高度的創(chuàng)造力。 2、簡述課業(yè)考評改革的主要目標 答:a.首先要實現(xiàn)考試觀向發(fā)展性評價觀的轉變,b.要努力實現(xiàn)從重視“掌握性結果”的評價轉變既重視“掌握性結果”又重視“發(fā)展性結果”的評價;c.內容要從認知領域轉變到涵蓋學習結果更廣泛的教育目標領域上d.要努力實現(xiàn)從表征性分數(shù)機制到實質性內容機制的轉變。 3、簡述教育測量與評價按照按測量與評價的內容如何分類 答:1)按運用時機分:形成性測量與評價;診斷性測量與評價;終結性測量與評價2)按解釋測量結果或評價結果時的參照點分類:常模參照測量與評價;標準參照測量與評價3)按測量與評價被試行為表現(xiàn)的性質分類:最佳行為測量與評價;典型行為測量與評價4)按量表的標準化程度可分為標準化測驗和非標準化測驗 2、 簡述課業(yè)考的主要作用 答:1.課業(yè)考評的主要作用:首先,合理的課業(yè)考評制度為學生發(fā)展提供較明確的目標和努力的方向;其次,合理的課業(yè)考評制度將有助于評價學生的發(fā)展進步,從而對教與學雙方活動起著重要的控制、調節(jié)和促進等作用;再次,課業(yè)考評為學生心理發(fā)展和學習進步創(chuàng)造必要的背景和空間,誘發(fā)學生的學習動機和自主發(fā)展的動力;最后,課業(yè)考評在中小學生個體社會化進程中起著控制、調節(jié)、促進和加速的作用。 簡述多元智力學校教育的基本特征 答:多元智力理論有下列主要特點:一是多元性。二是文化性。三是差異性。四是實踐性。五是開發(fā)性 4、簡述表現(xiàn)性測驗類型 答:(一)口頭測驗(二)論辯或辯論(三)短文題考試(四)寫作測驗?。ㄎ澹┻^程反應題(六)實驗技能教學考試評價 5、 簡述主觀題的編制原則 答:1.如果測量的行為目標能夠用客觀題來測,就盡量不要用主觀題。2.挑選的材料應該與學生學習經歷過的材料有類似性或是全新的材料。 3.設計的試題應該能夠測量相關的行為目標并且與某一內容領域相關。 4.應該用清晰、明確的語言表述背景材料和問題。 5.對材料分析題而言,設計試題應該對材料進行分析和解釋。 6.設計的試題數(shù)應該與背景材料的長度相匹配。 7.對試題的賦分應該合理。 8.對每個問題給以適當?shù)耐瓿蓵r間。 突出重點 結合世界 允許發(fā)揮 答案多樣 難度適宜 6、簡述在高考中使用原始分數(shù)的局限性 答:(1)原始分數(shù)未能反映考試分數(shù)相對于團體的位置信息。(2)不同科目或同一科目不同次考試之間分數(shù)可比較差。(3)原始分數(shù)不宜直接相加。(4)在高考中不便于控制各科目的權重。(5)在教育評價時,常提供不客觀、不準確的信息。 6、 簡述常模的用途 答:常模的作用是讓測驗者明白測驗結果分數(shù)的意義。心理測驗是一種測量人的心理狀態(tài)的技術手段,如同一個醫(yī)生量一下你的血壓就可以知道你的血壓是否偏高偏低一樣,心理測驗也希望達到類似的心理測量的目的。 五、論述題 1、常模參照測驗、標準參照測驗所要求的項目恰當難度及難度分布是什么?為什么?答:(1)常模參照測驗的項目恰當難度是P值盡量接近0.50。因為只有在這種情況下,題目區(qū)分性能最好,(2)常模參照測驗所要求的項目恰當難度分布是,圍繞P=0.50這個點,有一個適當寬的全距。(3)這樣的原因有以下兩個:一是測驗時,通常希望開始有幾個難度較低的題目來穩(wěn)定被試情緒,末尾用幾個難度稍大的題目以便只有少數(shù)高水平者才能通過。(4)二是讓全部項目都取0.50的難度,通常難以實現(xiàn)。當然,在允許有適當寬的全距的前提下,仍然要力爭大多數(shù)項目難度取值接近0.50。(5)標準參照測驗的目的是要考察被試的水平是否達到應有要求,因而測驗項目的難度,就不應由被試的實際通過率來決定,而應由項目的考核要求是否體現(xiàn)應有標準或教學目標來決定。(6)無論項目的通過是高還是低,只有體現(xiàn)了應用的標準或教學目標,項目的難度就是合理的恰當?shù)摹? 2、舉例說明結構效度驗證步驟 答:(1)考察測驗的內容效度,因為有些測驗對所測內容或行為范圍的定義或解釋類似于理論構想的解釋,所以內容效度高實質上也說明結構效度高。(2)計算測驗的同質性信度的方法來檢測結構效度。若有證據(jù)表明測驗不同質,則可以斷定該測驗結構效度不高。3)利用相容效度法,考察新編制的測驗與某個已知的能有效測量相同特質的測驗之間的相關。若兩者相關較高,則說明新測驗有較高的效度。 (4)利用區(qū)分效度法,考察新編測驗與某個已知的能有效測量不同的特質的舊測驗間的相關。若兩者相關較高,表明測到了其他心理特質,則新測驗效度不高。(5)對一組測驗進行因素分析,找出影響測驗的共同因素,每個測驗在共同因素上的負荷量(即測驗與各因素的相關)就是測驗的因素效度,測驗分數(shù)總變異中來自有關因素的比例就是該測驗結構效度的指標。(6)綜合應用相容效度法和區(qū)分效度法,若用多種極不相同的方法測量同一種特質相關很高,或用極為相似的方法測量不同特質相關很低,則說明測量效度很高。若有多種特質都接受了多種方法的測量,就可以分別計算出任意兩種方法測量同一種特質的相關和測量不同特質的相關,以及任意兩種特質接受同一方法和不同方法的相關。- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 現(xiàn)代教育 測量 評價
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經上傳用戶書面授權,請勿作他用。
相關資源
更多
正為您匹配相似的精品文檔
相關搜索
鏈接地址:http://m.italysoccerbets.com/p-10660263.html