最近中文字幕2018免费版2019,久久国产劲暴∨内射新川,久久久午夜精品福利内容,日韩视频 中文字幕 视频一区

首頁 > 文章中心 > 試卷質量分析

試卷質量分析

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇試卷質量分析范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

試卷質量分析

試卷質量分析范文第1篇

[關鍵詞)試卷分析;教學評估;程序

試卷分析是教學質量監(jiān)控體系的重要組成部分,其目的是為了進一步提高課程考試的科學性和嚴密性,不但可為教學效果反饋信息,還可以為改善題庫、改進教學提供參考。

上海中醫(yī)藥大學的試卷分析針對的是專業(yè)基礎課和專業(yè)課課程。校方采用標準答題卡,通過光標閱讀機將答題信息讀取到計算機,用FOXPRO程序編寫試卷分析程序。輸出的試卷分析報表包括3部分:考試成績、試題質量分析和試卷質量分析。本文就試卷分析系統(tǒng)的設計特點及實現(xiàn)功能作一介紹。

1設計特點

1.1運行環(huán)境

該校試卷分析系統(tǒng)采用的是光標閱讀機與計算機相結合的工作方式。校方使用的光標閱讀機(OpticalMarkRead―er,OMR)是一個通用閱讀系統(tǒng),它可以完成信息卡格式編輯、選紙、通用閱讀、評分、結果文件瀏覽及標準答案打印等功能。OMR通過閱讀答題卡上的涂點信息,轉化為計算機可識別的文本方式和FOXPRO數(shù)據(jù)庫文件方式,便可達到將信息錄入計算機的目的。

計算機采用Windows98以上操作系統(tǒng)即可,安裝FOX―PR06.0軟件,在此環(huán)境下編寫試卷分析程序,接收來自OMR的數(shù)據(jù),完成各項分析功能,教學研究并輸出分析報表。

1.2試卷編制要求

所使用的標準答題卡是根據(jù)該校實際情況設計的,包括客觀題和主觀題。試卷分析系統(tǒng)對試卷編制的要求是:客觀題數(shù)≤75題,可以是單選題、多選題;是非題;主觀題數(shù)≤30題。對試題分數(shù)的限制:主觀題每小題的滿分不得大于9.9分。學生答題卡客觀題部分考試時由學生填涂,主觀題得分由教師閱卷后統(tǒng)一填涂,標準答案卡由教師填涂,教師還要填寫一份考試信息卡,其中信息用于系統(tǒng)中試卷數(shù)據(jù)庫的建立。

2實現(xiàn)功能

此試卷分析系統(tǒng)目前實現(xiàn)的功能包括考試成績的輸出、試題質量分析和試卷質量分析。

2.1考試成績輸出

考試成績報表輸出字段包括:學生學號、客觀題分數(shù)、主觀題分數(shù)和總分。

2.2試題質量分析

校方采用的分析指標有每道試題的難度、區(qū)分度以及客觀題的備選答案選答比例。

2.2.1試題難度分析系統(tǒng)給出每道題目的難度指數(shù)。難度是指試題的難易程度,是評價試題質量的一個量化指標,過難,或過易都不能真實、準確地反映出考生的實際水平。因此,難度指數(shù)可以用來篩選題目。[1]難度指數(shù)越大,試題的難度越大;難度指數(shù)越小,試題的難度越小。一般認為,難度指數(shù)在0.65以上的為較難,在0.35~0.65之間為難度適中,在0.35以下則試題比較容易。為更好地檢驗學生對知識的掌握,通常應以難度適中的試題占多數(shù)為好。

2.2.2試題區(qū)分度 區(qū)分度是指試題對考生實際水平的區(qū)分程度和鑒別能力。區(qū)分度是反映試題效用高低的參數(shù),好的試題應能反映各檔次學生的知識掌握水平,即拉開學生的得分檔次。如果有的試題全體學生都不會,或者都會,就說明該試題區(qū)分度低。區(qū)分度是評價試題質量,篩選試題的主要指標與依據(jù)。

美國測驗專家RobertEbel根據(jù)長期實驗研究提出區(qū)分度的標準:區(qū)分度指數(shù)在0.40以上的說明試題區(qū)分度很好,區(qū)分度指數(shù)在0.3~0.4之間的說明試題良好但改進更佳,區(qū)分度指數(shù)在0.20~0.29之間說明試題尚可但仍需修改,在0.20以下則表明試題區(qū)分度較差應淘汰或修改。

一道試題的質量由該試題的難度和區(qū)分度共同構成,當試題的難度系數(shù)在適中的范圍內,而且有相對較高的區(qū)分能力時,這道題就被看成是質量好的試題。

2.2.3客觀題備選答案選答比例 分析系統(tǒng)給出每道客觀題各個備選項的選答人數(shù)百分比。它提示我們題目可能在以下幾方面存在問題:①如果所有考生都選擇的是正確答案,則說明該題目太容易或者題目中可能提供了某種暗示。②如果某個錯誤答案沒有一個考生選擇,說明該備選答案不具有迷惑性,錯得過于明顯。一般說來,除非有2%以上的人選擇,否則這個備選答案則應該修改。③如果大部分或全部考生都選擇了同一個錯誤答案,可能是編制測驗時把答案定錯了,也可能是在教學中發(fā)生了錯誤。④如果高分組考生的選擇集中在兩個答案上,二者選擇比例很相近,提示該題可能存在兩個正確答案或另一答案也有道理。⑤如果某題目考生未答人數(shù)過多或選擇各個備選答案人數(shù)相等,則說明題目過難或題意不清,使得考生無法作答或是僅憑猜測作答。

2.3試卷質量分析

校方選用了集中量分析、差異量分析、試卷信度、成績頻數(shù)分布、試卷難度分布情況和試卷區(qū)分度分布情況作為評定指標。

2.3.1集中量分析給出試卷滿分和平均分。平均分反映學生成績的總體水平,理想狀況在70分~80分之間。

2.3.2差異量分析給出最高分、最低分和標準差。標準差反映學生成績的離散程度,用以檢驗考試區(qū)分學生掌握學業(yè)內容程度的能力。標準差越大表明成績的離散度越大,通常標準差在9分~13分之間較為理想。

2.3.3試卷信度信度是衡量一個試卷質量高低的重要指標之一。信度高的試卷表明考試能較真實地反映出學生的學業(yè)水平。信度不合要求的試卷是不能使用的。校方采用克朗巴赫a信度系數(shù)。

通常影響信度的因素包括:①樣本情況。樣本的異質程度與分數(shù)的分布有關,樣本越是異質,其分數(shù)分布的范圍也就越大,信度系數(shù)也越高。②題目數(shù)量。一般來說,測驗越長,試題越多,信度值越高。這是因為測驗加長后,試題取樣的代表性增加,每個題目的隨機誤差也較小。③難度。測驗的難度與信度沒有直接對應關系,但當測驗太難或太易時則分數(shù)的范圍就會縮小,從而降低信度。

2.3.4成績頻數(shù)分布分析系統(tǒng)以10分為組距、成績?yōu)闄M坐標、人數(shù)為縱坐標給出成績頻數(shù)分布圖。它的作用是,當成績分布曲線呈正偏態(tài)時,說明低分學生多,可能題目偏難;成績分布曲線呈負偏態(tài)時,說明高分的學生較多,可能題目偏容易;而理想狀態(tài)為成績呈正態(tài)分布,此時說明成績很好和很差的學生較少,接均分的學生較多。

2.3.5試卷難度分布難度對考試的影響主要表現(xiàn)在:①影響考試成績的分布形態(tài),正常人群智力的高低分布服從正態(tài)分布,所以在適宜難度的考試中,學生的成績分布應基本服從正態(tài)分布,難度過大或過小都會使成績分布偏離正態(tài)。②影響考試成績的離散度,過難或過易的考試會使成績相對集中在高分端或低分端。③影響考試區(qū)分度。一套高質量的試卷應該合理分配題目的難度,整個試卷的平均難度基本控制在0.35~0.65之間,試題難、中、易的比例大致為20%、60%、20%。

2.3.6試卷區(qū)分度分布分析系統(tǒng)匯總整個試卷上所有題目的區(qū)分度,以區(qū)分度值從0~1.0為橫坐標,以不同區(qū)分度值的試題數(shù)為縱坐標,給出整個試卷上區(qū)分度分布情況。通過區(qū)分度分布分析,可以提示試卷是否需要進一步改進。

試卷質量分析范文第2篇

一、引言

考核是檢驗教學質量最重要的手段之一,試卷的質量和學生考試成績是衡量教學質量的主要方法。通過對試卷分析,可以反饋學生學習情況,評估教學效果,為進一步推進教學改革、提高教學質量提供參考。[1]

雖然目前許多高校在教學評價方面都呼吁評價形式的多樣化,但試卷測試仍然是最主要的方法,因此試卷質量分析成為高校教師教學過程中的一個必備環(huán)節(jié)。目前多數(shù)學科如數(shù)學和醫(yī)學專業(yè)已經(jīng)重視試卷成績和試題質量分析,[2-7]]對世界自然地理的課程與教學改革方面進行研究較少,[8-10]賀丹君等從評價體系上對地理課程進行定性分析和評價,未對試卷質量進行定量分析。[11]然而,《世界自然地理》是高等院校地理專業(yè)的必修課程之一,它最能體現(xiàn)地理學的綜合性、區(qū)域性和人地相關性,具有其它地理學分支學科不可比擬的優(yōu)勢,所以對《世界自然地理》試卷成績進行定量分析,評價試卷的優(yōu)劣是很有必要的。本文對2007級地理科學專業(yè)57名學生的世界自然地理期末考試成績進行分析,評判試卷對學生學習情況的反映能力,旨在為今后的考試命題和教學改革提供參考依據(jù)。

二、數(shù)據(jù)來源與研究方法

1. 數(shù)據(jù)來源

2007級地理科學本文由收集整理專業(yè)的本科生共57名學生的世界自然地理期末考試試卷。試卷由任課教師命題,試卷評判嚴格按照評分標準和標準答案進行,由任課教師評分。試卷卷面分值滿分為100分,包括4種題型,26道小題:第一題單項選擇題包含15道小題,占總題目數(shù)的57.69%,共15分;第二題簡答題包含5道小題,占總題目數(shù)的19.23%,共40分;第三題填圖題包含4道小題,40個空,占總題目數(shù)的15.38%,共20分;第四題論述題包含2道小題,占總題目數(shù)的7.69%,共25分。

2. 方法

試卷分析主要是指通過收集一定量的原始數(shù)據(jù),按照設定的評價指標,運用測量學和統(tǒng)計學的理論,通過計算各種統(tǒng)計量數(shù)和繪制統(tǒng)計圖表,對試卷進行定量分析和評價。[12]可以針對某一門課程,比較學生各成績段的比例,分析學生成績的分布是否合理,與試卷內容是否相關等。評價指標可以從教學大綱、命題、試題數(shù)量比例等方面來設定。

試卷質量的統(tǒng)計分析是運用數(shù)理統(tǒng)計描述和統(tǒng)計推斷的方法,對試卷的數(shù)量特征和數(shù)量關系進行分析和判斷。[12]根據(jù)《教育測量學》的介紹,[13]本文主要選取難度、區(qū)分度兩個指標對試卷質量進行統(tǒng)計分析。

(1)難度。試題的難度是衡量試題難易程度的指標。[13]

在編制試題時,難度分布從易到難,逐步增加難度,這樣有利于考生水平的正常發(fā)揮。試題的難度即考生對該題的通過率或得分率,對于答對得1分、答錯或不答得0分的試題,難度(p)就是答對(或通過)試題的人數(shù)與考生總數(shù)之比:

(1)

式中,r為答對該題的人數(shù),n為考生總數(shù)。

對于滿分量大于1分的試題,難度則是考生對該題的平均得分與該題的滿分之比:

(2)

式中, 為考生對該題的平均得分, 為該題的滿分。p值越大,試題越容易。因為百分制以60分為及格,通常情況下,把平均難度控制在0.45~0.75之間比較合適。[13]試題難度的評價標準見表1。

表1 試題難度的評價標準

(2)區(qū)分度。題目區(qū)分度是指檢驗題目對其學業(yè)水平不同的考生的區(qū)分程度或鑒別能力,它是學生掌握知識水平和能力差異的指標。[14]通過考試,學習好的學生得到高分,學習差的學生得到低分,則說明試題的區(qū)分度高;如果學生中好、中、差三個層次的考試成績處于同一個分數(shù)段中,就反映不出學生學習水平,那么這樣的試題區(qū)分度就低。所以一般采用比較方便的兩端分組法來計算試題的區(qū)分度。所謂兩端分組法,即當測試成績成正態(tài)分布時,將考試總分進行排序,然后選出得分最高的27%列為高分組,將得分最低的27%列為低分組。區(qū)分度計算公式如下:

,其中i=1,2,3,……n (3)

式中, 和 分別表示全體考生中的高分組和低分組中第i題的平均分; 表示第i 題的滿分值。d≥0.40為優(yōu)秀;0.30≤d<0.40為良好;0.20≤d<0.30為尚可,需改進;d<0.20為劣,需淘汰或修改。[15]試題區(qū)分度的評價標準具體見表2。

表2 試題區(qū)分度的評價標準

3. 結果分析

從2007級地理科學專業(yè)世界自然地理期末考試的成績分布來看,試卷滿分為100分,客觀題總分為35,主觀題總分為65,學生考試的平均成績?yōu)?8.35,最高分為91,最低分40.5,標準差10.10,及格率為80.7%,不及格率為19.3%。

一是課程成績分布情況分析。

(1)試卷總成績分布:2007級地理科學班的57名學生,有39名學生成績分布在60~79分內,占68.42%;有6名學生成績分布在80~89分內,占10.53%;有10名學生成績分布在50~59分內,占17.54%;僅1名學生成績高于90分和低于40分,各占1.75%,見表3。通過繪制成績分布直方圖可以看出,該班期末成績總體呈正態(tài)分布,見圖1。教育統(tǒng)計學統(tǒng)計規(guī)律表明:學生的智力水平,包括學習能力,實際動手能力等呈正態(tài)分布。考試成績分布應基本服從正態(tài)分布,這樣才能真實反映學生的實際,也能夠說明試卷設計是合理和具有科學依據(jù)和實際意義的。[15]本試卷總成績呈正態(tài)分布,說明試卷總體設計合理、可靠、科學。

轉貼于

表3 《世界自然地理》期末考試總成績分布情況

圖1 《世界自然地理》期末考試成績分布圖

(2)試卷各大題成績分布。該試卷共四個大題,因為各題總分不一樣,所以把各大題以100分為基準,對分數(shù)段進行折合計算,具體各分數(shù)段的人數(shù)和比例見表4。通過對各大題繪制直方圖可以看出,單選題、填圖題成績分布呈偏正態(tài)分布,簡答題成績呈偏態(tài)分布,但是沒有單選題和填圖題嚴重,大體還呈正態(tài)分布,這看出就大題而言,單選和填圖題設計過于簡單,不能很好反應學生的學習能力,但是單選和填圖屬于識記類知識類型,本來就不好區(qū)分學生層次,所以總體看來還是符合實際的;簡答和論述題成績大致呈正態(tài)分布,能較好地體現(xiàn)學生學習效果的差異和智力水平,設計很好,見圖2。

二是難度、區(qū)分度分析。從總成績看,試卷難度為0.680,試卷區(qū)分度為0.402,表明整卷難度適中,區(qū)分度好,總體來說試卷質量優(yōu)良。在各大題中,難度都適中,區(qū)分度除了單項選擇題為0.29,試題尚可,須進一步改進外,其它三道大題都為優(yōu)良。結合2007級地理專業(yè)的學生為理科生的專業(yè)背景,地理基礎知識相對薄弱的實際情況,可以看出該試卷的論述題等反映綜合能力的試題偏難,但區(qū)分度較好,適合考核學生的實際學習水平,有利于提高學生考試的有效性程度,見表5。

三、結論及建議

通過結果分析可以看出,該試卷整體的命題結構好,學生總成績和大部分大題成績呈正態(tài)分布,試題難度適中,除了選擇題之外,其他題型區(qū)分度很好。建議以后命題要嚴格按照教學文件規(guī)定的要求,不斷完善命題工作,特別是選擇題的要加強命題的難度和區(qū)分度,同時應該從新課改的理念出發(fā),不斷改進命題工作,讓考試在教學過程中發(fā)揮其應有的積極作用。

1. 試卷構成

整卷共四道大題,26道小題,客觀題和主觀題的比例為7:13;客觀題主要考核學生對世界自然地理的基本概念及基本知識的掌握與理解的程度,而主觀題則是考核學生歸納總結、分析、理解和應用知識的能力。本試卷考試內容覆蓋面較廣,基本涵蓋教學大綱要求的大部分教學知識點,符合教學大綱的要求。該試卷試題綜合了教學大綱的多個知識點,適當增加了一定的難度和深度。試卷結構記憶類占20%,理解類占40%,簡單類占15%,綜合應用類占25%;試卷各類題型所占的比例均符合教學要求,難度適中則反映出本課程的基本知識點、重點和難點。

2. 考試成績分布

由于2007地科班屬于理科生,沒有高中地理知識的基礎,所以本次試卷的命題不但注重學生綜合分析能力的提升,同時也關注學生的地理基礎知識,因此試題大約有70%是考察學生綜合思維能力和分析能力的,涉及知識范圍較廣,其目的是提高學生對所學課堂內容進行總結提煉及實際應用,也設計有30%左右的基本知識題,如選擇和填圖題。從總成績來看,該卷的成績分布是呈正態(tài)分布,反映出絕大多數(shù)學生對考查綜合能力的試題還是比較適應的,其分值大部分集中在60~80分,見圖1;從各大題成績來看,簡答和論述題成績基本呈正態(tài)分布,試卷能很好區(qū)分學生層次和體現(xiàn)他們各自的能力水平,能很好達到測驗目的,但是單選、填圖題的成績分布呈偏正態(tài),雖然這兩大題屬于識記型,但是作為試卷設計,還是應該從科學性測驗出發(fā),更好體現(xiàn)學生水平為原則,所以在以后的命題中,會更加注重這兩部分題目的科學性和實踐性。綜合以上分析表明,本次考試基本反映出學生對世界自然地理知識學習的實際水平,同時也說明命題者對試題難度等因素掌握得較好。

3. 試題的難度與區(qū)分度

難度和區(qū)分度都是判斷試題質量的重要指標,用于衡量考生能力的程度。通過一次考試將不同程度和不同能力的學生區(qū)別開來。難度系數(shù)(p)是反映試題難易程度的重要參數(shù),難度系數(shù)越小,說明試題難度越大。一般認為試題的難度系數(shù)應控制在0.45~0.75之間比較合適。[10]本次試卷的平均難度系數(shù)為0.68,四個大題的難度分別為(單選題0.72,簡答題0.70,填圖題0.71,論述題0.62),不管是從整個試卷來看還是從各大題來看,本套考卷所有類型試題的難度系數(shù)在0.62~0.72之間,根據(jù)表1(試題難度的評價標準)來看,試題難易程度適中,比較合理,能區(qū)分學生能力。

區(qū)分度(d)是衡量試題質量的另一重要因素,是評價試題質量、篩選試題的主要指標,d值越大,區(qū)分效果越好。一般認為,d≥0.4,區(qū)分度極好;0.3≤d≤0.39,區(qū)分度良好;d≤0.19,區(qū)分度極差;所以試題區(qū)分度≥0.20即為可用試題,而區(qū)分度≤0.19的試題應該被淘汰。世界自然地理是地理學的一門基礎主干課程,有其特殊性,概念多,需要記憶的知識多,尤其記憶各大洲的山脈、河流、湖泊容易記錯,各周的地理位置不易描述,而且該級的學生是理科生出生,地理基礎知識掌握有待提高,諸多因素使命題者難以把握試卷的難易程度及區(qū)分度。在本試卷中,整卷區(qū)分度為0.402,各大題中,除了單選題的區(qū)分度<0.30(為0.29)外,簡答題、填圖題和論述題的區(qū)分度均>0.40(分別為0.53、0.48和0.52),而且簡答題、論述題的區(qū)分度非常好(d>0.5)。通過試卷分析表明,本套試題的區(qū)分度、易難度良好,其分析結果為命題者今后的命題工作提供了參考依據(jù)。但今后對單選題和繪圖題的區(qū)分度還需要進一步加以改進,判斷題應淘汰或注意完善該題型的區(qū)分度。

4. 今后命題工作的導向

試卷質量分析范文第3篇

關鍵詞: 經(jīng)典測量理論 信度 難度 區(qū)分度

一、引言

教育測量與評價是教育研究領域中重要的組成部分,是學科教學活動中科學管理的有效手段。《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》明確把提高教育質量作為教育改革發(fā)展的核心任務,并多次強調與教育質量的監(jiān)測和評價相關的內容[1]。顯然,在當前教育制度下,各種筆試仍是一種重要而有效的教育質量定量評價方式。試卷質量自然影響對教育質量的正確評價,因此,針對筆試試卷的質量分析顯得尤為重要。

試卷質量的分析一般是利用經(jīng)典教育測量理論(CTT: Classical Test Theory)和項目反應理論(IRT:Item Response Theory)進行分析。

經(jīng)典測量理論又稱為真分數(shù)理論,假定觀察分數(shù)X與真分數(shù)T線性相關,即CTT的數(shù)學模型為X=T+E,其中,隨機誤差E服從均值為零的正態(tài)分布。該理論最重要的四個指標正是反應試卷是否真實可靠、準確有效、難易適中、鑒別力強的信度、效度、難度和區(qū)分度等測驗質量指標[2]。當然,由于其比較依賴樣本、信度估計精度不高、難度和被試水平?jīng)]有定義在同一參照系上,同時,無法回答總分相同的考生的真實能力有無差異等問題,該理論也存在一定的局限性[3]。

項目反應理論是一種新興的心理與教育測量理論。該理論的前提假設非常嚴格,主要包括單維性假設和局部獨立性假設[4]。主要方法是在利用參數(shù)模型的基礎上,利用項目特征曲線、試題信息函數(shù)進行探討,同時利用EM算法,用邊際極大似然估計方法尋找項目參數(shù)的一致估計[5]。

本文主要利用南寧市某中學2013年秋季學期數(shù)學期末考試成績,在經(jīng)典測量理論(CTT)范疇下探討該次期末考試數(shù)學試卷的信度、效度、難度、區(qū)分度和成績分布情況。通過試卷“四度一分布”了解試卷質量,并反饋教學效果情況。

二、基于CTT的試卷質量情況分析

1.成績分布情況

一般而言,一份好的試卷考試的成績都服從或近似服從正態(tài)分布,因此,考試成績的正態(tài)性是考察試卷質量的一個首要指標。檢驗正態(tài)性的方法很多,常見的是利用直方圖和卡方檢驗、K-S檢驗。從參加本次考試的872人中隨機抽取387人的成績進行檢驗,結果如圖1所示:

圖1 學生成績的直方圖

正態(tài)分布的K-S統(tǒng)計量顯著性概率P值為0.095>0.05,因此,這次考試學生成績服從正態(tài)分布。

2.信度

中學試卷中,選擇題分數(shù)可簡化為0,1得分情況來解釋,解答題和填空題可以看成非0,1記分的項目。因此,選擇題信度主要采用折半信度[斯皮爾曼-布朗(Spearman-Brown)公式、盧隆(Rulon)公式、弗拉納根(Flanagan)公式]和庫德-理查遜(Kuder-Richardson)信度(K-R20、K-R21公式)進行分析[7]。填空題和解答題為非0、1記分的項目,采用克龍巴赫系數(shù)進行統(tǒng)計,結果如表1所示。

表1 試卷信度分析結果

結果表明,每種方法計算的選擇題信度都接近0.7,信度系數(shù)處于尚可使用范圍之內。研究表明,對于標準化的大型測試題目信度要求一般要在0.9以上,而學校期末考試的信度在0.6以上即可接受[1]。選擇題、解答題的克龍巴赫系數(shù)為0.905,可以認為填空題和解答題的信度非常好,綜合考慮,試卷整體信度是可信的。

3.效度

效度(validity)是指測驗結果的有效性或準確性,即通過測驗能夠正確測量出它所要測量的屬性的程度[5]。測量的效度的種類很多,其中基于專家和教師對試題與所涉及的范圍進行符合性判斷的邏輯判斷法的內容效度使用較多。內容效度是指測驗內容對所要測驗的全部內容的代表性程度。但一次考試很難包含學生所學課程的所有內容,因此只能選擇具有代表性的試題進行考核,來了解學生的知識技能掌握情況[8]。

根據(jù)測量的目標與內容的雙向細分表,經(jīng)過該校7位一線數(shù)學教師(其中高級教師4位,中教一級2位,中教二級1位)不記名反饋信息來看,本次考試所設計的試題覆蓋了所要測內容的主要方面,考查目標清晰明確,題型和分數(shù)結構合理恰當,總體符合考試大綱和教學要求。

4.難度

試題難度是反映考題難易程度的指標,一般而言是按照答對人數(shù)的百分比確定的,是衡量試卷質量的最主要的數(shù)量性指標,簡單來說可以利用測驗分數(shù)的分布情況和特征進行觀測,例如考察測驗分數(shù)的全距、零分、滿分、眾數(shù)、平均分數(shù)等相關指標進行定性的判斷,也可以根據(jù)不同的情況,利用有關公示進行精確計算。

一般而言,難度的取值范圍在[0,1]之間,取值越大,難度越小。難度在0.7以上的為比較容易的題,在0.4-0.7為中等難度的題,在0.4以下的則為較難的題或是難題。在實際教學中試卷難度水平的選擇,應取決于測驗的目的和試題的形式。如果測驗是用于區(qū)分學生水平,那么應該將試題或試卷的難度系數(shù)控制在0.5左右,各試題難度值在0.2-0.8,同時各題平均難度值在0.5左右是比較適宜的[5]。

對于采用0,1記分的選擇題,用通過率P、平衡猜測的校正公式CP和極端分組法計算各個試題的難度。

表2 選擇題的難度

對于非0,1記分的填空題、解答題和總分,用難度系數(shù)和極端分組法計算各個項目的難度。

表3 填空題、解答題的難度

結果顯示,就選擇題而言,三種計算方法的計算的難度差異不大,整體趨勢較一致,從三種公式的難度均值看,第1、2、5、6、7、8、9屬于難度較小的題目,3、4、10、11、12屬于難度中等偏上的題目,其中第4題難度最大,10,11,12三題難度也較大,選擇題總體難度為0.767,屬于比較容易,從試題編排上看,除個別題目外,整體趨勢是容易的題型放在前面,中等難度試題放在題型中間,較難試題放在題型后面,較合理。

對填空題和解答題而言,題目難度顯然大于選擇題,填空題總體難度均值為0.499,難度中等,解答題總體難度均值為0,472,屬于中等偏難程度,8道解答題的難易程度也和題目順序基本一致,越難的題目越在后面,符合數(shù)學試卷的一般規(guī)律。

從考試成績來看,難度系數(shù)為0.548,綜合選擇題、填空題、解答題三種類型的難度均值,整張試卷難度均值為0.579,和總分難度系數(shù)接近,因此,可以判定該份試卷總體難度適中。

5.區(qū)分度

區(qū)分度是反映試題效用的一個主要參數(shù),同時也是試題對考生實際水平的鑒別能力,將不同層次的考生區(qū)分開來的統(tǒng)計量。若試題的測試結果是水平高的學生答對或者得高分,水平低的學生答錯或者得低分,則認為試題的區(qū)分能力強。一般而言,區(qū)分度在0.4以上為最佳效果,在0.3~0.39為合格,修改會更好,在0.2~0.29為勉強,仍需耍修改,區(qū)分度在0.19以下為差,必須淘汰[6]。

對于0,1記分的選擇題,利用極端分組法、點二列相關計算各個試題的區(qū)分度。

表4 選擇題的區(qū)分度

對于連續(xù)記分的主觀性試題填空題、解答題和總分,用極端分組法和相關法計算各個項目的區(qū)分度。

表5 填空題、解答題以及試卷的區(qū)分度

注:試卷區(qū)分度是將各題區(qū)分度進行加權平均計算的。

結果顯示,對于選擇題而言,總體看來,整個選擇題中大部分題目的區(qū)分度都在0.4以上。通過極端分組法和點二列相關系數(shù)計算的區(qū)分度在大部分題目中相差不大。極個別題目有明顯差異,主要在于兩種方法考慮的視角不一致,就第1題而言,極端分組法的區(qū)分度指標0.093,是利用高分組和低分組之間差異進行計算的,兩者差異很小,說明該題無論是高分組還是低分組都能完成,就區(qū)分能力而言屬于應該淘汰的題目,但正是由于該題目在高低分組中完成率都較高,和總分的相關性自然就大,因此,點二列相關法計算出來該題的區(qū)分度較高。兩種方法計算的試卷區(qū)分度均在0.6以上,說明該試卷區(qū)分能力強,區(qū)分效果佳。

三、有關結論

事實上,該次試卷為全市統(tǒng)一考試題目,從一定程度上說屬于“較大的標準化”考試題目。從上述分析可知,本次考試成績的分布直方圖并未凸顯畸形特征,基本上呈正態(tài)分布,單峰,稍微右偏。就四度而言,填空題、解答題的信度很好,但選擇題的信度適中。常見的提高測驗信度主要有以下方式:一是適當增加試題量;二是提高質量,試題難度要適中,區(qū)分度大;三是調整試題編排順序,盡量做到先易后難。

測驗的效度采用學科專家通過邏輯分析法進行分析的,根據(jù)測量的目標與內容的雙向細分表,了解到試題覆蓋了所要測內容的主要方面,考目標清晰明確,題型和分數(shù)結構合理恰當,總體符合考試大綱和教學要求。

試題的難度較合理,大部分選擇題難度偏低,其中第4、10兩題難度最大。而最后一道解答題的難度系數(shù)則過大。這和數(shù)學試卷利用最后一題作為壓軸題有密切關系。

試題的區(qū)分度方面反應較好,但選擇題第1、2題和解答題最后一道題在兩種計算方法中差異很大。可能的原因在于第1、2題屬于難度很低的送分題,因此區(qū)分度也不高,最后一道壓軸題屬于難度最大,很多學生放棄作答,因此存在這方面的問題。

四、結語

考試是衡量教學效果的必要手段。隨著統(tǒng)計學及經(jīng)濟計量學邊緣的不斷擴張,對于教學結果的評價越來越依賴于科學的理論和方法。教育評價技術方法中教育測量理論就是應用教育統(tǒng)計學方法實現(xiàn)的,成為測評學生能力、考核教育效果的重要措施。利用SPSS測度考試的難易度、區(qū)分度、信度、效度等指標,不僅可以直觀、便捷分析考試結果,發(fā)現(xiàn)考試中的重要信息和規(guī)律,還可以為教學效果評估提供重要的考核指標和模式。目前在教育教學及科研領域,人們采用科學的測評方法測度試卷科學性的嘗試并不多,尤其是一些規(guī)模較小的考試,這不利于教學質量和教師素質的提高,亦不利于考試學研究者開啟新的研究視域。應該加強對試卷科學化測度的研究及實踐,使考試這一重要的教學環(huán)節(jié)日益走上科學化和規(guī)范化的軌道。

通過試卷質量分析,不僅可以了解試卷情況,更可以利用試卷科學性測評的方式了解教師的教學效果,同時也可以通過建立試題庫、制定命題雙向細目表等方式,提高試卷質量。

參考文獻:

[1]《國家中長期教育改革和發(fā)展規(guī)劃綱要》關注教育質量監(jiān)測[N].基礎教育質量監(jiān)測信息簡報,教育部基礎教育質量監(jiān)測中心,2010,1.

[2]郭熙漢,何穗,趙東方.教學評價與測量[M].武漢:武漢大學出版社,2008.

[3]杜洪飛.經(jīng)典測量理論與項目反應理論的比較研究[J].社會心理科學,2006(6):15-17.

[4]Christine DeMars.Item Response Theory[M].London:Oxford University Press,2010.

[5]何穗,吳慧萍.基于教育測量理論的中學數(shù)學試卷質量評價研究[J].考試與招生,2012(08):49-53.

[6]Robert L.Ebel.Measuring Educational Achievement [M].Englewood Cliffs,N.J., Prentice-Hall,1965.

試卷質量分析范文第4篇

【關鍵詞】教師 學生 試卷 分析

縱觀近年來語文試卷,嚴格按照語文課程標準的要求命題,試卷遵循基礎性、生活性、發(fā)展性的原則,密切聯(lián)系學生實際,關注學生心靈,緊緊圍繞教材,側重考查學生的語文基礎知識和基本技能,較好地滲透新課程理念,對提高學生成績和增強教育效果有著較好的導向性作用。

一、試題特點

考查的維度力求由知識和能力的單維,走向三維,確定考評的三維空間:即知識和能力、過程與方法、情感態(tài)度和價值觀,促進學生知識、能力、態(tài)度及情感的和諧發(fā)展。試題源自教材,題目的形式又有別于教材,在一定程度上促進了學生的語言積累,注重了語感的培養(yǎng),有利于學生語文素養(yǎng)的形成,體現(xiàn)了“課程標準”的要求,對今后的語文教學也起到了明確的導向作用。

注重積累,體現(xiàn)課內與課外結合,體現(xiàn)語文和生活結合,具體考查學生對基礎知識和基本技能的掌握情況。如:積累運用部分充分體現(xiàn)了科學性原則,而課外閱讀和習作展示注重了開放性,給學生留有很大的思維空間。

注重創(chuàng)新精神與想象能力的培養(yǎng)。試卷中較多體現(xiàn)富有人性化色彩,體現(xiàn)人文關懷,尊重學生個性化的思考和創(chuàng)造性的解答。部分題目要求寫出父母對兒女之間的真情實感,給學生一個充分寫作的空間,豐富學生的想象能力,培養(yǎng)學生的個性發(fā)展。

整個試題力求體現(xiàn):注重基礎,突出能力,尊重個性,鼓勵創(chuàng)新,聯(lián)系生活的原則。試題難易、題量均比較適中,避免偏、難、怪題,較全面的對學生進行應知應會的考查。

二、試卷分析

一般來說,試卷分為四個板塊,前兩大板塊都是基礎性題,都是課內所需掌握的知識,是學生應知應會的,大多學生也都得到了一個滿意的分數(shù),但學生在答題過程中所暴露的一些問題和弱點還是應該引起我們的重視。

第一板塊,基礎知識題。是對學生生字詞和查字典方法的掌握情況的考查。通過試卷可以看出,大部分學生對生字的識記和查字典的方法掌握得都很扎實,只是個別學生失分。失分的主要原因是錯別字,極少數(shù)學生對課文中要掌握的一類字掌握不太好,多筆少畫,對易錯字識記不準,記憶不牢;對較復雜的字部首分辨不清。如:慈祥的“祥”;再接再厲的“厲”與勵精圖治的“勵”混淆;“砸”字的筆順30%的學生出現(xiàn)問題。

第二板塊,積累運用題。從卷面看,改寫句子、補充詩句、積累名言或句子等這類課本上的積累性知識掌握得都很好,但像積累擬人句、比喻句、補充句子、重新排序等這種稍活一些的題,學生就顯得有些犯難,普遍失分較多。究其原因:一是多數(shù)學生審題失誤。對課本中一些精講課文中重點語句和段落積累鞏固不夠,寫的句子并不是本冊課文中的句子或不是擬人句、比喻句,還有一部分學生對“擬人”這一修辭手法含糊不清。二是學生讀題分析、判斷運用能力不夠。不能利用語句中關鍵的詞語分析,理清關系進行排序。

第三板塊,閱讀理解題。主要是對學生的默讀能力、理解能力、領悟其表達方法、體會表達情感等閱讀能力的綜合考查。學生完成較差,失分較高。主要表現(xiàn)在課外閱讀部分:學生審題不清,“先讀句子,再回答問題”,對句子體會不夠,不能很好地感受到作者所要表達的思想感情,答題失誤較多。學生對標點符號的填寫能力欠缺,不能借助上下文內容根據(jù)語境填寫恰當?shù)臉它c符號,對某些標點符號的用法不清,缺乏良好的語感培養(yǎng)與訓練。學生對揣摩短文中心,領悟文章基本的表達方法,抓住重點詞句體會作者所表達的思想感情等綜合閱讀能力較差。

第四板塊,作文。從閱卷情況看,大部分學生能按自己的體會,寫出真情實感,但學生在考場作文中反映出來一些問題:一是選材缺乏新意,視野不夠開闊,僅局限于那一兩件典型的事情上,少數(shù)同學敘事不清;二是語言積累不夠,詞語貧乏,語言表達是一個弱項;三是寫作技巧欠缺,作文段落不清楚;四是字跡潦草,書寫不規(guī)范的作文較多,錯別字現(xiàn)象仍較普遍。

三、對今后教學的啟示

要注重實踐,加強語言文字訓練。語文的學習資源和實踐機會無處不在,無時不有,我們應該積極的創(chuàng)造條件,給學生創(chuàng)設語文實踐的環(huán)境,讓他們積累大量的感性材料,尤其要注重語文的工具性,加強學生理解與運用語言的能力,語文能力才能不斷提高。認真學習新課程標準,積極倡導自主、合作、探究的學習方式。我們只有在平時的教學中落實課標精神,才能使學生有所發(fā)現(xiàn)、有所發(fā)展、有所創(chuàng)新。隨著課標的實施和考試命題的進一步改革,開放性試題、個性化試題和創(chuàng)新試題將會越來越多,因此,我們必須緊跟教育形勢的發(fā)展,更新教育理念,不斷改進教法,努力培養(yǎng)有創(chuàng)新精神的高素質的人才。

要拓寬學生視野,豐富知識積累。積累對提高學生的整體素質起著至關重要的作用。在語文教學法中,讓學生多讀書,讀好書,多思考,引導學生有目的、有計劃、有方法的進行課外閱讀,并指導做好摘抄和讀書筆記。同時要充分利用語文教育資源,開展諸如手抄報、辯論、演講等豐富多彩的綜合實踐活動,從而達到拓寬學生視野,豐富知識積累的目的。重視方法的指導與能力的培養(yǎng),讓學生掌握閱讀方法,在培養(yǎng)閱讀能力、分析問題能力、理解能力上下功夫。

【參考文獻】

試卷質量分析范文第5篇

衛(wèi)生行政處罰是衛(wèi)生行政部門對違反衛(wèi)生相關法律法規(guī)規(guī)范的公民、法人或其他組織依法實施的法律制裁。從衛(wèi)生行政部門角度而言,衛(wèi)生行政處罰是衛(wèi)生行政部門的一種具體行政行為,從受處罰的當事人角度而言,衛(wèi)生行政處罰是其為自己的違法行為而承擔的行政法律責任。因此,衛(wèi)生行政處罰案卷的質量能夠反映出衛(wèi)生行政部門及衛(wèi)生監(jiān)督員的辦案能力和行政執(zhí)法行為的規(guī)范情況。為進一步規(guī)范衛(wèi)生行政處罰行為,推進本市衛(wèi)生行政部門及衛(wèi)生監(jiān)督員依法行政辦案能力,我們將常州市2005年度食品衛(wèi)生、醫(yī)政執(zhí)法、公共場所、職業(yè)衛(wèi)生等各專業(yè)衛(wèi)生行政處罰案卷進行了認真審閱與分析,現(xiàn)將有關情況分析如下。

1 資料與方法

我市2005年共承辦各類衛(wèi)生行政處罰案件815件。按執(zhí)法專業(yè)分類,食品衛(wèi)生處罰案卷612件,占75.09%;醫(yī)政執(zhí)法案卷114件,占13.99%;公共場所處罰案卷55件,占6.75%;消毒產(chǎn)品案卷9件,占1.10%;職業(yè)衛(wèi)生處罰案卷7件,占0.86%;化妝品案件6件,占0.74%;涉水產(chǎn)品處罰案卷5件,占0.61%;其它類別案件7件,占O.86%;按辦案程序分類,簡易程序253件,占31.04%,一般程序557件,占68.34%,聽證程序5件,占o.61%。我們組織法律、食品衛(wèi)生、醫(yī)政執(zhí)法等各專業(yè)的專家和專業(yè)人員對案卷嚴格按照《常州市衛(wèi)生監(jiān)督所行政處罰案卷質量評定標準(試行)》進行評分定級。該評定標準根據(jù)《中華人民共和國行政處罰法》、《衛(wèi)生行政執(zhí)法文書規(guī)范》以及本市政府法制部門對行政處罰案卷考核評議要求制定,由文書擇用、處罰對象認定、處罰程序、證據(jù)收集、法律適用、裁量適當、案卷裝訂8項內容組成,8項內容又各自細化為若干小標準。案卷整體得分在90分以上的為甲級案卷,在80~89分為乙級案卷,60~79分為丙級案卷,60分以下的為不合格案卷。處罰程序、證據(jù)收集、法律適用、文書質量4項有扣分的不得評為甲級案卷;處罰對象認定、處罰程序、法律適用錯誤的則評為不合格案卷。對案卷中存在爭議的問題則由數(shù)位專家和專業(yè)人員共同討論分析,得出最終結果。

2 結果

經(jīng)過打分評定,甲級案卷645份,占79.14%;乙級案卷112份,占13.74%;不合格案卷58份,占7.12%;無丙級案卷。常州市衛(wèi)生監(jiān)督所承辦的126份衛(wèi)生行政處罰案卷中,甲級案卷有121份,占%.03%;乙級案卷2份,占1.59%;不合格案卷3份,占2.38%;所轄2市5區(qū)衛(wèi)生監(jiān)督所承辦的689份衛(wèi)生行政處罰案卷中,甲級案卷有524份,占76.05%;乙級案卷110份,占15.97%;不合格案卷55份,占7.98%。

3 討論

2005年本市衛(wèi)生行政處罰案件數(shù)達815件,較2004年的648件增加了20.5%,案件數(shù)量的增加反映了本市衛(wèi)生監(jiān)督部門和衛(wèi)生監(jiān)督員的辦案能力有明顯提高,處罰案卷質量也得到了本市司法部門以及政府法制部門的肯定,執(zhí)法程序完備規(guī)范,適用法律準確,處罰裁量適當,證據(jù)收集形式豐富多樣,執(zhí)法文書符合衛(wèi)生部執(zhí)法文書規(guī)范要求。

3.1 執(zhí)法領域拓展

2005年衛(wèi)生執(zhí)法重心由傳統(tǒng)的公共衛(wèi)生向醫(yī)政執(zhí)法逐漸轉移。2003年以前,本市沒有開展醫(yī)政方面的處罰,2004年僅有18件,且多以警告、責令整改為主,2005年度處罰案卷中雖仍以食品衛(wèi)生為代表的公共衛(wèi)生領域為主,但醫(yī)政執(zhí)法案件有114件,占案例總數(shù)的13.99%,執(zhí)法依據(jù)涵蓋了《醫(yī)療機構管理條例》、《執(zhí)業(yè)醫(yī)師法》、《母嬰保健法》等法律法規(guī),且案例具有一定質量,開拓了衛(wèi)生行政執(zhí)法新領域,積累了一定辦案經(jīng)驗,為開拓醫(yī)政領域執(zhí)法奠定了基礎。

3.2 處罰力度加大

衛(wèi)生行政處罰的社會影響和效果日益明顯。由于部分衛(wèi)生法律法規(guī)滯后、缺乏可操作性,執(zhí)法對象日益復雜等原因,衛(wèi)生行政處罰在實踐中遇到很多障礙,操作的難度越來越大。根據(jù)案卷的質量分析,一些案卷的當事人拒絕在筆錄上簽字,一些案卷在調查取證時已不能收集到違法事實的直接證據(jù),而案件承辦人員都能嚴格按照相關程序進行操作。2005年全市衛(wèi)生行政執(zhí)法處罰(沒收)金額達152萬元,較2004年罰沒款129.2萬元增長15.38%。說明雖然面臨的執(zhí)法情勢日漸復雜,但衛(wèi)生執(zhí)法人員的依法行政辦案能力在不斷提高,衛(wèi)生執(zhí)法力度在不斷加大。

3.3 案卷質量較高

從2005年年初,我們采取一系列措施,如對衛(wèi)生監(jiān)督員進行辦案如何取證、固證、案件點評等培訓,建立和規(guī)范衛(wèi)生行政執(zhí)法程序的制度,加強文書制作考核等”。所以,757件甲乙級案卷基本能做到對受處罰主體資格有工商營業(yè)執(zhí)照、當事人身份證等復印件進行確認;處罰程序在文書中固定,每個運作程序嚴格在規(guī)定時限內完成;證據(jù)形式豐富,有書證、物證(或照片)、證人證言、檢測報告等;法律條款適用準確;文書擇用正確。在2005年度本市政府法制部門和省衛(wèi)生監(jiān)督所案卷質量評比中獲得較好成績,得到了本市政府法制部門和省衛(wèi)生監(jiān)督所案卷質量評議組的肯定。盡管辦案質量有較大的提高但仍有不少需要改進的地方。①案卷中各種文書制作質量有待提高。一是案由表述不規(guī)范,未按衛(wèi)生部工作規(guī)范要求書寫案由,如在個人衛(wèi)生不符合衛(wèi)生要求的案例中,將案由書寫為某某工作人員不穿工作服上崗案;二是在法律文書中使用口語化的用語,未使用法律、法規(guī)、規(guī)章中的用語,三是文書中出現(xiàn)錯別字、涂改處未經(jīng)當事人確認;四是表述過于籠統(tǒng)不客觀具體等。②欠缺對當事入主體資格的確認。在對處罰對象的主體認定方面,程序不夠完備,缺乏相應證據(jù)材料,有些案卷出現(xiàn)主體認定錯誤,如在無證生產(chǎn)經(jīng)營的違法行為中,將當事人打出的字號認定為當事人,而不是將無證生產(chǎn)經(jīng)營行為的負責人認定為當事人,這些案卷則被判為不合格案卷。③少數(shù)案卷證據(jù)單薄、未形成證據(jù)鏈。部分處罰案例對違法事實的認定僅有現(xiàn)場筆錄和詢問筆錄予以支持,證據(jù)形式單一,證明力相對較弱。甚至出現(xiàn)了某案卷以鑒定結論作為主要證據(jù)定性違法事實為食物中毒肇事,案卷中未見采樣記錄的情況及其它相關證據(jù)。④適用法律、法規(guī)不具體。評定過程中發(fā)現(xiàn)有少數(shù)處罰案卷在適用法律、法規(guī)時,不能具體適用到款、項,而只是適用到條,為行政處罰被司法部門撤銷埋下隱患。⑤合議較為簡單,合議過程流于形式。部分處罰案卷合議形式化,走過場,案件討論記錄過于簡單化,不能真實反映討論的過程和與會人員每個人的真實意見。如當事人陳述申辯后減輕行政處罰的,在再次合議的過程中不能體現(xiàn)出減輕處罰的理由和依據(jù)。

主站蜘蛛池模板: 长汀县| 渭源县| 荃湾区| 汝阳县| 巢湖市| 蓬溪县| 原阳县| 南澳县| 石屏县| 固阳县| 内江市| 济源市| 慈利县| 来凤县| 炉霍县| 资中县| 合肥市| 华安县| 怀远县| 焉耆| 秭归县| 保康县| 平定县| 康平县| 灵寿县| 昭通市| 兴安县| 长武县| 北碚区| 吉安市| 突泉县| 渭南市| 濉溪县| 广平县| 沾益县| 高密市| 沽源县| 红安县| 西吉县| 阳新县| 西乌|