アイテム分析の理論的背景

私はアイテム分析を用いて最先端技術が何であるかを理解しようとしています。私は文学への道を見つけるのに苦労していますが、私の進歩を記録するためにこのページを始めました。これまでのところ、クラスマーク371.26の前後のOUライブラリで、以下の参照が見つかりました。-- Tim Hunt 05:58、2007年11月30日(CST)

私が古くなった参照

JJバーナード、Geofferey N MasteresおよびJohn P Keeves 1999のテスト構築における項目分析、 195-206ページ、 教育研究および評価における測定の進歩 、Pergamon。

  • 「古典的テスト理論」と「項目反応理論」の2つのトピックに言及しています。
  • 「アイテム分析は、アイテム作家の独創性、努力、およびスキルの代わりになるものではなく、論理的な理由から比較的貧弱な統計結果を覆すことができます。」
  • 「品目分析の間に計算され調べられた2つの最も基本的な統計は、品目の難易度と値です。」
  • 基本的にアイテムの平均得点なら難易度。平均スコアが高いほど、簡単です。
  • この平均を計算するときは、答えを提出しなかった学生を無視するか、またはゼロスコアとして含めるかを決定する必要があります。そして時限テストでは、終わり近くの質問は見逃される可能性が高いということを考慮しなければなりません。
  • 差別については、部分得点のあるなしにかかわらず質問のための異なるテクニックがあります。
  • スコアが0/1(二分的にスコアが付けられている)の質問には、二項相関が最も一般的に使用されます。
  • あなたはこのアイテムのスコアがテスト全体のスコアに含まれているという事実を考慮に入れるべきです。ただし、質問が多いテストでは、修正はわずかです。
  • 項目信頼性指数:( Gulliksenの製品)r it
  • 以上が古典テスト理論です。
  • 項目反応理論は、データへのモデルのフィッティング(最尤推定)を含む、よりコンピューター集約的な手法に基づいています。
  • 「CTTとIRTは、競合する理論的枠組みと見なすべきだと結論付けることができます。デュアル開発者ではなく、デュエットがテスト開発者にほとんどの情報を提供するでしょう。アイテムの欠陥を見つけ、適切なIRTモデルを選択するようにテスト開発者を導くことに関する情報IRTパラメータが提供する利点は、後で特定の目的のためのテストの構築に使用されるべきです。」

RLエベル1972、 教育測定の本質 、プレンティスホール。

William A Mehrens&Irvin J Lehmann 1973、 教育心理学における測定と評価 、Holt Rinehart and Winston Inc.


RL Thorndike 1971、 教育測定 、アメリカ教育評議会。

  • 時限テストの最後にある項目が多くの学生によって省略され、統計が歪んでいるという点について繰り返します。


取得しようとする参照

上記の最後の2つはおそらく両方とも次のものに置き換えられています。

RL Thorndike 2004、 心理学と教育における測定と評価(第7版) 、Prentice Hall。

これは得る価値があるかもしれません(JJ Barnardが引用した前の版):

L Crocker&J Algina 2006、 古典と現代のテスト理論の紹介 、Wadsworth Pub Co.

その他のポイント

  • 別の本は時々あなたが、例えば、可能性のある差別を探すためにグループ(例えば男性/女性)によってテストデータを分析したいと思うと述べました。
  • クラスをランダムに半分に分割し、2つの半分の統計を比較することでテストの信頼性を確認できるという考えがあります。
  • あなたが本当にやりたいことは、テスト全体でのスコアとは対照的に、アイテムスコアとテストで測定しようとしているプロパティ(学生の数学的能力)を比較することです。しかし、あなたがあなたが本当に興味を持っている特性の測度は何もありません - 全体的なテストスコアはあなたがそれを持っている最も良い(唯一の)見積もりです。
  • 私がこれまで読んだ参考文献の年齢は、それらが現代のコンピュータの処理能力を引き受けることができないことを意味します。したがって、それらが説明する手順は不必要に単純化されています。

難しさ

同じ学生による特定の小テストでの繰り返しの試みについてはどうですか。これは分析に対して何をするのでしょうか。

アダプティブモードはどうですか?

結論

おそらくMoodleが教師に基本的な形式のアイテム分析を提供することで十分です。これは明らかに欠陥のある評価項目を捕らえるでしょう。

私達はおそらく非常に洗練された商品分析計画を実行しようとするべきではありません。それらは誤用されがちですが、これは、正しく使用された場合に追加の電力が供給されるという欠点の多くです。

関連情報