うちは工学部で、4回生になると研究室に配属されて卒論のための研究が始まるのですが、その段階で統計データの分析をしなければならないので、研究室内で毎年春から夏にかけて、統計学の基本的な理論とRのコードの書き方の勉強会が行われています。
で、この勉強会の1回目あたりで扱う「統計的仮説検定」についての理解(本質的な意味が分かっているかどうか。まぁ私も分かっているかどうか怪しいですが。)をチェックするための質問をいくつか考えているのですが、他にもっと良いものありますかね?どうでしょう。
- サンプル数とサンプルサイズの違いは?*1
- t分布とF分布について、どのような確率分布であるか、「グラフ」と「(α値付きの)分布表」をどちらも使ってみんなに説明できますか?α値とp値の関係が分かることと、両側確率、片側確率の違いがわかることが必須です。*2
- t分布が発見されたことによって、われわれは何ができるようになった?ハンドルネーム「student」氏はどこがすごい?
- 自由度って何が自由なん?*3それ計算して何が嬉しいん?*4
- p値って何の確率なのか、正確に説明できますか?*5
- 95%信頼区間って、何が95%なん?*6
- 統計的仮説検定でp値が小さくなりやすく(有意になりやすく)なるのはどういう時?ついでに検出力の話もできれば完璧。
- 不偏推定量と一致推定量の違いは?
- p<.05が有意水準としてひろく採用されているのはなぜか知ってる?*7
- 平均値と標準偏差が報告されている基本統計表をよく見るけど、標準偏差からは何が分かる?*8
*1:しょうもないけど、母集団からサンプリングするというイメージを確認するため。
*2:ソフトの使い方の解説を重視した簡単なテキストだと、分布表とか載ってないことがあるので、これをやらせるのは意外と大事。
*3:これは答えやすい
*4:これは答えにくい
*5:教員でもつい「帰無仮説が真である確率」みたいな間違ったことを言ってしまう人が意外といます。
*6:ベイズ信用区間みたいな捉え方をしていないかの確認。
*7:内容的にはただのウンチクですが(笑)、ここに疑問を持たない学生は物事を本質的に理解しようとする態度が足りないと思うので、案外重要。
*8:いろいろ言えるけど、標準偏差を上下に2個分でだいたい95%になり〜みたいな話ができるといい。