StatsBeginner: 初学者の統計学習ノート

文系出身で工学部(工学研究科)の教員をしてます。

2026-01-01から1年間の記事一覧

ステップワイズ法はp値を歪める

さっき学生に説明したことのメモ。 説明変数の候補がたくさんあるときに、説明力が高くなる組み合わせを機械的に選ぶステップワイズ法というのがあります。便利は便利ですが、これをやると、仮説検定の時にp値が歪みます(不当に有意になりやすくなる)。に…

対数変換して求めた予測値を指数で再変換するときの下振れの補正(スミアリング)

昨日学生に説明したことのメモ。 世の中には、何かと何かの「掛け算」で決まっていそうなものが色々あります。たとえば、私はオフロードバイクで山を走るのが好きなのですが、オフロードの走破能力は、マシンの性能と自分の技量の「掛け算」で高まるのだとい…

紙の教科書とデジタル教科書の教育効果を比較した研究のまとめ

参政党の神谷代表が、「デジタル教科書より紙の教科書のほうがいい」という主張をしているらしく、個人的には賛成ですが、いろんな研究があるので場合をわけて考えたほうがいいと思います。 「デジタル教科書より紙のほうが学習効果高いという研究も」“元教…

「便所の落書き」は楽しかった

昔、掲示板サイトの2ちゃんねるがよく「便所の落書き」と批判されていて、いまのSNSも同じように言われることがありますが、最近の都会のトイレは総じて綺麗で、落書きというものを見ることがほぼなくなりました。なので、そもそも便所の落書きとはどんなも…

天体望遠鏡のトレンドが90年代とはだいぶ変わっていた

最小二乗法の歴史を調べていたら(先日のエントリ)、かつて統計学を発展させたのは「天体観測」と「測量」だったのだなぁということを改めて実感したのですが、そういえば私は中高生だった1990年代に天体写真を撮っていました。で、「そういえばいまの望遠…

統計的因果推論の手法を選ぶためのチートシート

統計的因果推論について、学生とかが「手元にどんなデータがあるか」に応じて使える手法を大雑把に判断するためのチートシートのようなものを作っているのですが、正直私自身もあまり理解してなくて、正確性を気にしていたらキリがないと思い、いったん現行…

なぜ誤差を「二乗」するのか?

何年か前に、統計学の勉強会をしている学生の会話を聞いていたら、パラメータの推定に「二乗誤差」を用いる理由を「誤差の符号を正にするため」というふうに先輩が後輩に説明していました。理由を考えようとする姿勢は素晴らしいと思いつつ、「そう単純でも…

95%信頼区間は何が「95%」なのか?

10年以上前に、「信頼区間の意味と、Rのpredict()関数の使い方の注意点」というエントリを書いてましたが、余計な記述が多かったのであらためて論点を整理しておきます。 統計学の教科書をまじめに読んでいる人にとっては今さらな話なのですが、「95%信頼区…

「検定を繰り返すと第一種の過誤が増える」は間違い

やや煽り気味のタイトルを付けてみましたが、そんな大層なことをいいたいわけではありません。 以前、検定の繰り返しと多重比較についてというエントリを書いていたですが、こんなにくどくど書かなくてもいいよなと思ったので、改めて話を簡潔に整理しておき…

不偏分散の分母がn-1であることの直観的な理解

同じタイトルで数ヶ月前にエントリを書いていたのですが、よくよく考えると全然意味のある説明になってなかったので、まとめ直します。 不偏分散が であることの、証明というか導出は、統計学の教科書を見れば書いてあるのですが、「なんで1引くの?」という…

マーケティング専門紙「日経MJ」と「うまい棒」の思い出

私は会社員を10年やってから大学に転職したのですが、会社員時代の前半は本社の営業部門に所属していて、現場の営業マンをサポートするためのデータ分析やらツール開発やらを担当しておりました。そういう仕事をやっていたので、マーケティング関連の媒体に…

生成AIに頼ることで失われるもの

今年、大学院入試の取りまとめ役をやっていたのですが、私が所属してる専攻は教員が100人ぐらいいるんですけど、毎年1名のメイン担当がほぼすべての情報を把握し、ほぼすべての書類を作成するので、けっこう大変でした。夏の院試は170人ぐらい、冬の院試は30…