StatsBeginner: 初学者の統計学習ノート

統計学およびR、Pythonでのプログラミングの勉強の過程をメモっていくノート。たまにMacの話題。

2014-10-01から1ヶ月間の記事一覧

日記: 統計・プログラミング・機械学習関連の本の立ち読みメモ

こないだ、日本一大きい書店と言われる大阪のジュンク堂で、統計・プログラミング・機械学習関係の本をいくつか立ち読みしてきたのでメモしておきます。 あくまでパラパラ立ち読みしてきただけなので中身は理解していません。今後買おうかな〜どうしようかな…

Rの練習: fisher.test()でメモリが足りなくなる

ちょっとしたデータをカイ二乗検定しようとすると、往々にして、期待度数が5に満たないセルが存在するせいで警告が出ます。 > print(d) Group.1 Group.2 Item.1 3 2 Item.2 9 12 Item.3 32 41 Item.4 68 74 Item.5 90 91 Item.6 35 32 Item.7 17 4 > chisq.…

信頼区間の意味と、Rのpredict()関数の使い方の注意点

信頼区間とはなんぞやというのをメモしておこうと思って、簡単なデータで回帰分析を行って図をつくろうかと思ったら、Rのpredict()関数の使い方に落とし穴があったので復習がてらメモ……。 とりあえず単回帰分析する Rの練習用データセット「cars」をつかいま…

首相の「血液型O型」の割合は日本人の平均より有意に多い(産経新聞の記事の数字を検定してみる)

血液型と性格の関係 産経新聞のネット記事で、首相の血液型はO型が多いということや、増税する首相はB型が多いといったことが書かれていました。 この一覧表をみてみると、興味深いことがいくつか浮かび上がってきました。 1つは、O型が突出して多いとい…