StatsBeginner: 初学者の統計学習ノート

統計学およびR、Pythonでのプログラミングの勉強の過程をメモっていくノート。たまにMacの話題。

2014-08-01から1ヶ月間の記事一覧

Rメモ:read.csv/write.csvで読み込んだり書き出したりするときの注意点

Rで、CSVのデータを読み込んだり書き出したりするときに、引数をちゃんと設定してなくてミスることがありますね。 いやべつに大したことではなくて、私のような初心者レベルですら「当たり前」なことではあるんですが、今日あるデータを分析してて一部ミスっ…

Pythonの勉強(実質2日目くらい)を再開

勉強再開 先週のエントリで入門してすぐ1週間ぐらい放置してしまいましたが、今日少しだけPythonの勉強をやりました。 Pythonスタートブック作者: 辻真吾出版社/メーカー: 技術評論社発売日: 2010/04/24メディア: 大型本購入: 19人 クリック: 199回この商品…

勉強会:主成分分析・因子分析(金明哲『Rによるデータサイエンス』)

今回の勉強会 こないだの日曜日は友人とやっている週次の統計勉強会で、金明哲『Rによるデータサイエンス』の主成分分析の章と因子分析の章を扱いました。 Rによるデータサイエンス - データ解析の基礎から最新手法まで作者: 金明哲出版社/メーカー: 森北出…

因子分析の結果の見方がよくわからないのでYahoo!知恵袋で質問してみた

Yahoo!知恵袋にはいろいろお世話になってるのですが、因子分析の結果の見方についてよく分からないことがあったので、質問してみました。 http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10134562600 [心理学][統計] 因子分析で斜交回転を行った…

Python入門初日:環境の構築など

《2016.1.6追記》 なぜか数日前からこの記事に数名の方にブックマークしていただいているのですが、これは結構古いエントリでして、その後Pythonの環境は、Anacondaというパッケージを入れて同梱されているSpyderというIDEを使う方法で落ち着きましたので、…

よくダウンロードされているRのパッケージ

RでMD5などのハッシュ値を得るためのツールはないかなと思って検索したら、digestというパッケージがあることがあっさり分かったのだが、検索してる途中にたまたま以下のような記事をみつけた。 Top 100 R packages for 2013 (Jan-May)! | R-statistics blog…

Pythonの教科書を2冊買った

Pythonを始めてみようかと Pythonの教科書を2冊買いました。 私はプログラミングはまったくの素人ですし、これから頑張ろうと意気込んでいるわけでもないのですが、Rをいじっていると初心者レベルではあってもプログラミングっぽいものに少し関心が出てきて…

自分のEvernoteのタグ付け状況をデータで分析したい

SQL

Evernoteのタグ付けデータ 色々なドキュメントをEvernoteに入れてまして*1、気づいたら1万数千のノートと千数百のタグを運用する状態になってました。 私はタグ付けには色々こだわりがありまして、「テキスト検索だけで十分」という(多数派の)意見には断固…

Rの指数表示を回避するoptions(scipen)の法則

Rの指数表示の回避方法 以前、別のブログのほう(リンク)で、Rの指数表示の回避を行う方法についてのエントリを書いたのですが、せっかく統計とRに関するブログを書き始めたので、こっちに転載しておきます。 元の記事ではいろいろ悩んだ過程を書いてるので…

正規性の検定結果の違い

正規性の検定 先のエントリでも触れたように、分布の正規性の検定にはいくつかの種類があります。 参考に、サンプルサイズを変えながらシャピロ・ウィルク検定とコルモゴロフ・スミノルフ検定を実施し、結果の違いを図にしてみました。とりあえず作図しただ…

Rの練習:Rの乱数で中心極限定理を確かめてみる

乱数によるシミュレーションで中心極限定理を確かめる 統計の初学者としての感想なのですが、統計モデルを「乱数発生器」と見なす考え方は学習の初期でしっかり教えてほしかったなと思っております。私が最初に勉強した『心理統計学の基礎』という本にも、よ…

因子分析の勉強(永田・棟近『多変量解析法入門』)

因子分析の勉強 昨日は、友人とやっている勉強会で、因子分析の勉強をした。教科書は、永田・棟近『多変量解析法入門』の第13章(の一部)。神テキストです。 多変量解析法入門 (ライブラリ新数学大系)作者: 永田靖,棟近雅彦出版社/メーカー: サイエンス社発…

Rで全角数字を半角数字に書き換える

↓このページに、Rで文字列を操作する系のコマンドが色々載っていました。 文字列 | Rを利用して文字列のマッチング,結合,分割,置換を行う関数 これを参考に、データの全角数字を半角数字に入れ替えるというのをやってみたいと思います。 そういえば、はてな…

『データ解析のための統計モデリング入門』読書会第7回の復習 #みどりぼん

2週連続の読書会 8月5日に『緑本』読書会の第7回に参加してきました。 「データ解析のための統計モデリング入門」 読書会 - connpass 2人目のLT(データ解析でご飯を食べるという事)の方に、「データ分析プロジェクトの発注者側に言いたい文句とかないで…

クロンバックのα(信頼性係数)の計算方法がソフトやパッケージによって違うらしい

メモ。 統計解析ソフトやRのパッケージによってクロンバックのα信頼性係数が違う? - Togetterまとめ 心理学で尺度の解析をやる場合などに、たとえば1つの構成概念(心理的な傾向に名前を付けたもの。たとえば「抑鬱傾向」とか。)に対して10個とかの質問を…