目次
データクリーニング {R}
データクリニーングのための関数
データクリーニング {R}
Tidy data
1)
ではないものは全て messy data
1列が1変数に対応している
1行が1観察に対応している
1観察単位が1つの表を形作る
Messy data
コラム名が変数ではなく値になってしまっている
複数の変数が1つのコラムに含まれている
変数が行と列両方に含まれている
複数の観察単位が同じテーブルに含まれている
1つの観察単位が複数のテーブルに分かれて含まれている
データクリニーングのための関数
base::
基本的な操作や四則演算
magrittr::
パイプ関数
stringr::
文字列の加工・正規表現
dpylr::
表に対する基本的な操作
stringr::
表に対する色々と便利な加工
1)
Wickham H(2014). “Tidy Data” Journal of Statistical Software,59(10),2014.