内科のメモ帳

ずぼらな覚え書き

ユーザ用ツール

サイト用ツール


apps:r:dc

データクリーニング {R}

  • Tidy data1)ではないものは全て messy data
    • 1列が1変数に対応している
    • 1行が1観察に対応している
    • 1観察単位が1つの表を形作る
  • Messy data
    • コラム名が変数ではなく値になってしまっている
    • 複数の変数が1つのコラムに含まれている
    • 変数が行と列両方に含まれている
    • 複数の観察単位が同じテーブルに含まれている
    • 1つの観察単位が複数のテーブルに分かれて含まれている

データクリニーングのための関数

base::
基本的な操作や四則演算
magrittr::
パイプ関数
stringr::
文字列の加工・正規表現
dpylr::
表に対する基本的な操作
stringr::
表に対する色々と便利な加工
1)
Wickham H(2014). “Tidy Data” Journal of Statistical Software,59(10),2014.
apps/r/dc.txt · 最終更新: 2023/10/16 by admin

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki