頻用関数 {R} [内科のメモ帳]

このページの翻訳:

ja

Warning: Undefined array key 1 in /home/c1720449/public_html/medwiki.online/lib/plugins/toctweak/syntax/metatoc.php on line 79

頻用関数 {R}

function

パッケージを入れる

install.packages("NAME")
library("NAME")

最初は tidyverse パッケージから
Excelファイルの読み込みは readxl パッケージ

基本

working directoryのパスを取得する

getwd()

ls function = 作成した変数 variable を全て呼び出す

ls()

rm function = 全部消す

rm(list=ls())

文字列型 character データを numeric データに

as.numeric("5")  #これで文字列の5を数字の5に変換する．1/2などの文字列は 0.5 と変換できない

as.character(5)  #これで数字の5を文字列の "5" に変換する．

ベクトル作成

combine の頭文字 c
文字列と数字が混ざっていると，全て文字列型に置き換えられてしまうため注意
ベクトルは，Excelなどの表での「列」に相当するものとイメージする
- 行の先頭タイトル（たとえばID）を関数名にするとわかりやすい．ID 1〜5を格納すると以下

id <- c(1,2,3,4,5)

データフレーム作成

上記のベクトルを複数用意すれば「複数列」の表になる．それがデータフレーム．

data.frame(列1=a，列2=b,...)  #a,b,...はいずれもベクトルデータ

hyou <- data.frame(
  id=c(1,2,3,4),
  name=c("阿部くん","馬場さん","近田くん","段田さん")
  )

View(hyou) # 上で書いたデータフレームを表示するには View関数を使う．頭文字が大文字なので注意！

id	name
1	阿部くん
2	馬場さん
3	近田くん
4	段田さん

data.frame関数の欠点として，全ての行・列を表示してしまうことがある
- 研究で使うようなまずまず大規模なデータを data.frame 形式で読み込むとかなり大変なことになる（スクロール地獄）
このデメリットを克服したものが，tibble 形式
- 要：tibbleパッケージ ※tidyverse パッケージに含まれる
- readrパッケージにある関数でデータを読み込んだ場合，基本的には tibble 形式で Rに取り込まれる

tibble形式

as_tibble("変数")

上記にて date.frame 形式のものを tibble 形式に変換できる

計算

割り算の商とあまり

a %%2  # aを2で割った余り

a %/%2  # aを2で割った商

繰り返し関数rep

weekend <- rep(
 c(rep"weekday",5), "weekend", "weekend"), 4   #平日*5+週末+週末，というベクトルを4回繰り返す
)

関数の作成

kansu1 <- function(<任意のargument>){
 #＜処理＞
 return(<処理した結果>)}

tasizan <- function(x,y){
  temp <- x+y
  return( temp )
}

データクリニーング

データチェック

#最初の行列を表示
head()

#最後の行列を表示
tail()

表を作成する

hyou <- tibble(
  col1=c(1,2,3,4), 
  col2=c(10,20,30,40)
)

col1	col2
1	10
2	20
3	30
4	40

列を追加する (mutate)

列を追加する（tidyverse）

TABLE %>% 
  mutate (<新しい列名> = <ベクトル>)

hyou %>% 
 mutate(
 col3 = col1+col2,
 col4 = col2-col1
 )

col1	col2	col3	col4
1	10	11	9
2	20	22	18
3	30	33	27
4	40	44	36

列を追加する（base）

hyou$new <- hyou$col1 + hyou$col2

列の名前を変える (rename)

#普通の rename 関数
rename (TABLE, NEW_COL_NAME = original_col_name)

#パイプ関数を使う場合
TABLE %>% rename(NEW_COL_NAME = original_col_name)

列を選択する (select)

特定の表（TABLE）の列1，2，5，だけを抽出する

#普通の select 関数
select (TABLE, col1, coll2, col5)

#パイプ関数を使う場合 tidyverse
TABLE %>% select(col1,col2,col5)

#baseでやる場合
TABLE[c("col1","col2","col5")]

特定の文字列を含む列だけ選択する

#ABC,abc（大文字・小文字区別しない）を含む文字列を引っ張ってくる
TABLE %>% select(matches("ABC"))

特定の表（TABLE）の列を除外する

#TABLEの1列目を除外する
select (TABLE, !col1)  

#TABLEの1列目を除外する（パイプ関数版）
TABLE %>% select(!col1)

#TABLEの1,2,5列目を除外する
TABLE %>% select(!c(col1,col2,col5))

特定の列を前に持ってくる

#TABLEの5列目を一番前に持ってくる
TABLE %>% select(col5, everything())

#TABLEの5列目を一番前に（relocate関数）
TABLE %>% relocate(col5)

#TABLEの5列目を3列目の前に（relocate関数）
TABLE %>% relocate(col5, .before=col3)

#TABLEの5列目を3列目の後に（relocate関数）
TABLE %>% relocate(col5, .after=col3)

特定の列だけ引き出して名前も変える

#TABLEの1列目，3列目だけ持ってきて違う名前にする
TABLE %>% select(RENAME_col1 = col1,
                 RENAME_col3 = col3)

列を確認する (colnames)

#TABLEの列名一覧をベクトルとして取得する
colnames(TABLE)

行を並び替える (arrange)

# 列1が昇順となるように並び替える
arrange(TABLE,col1)

#パイプ関数を使う場合
TABLE %>% arrange(col1)

# 列1が降順となるように並び替える
arrange(TABLE,desc(col1))

#パイプ関数を使う場合
TABLE %>% arrange(desc(col1))

# 列1を昇順とした上で，列2も昇順になるよう並び替える
arrange(TABLE,col1,col2)

#パイプ関数を使う場合
TABLE %>% arrange(col1,col2)

行をフィルターする(filter)

#1列目（col1）が 15以上の行のデータだけ抜き出す
TABLE %>% filter(col1 => 15)

ざっくり外観をみる

GGally

install.packages("GGally")
library(GGally)

#行列データセットの外観を一目でチェック
GGally::ggpairs(DATASET)

目次

頻用関数 {R}

目次

パッケージを入れる

基本

ベクトル作成

データフレーム作成

tibble形式

計算

繰り返し関数rep

関数の作成

データクリニーング

データチェック

表を作成する

列を追加する (mutate)

列の名前を変える (rename)

列を選択する (select)

列を確認する (colnames)

行を並び替える (arrange)

行をフィルターする(filter)

ざっくり外観をみる

GGally

Tools

menus and quick search

quick search

site status

location indicator

ページ用ツール

meta data for this page

頻用関数 {R}

目次

パッケージを入れる

基本

ベクトル作成

データフレーム作成

tibble形式

計算

繰り返し関数rep

関数の作成

データクリニーング

データチェック

表を作成する

列を追加する (mutate)

列の名前を変える (rename)

列を選択する (select)

列を確認する (colnames)

行を並び替える (arrange)

行をフィルターする(filter)

ざっくり外観をみる

GGally