R語言是目前資料科學中,最多人使用的視覺化程式設計語言。
讓我們一起來做一些基本練習吧!
環境安裝
1.安裝R語言:http://cran.csie.ntu.edu.tw/
請依據你的作業系統(Linux、Mac、Windows)進行下載與安裝
2.安裝R Studio:https://www.rstudio.com/products/rstudio/download3/
我們選擇RStudio Desktop Free,並依照你的作業系統下載對應版本安裝(Mac、Windows)
開始使用R Studio
File -> New File -> R Script (或使用組合鍵 Shift + Command + N)
如何執行
選取程式碼或只執行游標停留的那一行,按下Command + Enter
就可以在Console區看到執行結果
加減乘除、Mod、三角函數、次方,示範如下:
程式內容:
顯示結果:
建立變數:用<-
x<-60
查詢目前執行環境中所有的變數:ls()
移除目前執行環境中的變數:rm(list=”x”)
移除目前執行環境中的所有變數:rm(list=ls())
查詢該變數的類別:class()
Vector 向量
建立向量: c()是連結函數,用來將值連結在一起建立向量(Vector)或清單(List)
myNumberVector <- c(1,18,49)
myCharVector <- c(“a”,”b”,”c”)
我們可以用myCharVector來幫myNumberVector的每一個物件建立名稱
names(myNumberVector) <- myCharVector
出來的結果會是:
那如果想在建立向量時,直接指定物件的名稱呢?
建立完成後,如何取得Vector中個別的值?
Matrix 矩陣
透過矩陣的建立,我們可以將資料像表格的方式,以列x欄的格式儲存。
建立矩陣
- 1:12:填入1~12的資料
- byrow:TRUE 從列開始排
- nrow:number of rows 列數
經過以上語法,會產生m1與m2的矩陣
接著我們來認識這幾個方法:
- dim:dimension,看看這個矩陣是 n x m
- length:資料筆數
- nrow:number of rows 列數
- ncol:number of columns 欄位數
那想要取出特定一個位置的資料,要怎麼做呢?
m1的第三列、第二欄位:
接著讓我們命名每個列與欄,以便未來的存取更為直覺:
命名完後,我們的陣列就變成:
接著就可以用列與欄的名稱來取值:
Factor
通常用在分類,可排序。
建立Factor
複製一份至f2,並且修改為Y與N
List
List允許存放不同資料型態。
建立List
如此則會產生一個myList序列,裡面有x1, x2, x3:
取出子集 / 取出子集中的特定項目
Data Frame
用來儲存資料,各欄位可不同屬性。
建立Data Frame
mydata的樣子:
列與欄應該要有名稱,讓我們來加上去:
加完之後mydata的樣子:
如果要新增資料欄位:
mydata就多了第三個欄位:
經過了這些練習,是不是對R語言的幾個資料型態有了基本的認識呢?