R語言是目前資料科學中,最多人使用的視覺化程式設計語言。
讓我們一起來做一些基本練習吧!
環境安裝
1.安裝R語言:http://cran.csie.ntu.edu.tw/

請依據你的作業系統(Linux、Mac、Windows)進行下載與安裝
2.安裝R Studio:https://www.rstudio.com/products/rstudio/download3/
我們選擇RStudio Desktop Free,並依照你的作業系統下載對應版本安裝(Mac、Windows)

開始使用R Studio
File -> New File -> R Script (或使用組合鍵 Shift + Command + N)

如何執行
選取程式碼或只執行游標停留的那一行,按下Command + Enter
就可以在Console區看到執行結果

加減乘除、Mod、三角函數、次方,示範如下:
程式內容:

顯示結果:

建立變數:用<-
x<-60
查詢目前執行環境中所有的變數:ls()

移除目前執行環境中的變數:rm(list=”x”)
移除目前執行環境中的所有變數:rm(list=ls())
查詢該變數的類別:class()
Vector 向量
建立向量: c()是連結函數,用來將值連結在一起建立向量(Vector)或清單(List)
myNumberVector <- c(1,18,49)
myCharVector <- c(“a”,”b”,”c”)
我們可以用myCharVector來幫myNumberVector的每一個物件建立名稱
names(myNumberVector) <- myCharVector
出來的結果會是:

那如果想在建立向量時,直接指定物件的名稱呢?

建立完成後,如何取得Vector中個別的值?

Matrix 矩陣
透過矩陣的建立,我們可以將資料像表格的方式,以列x欄的格式儲存。
建立矩陣

- 1:12:填入1~12的資料
- byrow:TRUE 從列開始排
- nrow:number of rows 列數
經過以上語法,會產生m1與m2的矩陣


接著我們來認識這幾個方法:
- dim:dimension,看看這個矩陣是 n x m
- length:資料筆數
- nrow:number of rows 列數
- ncol:number of columns 欄位數

那想要取出特定一個位置的資料,要怎麼做呢?
m1的第三列、第二欄位:

接著讓我們命名每個列與欄,以便未來的存取更為直覺:

命名完後,我們的陣列就變成:

接著就可以用列與欄的名稱來取值:


Factor
通常用在分類,可排序。
建立Factor

複製一份至f2,並且修改為Y與N

List
List允許存放不同資料型態。
建立List

如此則會產生一個myList序列,裡面有x1, x2, x3:

取出子集 / 取出子集中的特定項目

Data Frame
用來儲存資料,各欄位可不同屬性。
建立Data Frame

mydata的樣子:

列與欄應該要有名稱,讓我們來加上去:

加完之後mydata的樣子:

如果要新增資料欄位:

mydata就多了第三個欄位:

經過了這些練習,是不是對R語言的幾個資料型態有了基本的認識呢?