R語言練習

R語言是目前資料科學中,最多人使用的視覺化程式設計語言。

讓我們一起來做一些基本練習吧!

環境安裝

1.安裝R語言http://cran.csie.ntu.edu.tw/

screenshot-2016-11-20-14-05-51

請依據你的作業系統(LinuxMacWindows)進行下載與安裝

2.安裝R Studiohttps://www.rstudio.com/products/rstudio/download3/

我們選擇RStudio Desktop Free,並依照你的作業系統下載對應版本安裝(MacWindows)
screenshot-2016-11-20-14-09-25


 

開始使用R Studio

File -> New File -> R Script (或使用組合鍵 Shift + Command + N)

screenshot-2016-11-20-14-12-05

如何執行

選取程式碼或只執行游標停留的那一行,按下Command + Enter

就可以在Console區看到執行結果

screenshot-2016-11-20-14-16-59

加減乘除Mod三角函數次方,示範如下:

程式內容:

screenshot-2016-11-20-14-21-30

顯示結果:

screenshot-2016-11-20-14-21-42

建立變數:用<-

x<-60

查詢目前執行環境中所有的變數:ls()

screenshot-2016-11-20-14-28-39

移除目前執行環境中的變數:rm(list=”x”)

移除目前執行環境中的所有變數:rm(list=ls())

查詢該變數的類別:class()


 

Vector 向量

建立向量: c()是連結函數,用來將值連結在一起建立向量(Vector)或清單(List)

myNumberVector <- c(1,18,49)

myCharVector <- c(“a”,”b”,”c”)

我們可以用myCharVector來幫myNumberVector的每一個物件建立名稱

names(myNumberVector) <- myCharVector

出來的結果會是:

screenshot-2016-11-20-14-54-30

那如果想在建立向量時,直接指定物件的名稱呢?

screenshot-2016-11-20-15-21-53

建立完成後,如何取得Vector中個別的值?

screenshot-2016-11-21-10-19-51


 

Matrix 矩陣

透過矩陣的建立,我們可以將資料像表格的方式,以列x欄的格式儲存。

建立矩陣

screenshot-2016-11-21-11-36-58

  • 1:12:填入1~12的資料
  • byrow:TRUE 從列開始排
  • nrow:number of rows 列數

經過以上語法,會產生m1與m2的矩陣

screenshot-2016-11-21-11-39-43

screenshot-2016-11-21-11-40-22

接著我們來認識這幾個方法:

  • dim:dimension,看看這個矩陣是 n x m
  • length:資料筆數
  • nrow:number of rows 列數
  • ncol:number of columns 欄位數

screenshot-2016-11-21-11-44-07

那想要取出特定一個位置的資料,要怎麼做呢?

m1的第三列、第二欄位:

screenshot-2016-11-21-11-48-38

接著讓我們命名每個列與欄,以便未來的存取更為直覺:

screenshot-2016-11-21-12-02-30

命名完後,我們的陣列就變成:

screenshot-2016-11-21-12-04-15

接著就可以用列與欄的名稱來取值:

screenshot-2016-11-21-12-16-41

screenshot-2016-11-21-12-16-50


 

Factor

通常用在分類,可排序。

建立Factor

screenshot-2016-11-21-16-53-19

複製一份至f2,並且修改為Y與N

screenshot-2016-11-21-17-04-18


 

List

List允許存放不同資料型態。

建立List

screenshot-2016-11-21-17-25-12

如此則會產生一個myList序列,裡面有x1, x2, x3:

screenshot-2016-11-21-17-26-12

取出子集 / 取出子集中的特定項目

screenshot-2016-11-21-17-34-27


 

Data Frame

用來儲存資料,各欄位可不同屬性。

建立Data Frame

screenshot-2016-11-21-17-39-57

mydata的樣子:

screenshot-2016-11-21-17-40-16

列與欄應該要有名稱,讓我們來加上去:

screenshot-2016-11-21-17-44-12

加完之後mydata的樣子:

screenshot-2016-11-21-17-45-04

如果要新增資料欄位:

screenshot-2016-11-21-17-46-35

mydata就多了第三個欄位:

screenshot-2016-11-21-17-46-58

經過了這些練習,是不是對R語言的幾個資料型態有了基本的認識呢?

延伸學習: