본문 바로가기
카테고리 없음

제 1장. R입문(R 패키지의 설치)

by 나용 나용 2022. 4. 2.

 1.5.   R 패키지의 설치  

 

1.5.1. R 패키지 소개 및 설치

  R을 사용하는 가장 큰 이유 중 하나는 전 세계 사용자들이 구축해 놓은 다양하고 방대한 패키지를 사용할 수 있다는 것입니다. R에서 패키지란 특정 분석을 수행할 수 있는 함수, 객체, 도움말, 데이터 등의 집합을 말합니다. R을 처음 설치하면 기본적으로 설치되는 stats 같은 패키지에는 기초적인 데이터 분석이 가능한 기본 통계함수들이 포함되어 있습니다(그림 1-12). R 설치 시 자동으로 설치되는 기본 패키지는 library( ) 함수로 조회할 수 있으며 자동으로 설치될 뿐만 아니라 R의 시작과 함께 동시에 시작되는 기본 패키지는 search( ) 함수를 통해 조회할 수 있습니다.

<그림 1-12> R 설치 시 자동으로 설치되는 패키지들

 

> search()
[1] ".GlobalEnv"         "package:stats"  "package:graphics"
[4] "package:grDevices"  "package:utils"  "package:datasets"  
[7] "package:methods"    "Autoloads"      "package:base"

 

  2019년 기준 R에서는 1만 개가 넘는 패키지를 활용할 수 있는데, 이 중 대부분의 패키지들은 stats 패키지와는 달리 기본으로 설치되지 않으므로 필요에 따가 사용자가 CRAN을 통해 직접 설치하여야 합니다.

 

<그림 1-13> '패키지 설치하기' 화면

 

  패키지는 install.packages("패키지명")과 같이 R 콘솔에 직접 입력하여 설치 할 수도 있고 <그림 1-13> 및 <그림 1-14>와 같이 풀다운 메뉴의 '패키지들' → '패키지(들) 설치하기'를 클릭하고 미러 사이트 목록을 선택한 뒤 원하는 패키지를 목록에서 찾아 설치할 수도 있습니다. 가령, 앙상블 기계학습을 위해서는 <그림 1-14>와 같이 'randomForest'라는 패키지를 찾아 설치하면 됩니다.

 

<그림 1-14> 패키지 목록에서 원하는 패키지를 선택

 

1.5.2. R 패키지의 활성화

 R에 기본적으로 설치되어 있는 패키지가 아닌, 사용자가 직접 설치한 패키지를 활성화하기 위해서는 library(패키지명)의 명령어를 실행하면 됩니다. 예를 들어, 데이터마이닝 기법 중 하나인 나무모형은 'rpart'라는 패키지를 다음과 같이 설치하고 활성화할 수 있으며, help( ) 함수 등을 이용하면 해당 패키지에 관한 기본적인 설명을 출력할 수 있습니다.

 

> install.packages("rpart")
> library(rpart)
> help(package="rpart")                                 # 웹 기반 패키지 설명서
> library(help="rpart")                                 # 텍스트 기반 패키지 설명서

 

  또한 설치된 패키지 내에 저장되어 있는 데이터를 확인하고 불러오는 것도 가능합니다. data(package="패키지명") 명령문을 사용하면 저장되어 있는 데이터의 목록을 제공합니다. 목록 중에서 사용할 데이터를 결정하면 data(데이터명, package="패키지명") 명령문으로 해당 데이터를 불러옵니다.