1.5. R 패키지의 설치
1.5.1. R 패키지 소개 및 설치
R을 사용하는 가장 큰 이유 중 하나는 전 세계 사용자들이 구축해 놓은 다양하고 방대한 패키지를 사용할 수 있다는 것입니다. R에서 패키지란 특정 분석을 수행할 수 있는 함수, 객체, 도움말, 데이터 등의 집합을 말합니다. R을 처음 설치하면 기본적으로 설치되는 stats 같은 패키지에는 기초적인 데이터 분석이 가능한 기본 통계함수들이 포함되어 있습니다(그림 1-12). R 설치 시 자동으로 설치되는 기본 패키지는 library( ) 함수로 조회할 수 있으며 자동으로 설치될 뿐만 아니라 R의 시작과 함께 동시에 시작되는 기본 패키지는 search( ) 함수를 통해 조회할 수 있습니다.
> search()
[1] ".GlobalEnv" "package:stats" "package:graphics"
[4] "package:grDevices" "package:utils" "package:datasets"
[7] "package:methods" "Autoloads" "package:base"
2019년 기준 R에서는 1만 개가 넘는 패키지를 활용할 수 있는데, 이 중 대부분의 패키지들은 stats 패키지와는 달리 기본으로 설치되지 않으므로 필요에 따가 사용자가 CRAN을 통해 직접 설치하여야 합니다.
패키지는 install.packages("패키지명")과 같이 R 콘솔에 직접 입력하여 설치 할 수도 있고 <그림 1-13> 및 <그림 1-14>와 같이 풀다운 메뉴의 '패키지들' → '패키지(들) 설치하기'를 클릭하고 미러 사이트 목록을 선택한 뒤 원하는 패키지를 목록에서 찾아 설치할 수도 있습니다. 가령, 앙상블 기계학습을 위해서는 <그림 1-14>와 같이 'randomForest'라는 패키지를 찾아 설치하면 됩니다.
1.5.2. R 패키지의 활성화
R에 기본적으로 설치되어 있는 패키지가 아닌, 사용자가 직접 설치한 패키지를 활성화하기 위해서는 library(패키지명)의 명령어를 실행하면 됩니다. 예를 들어, 데이터마이닝 기법 중 하나인 나무모형은 'rpart'라는 패키지를 다음과 같이 설치하고 활성화할 수 있으며, help( ) 함수 등을 이용하면 해당 패키지에 관한 기본적인 설명을 출력할 수 있습니다.
> install.packages("rpart")
> library(rpart)
> help(package="rpart") # 웹 기반 패키지 설명서
> library(help="rpart") # 텍스트 기반 패키지 설명서
또한 설치된 패키지 내에 저장되어 있는 데이터를 확인하고 불러오는 것도 가능합니다. data(package="패키지명") 명령문을 사용하면 저장되어 있는 데이터의 목록을 제공합니다. 목록 중에서 사용할 데이터를 결정하면 data(데이터명, package="패키지명") 명령문으로 해당 데이터를 불러옵니다.