본문 바로가기

IT&코딩/국비지원

빅데이터 - 4 (R 설치)

728x90
반응형

■ 설치

 

□ R 설치

 

구글에서 R 홈페이지 검색

 

https://www.r-project.org/ 클릭

보이는 CRAN Mirrors 페이지에서 아래로 내려가 KOREA를 찾고 임의dml url 클릭

 

# Download R for Windows 클릭하고 
보이는 install R for the first time을 클릭한 후
Download R-4.x.x for Windows을 클릭하여 다운로드

 


# 다운받은 파일 설치(다음. 다음으로 완료)하면 바탕화면에 바로가기 생성
RGui console은 단순한 코드 입력하고 결과 보고자 하는 경우 사용

 

□ RStudio 설치

 

대화식 R로 코드를 저장

 

https://posit.co/download/rstudio-desktop/#download

 

Posit

The best data science is open source. Posit is committed to creating incredible open-source tools for individuals, teams, and enterprises.

posit.co

 

https://posit.co/download/rstudio-desktop

 

Posit

The best data science is open source. Posit is committed to creating incredible open-source tools for individuals, teams, and enterprises.

posit.co

 

# [windows용 rstudio desktop 다운로드(or 아래에서 windows os 아래 RStudio-2023.xx.~exe)]

RStudio는 프로그램 작성이 가능하고 필요 시 해당 폴더에 자료를 저장하거나 read가 가능

 

# 설치 후 환경설정

 

1) working directory 결정

(방법-1) RStudio를 연 상태에서 easy 단축키는 ctrl + shift + h 하고 마치 윈도우 탐색기처럼 
찾아갈 wd 경로명을 클릭하고 찾아가주며 된다.
즉 찾아갈 폴더를 정하고 [open] 클릭
즉 - tools - global -opions - general - 우측 working 

(방법-2) 
상단 Tools - Global Options - 왼쪽 General에서 우측 Default working directory (when not in a project) : 의 browse를
눌러 기본 working directory를 정해놓음

- OK(Apply) 클릭

2) UTF-8 확인

현재 환경설정에 들어온 상태라면 code부터 시작

(Tool - Global Options) code - 상단 SAVING탭
- default text encoding - UTF-8인지 확인 - OK
아니면 [browse] 눌러서 UTF-8로 change

 


 

■ R언어 이론

 

R is a free software environment for statistical computing(통계계산) and graphics(그래픽)

 

□ R이란

통계분석, 그래픽(시각화)을 위한 언어
1955년 뉴질랜드 Auckland 대학의 Robert Gentlman과 Ross Ihaka가 개발. S가 근원(유닉스 기반)
R은 오픈소스 기반의 객체지향 언어로 In-memory 기반이며 처리속도는 빠름
In-memory의 단점은 R + Hadoop -> RHIPE로 해결

 

(참고) RHIPE

R and Hadoop Integrated Programming Environment
미국 Purdue 대학 통계학 박사인 Saptarsh Guha가 개발
대용량처리 Hadoop + 통계패키지 R -> 시너지 증가
패키지 인스톨후 사용시 (예)library(Rhipe) 

 

내부적으로는 C언어 base
interpreter 언어 (Not Compile 언어)

OS와 관계없이 설치가 가능
Window, MacOS, UNIX, Linux서 운영 가능

R은 C, C++, C#, Python, JAVA 등으로 작성한 프로그램을 통합하는(rJava, Rserve 등) 인터페이스 제공
하둡과 함께 빅데이터 분석 도구
플러그인 하여 Sas 및 spss와 연동할 수 있음

(참고) 사용자에게 제공되는 package 현재 개수 확인하기
https://cran-project.org/ 에서
왼쪽 - software-packages 클릭하면 현재 사용가능 package 개수가 나옴

 

예) Available Packages
Currently, the CRAN package repository features 19889 available packages

(참고) package가 제공하는 부분 확인하기
https://cran-project.org/에서
왼쪽 - software - Task Views 클릭

예)
Topics

Agriculture Agricultural Science
Bayesian  Bayesian Inference
CausalInference Causal Inference
ChemPhys Chemometrics and Computational Physics

 

□ R studio 명령어

 

1. 주석 : #
- code 메뉴 or code tool 목록 - comment lins
- 여러줄 주석단축키 : ctrl + shift + c

2. 화면 클리어 : ctrl + L
3. 글자 크게 : ctrl + +
View 메뉴 - zoom in

4. 글자 작게 ctrl + -
View 메뉴 - zoom out

5. quit()

728x90
반응형

'IT&코딩 > 국비지원' 카테고리의 다른 글

빅데이터 - 5 (R 실습)  (0) 2023.08.21
빅데이터 - 3 (하둡을 이용한 워드카운팅)  (0) 2023.08.18
빅데이터 - 2 (하둡 & winscp)  (0) 2023.08.17
빅데이터 - 1  (0) 2023.08.17
리눅스 - 4 (실습)  (0) 2023.08.17