본 글은 모두를 위한 R 데이터 분석 입문 책을 공부하면서 정리·요약한 내용입니다.
저자 : 오세종
출판 : 한빛아카데미
? head
help(head)
? 와 help() 함수를 통해 함수에 대한 도움말이나 정보를 확인 가능하다.
+ -> 덧셈연산
- -> 뺄셈연산
* -> 곱셈연산
/ -> 나눗셈연산
%% -> 나머지연산
^ -> 제곱연산
기본적인 연산자이다.
data()
data()함수를 이용하면 R에서 기본적으로 제공되는 데이터 셋 확인할 수 있다.
women
기본적으로 제공되는 데이터 셋 중 이름이 women인 데이터들을 확인할 수 있다.
실행결과 :
height weight
1 58 115
2 59 117
3 60 120
4 61 123
5 62 126
6 63 129
7 64 132
8 65 135
9 66 139
10 67 142
11 68 146
12 69 150
13 70 154
14 71 159
15 72 164
? women
women 데이터 셋의 정보를 확인할 수 있다.
str(iris)
iris데이터 셋의 구조를 확인할 수 있다.
실행결과 :
head(iris)
상위 6개의 행을 출력한다.
실행결과 :
tail(iris)
하위 6개의 행을 출력한다.
실행결과 :
plot(iris)
plot함수로 시각화할 수 있다. (산점도)
실행결과 :

각각의 변수가 x, y축이 된다.
그래프의 모양을 통해 관계있는 변수를 찾을 수 있다. (증가, 감소)
ex) Petal.Length가 x축이고 Petal.Width가 y축인 그래프 (14번째 그래프)
plot(iris$Petal.Width, iris$Petal.Length, col=iris$Species)
각 매개변수는 순서대로 X축 : Petal.Width, Y축 : Petal.Length, Species에 따라 컬러 변경을 의미한다.
실행결과 :
Orange 데이터를 이용하여 다음의 답을 구하시오.
1) Orange 데이터에 대해 검색하기(또는 도움말)
? Orange # 오렌지 나무의 성장
2) 데이터를 요약
str(Orange)
3) 앞에서 10개의 데이터 확인
head(Orange, 10)
4) 뒤에서 10개의 데이터 확인
tail(Orange, 10)
5) 전체 산점도 그리기
plot(Orange)
6) 속성을 3가지 선택하여 산점도 그리기(한가지는 색상 구분)
plot(Orange$age, Orange$circumference, col=Orange$Tree)
7) 산점도를 통하여 알게 된 사실은?
# 오렌지 나무의 성장은 age가 증가할 수록 circumference(둘레)가 증가한다.
<R 패키지>
R 패키지란 특정 분석을 수행할 수 있는 함수, 객체, 데이터, 도움말 등의 집합으로 구성되어 있다.
install.packages("패키지명")
패키지 설치할 수 있다.
library()
설치된 라이브러리를 확인할 수 있다.
install.packages("ggplot2")
패키지를 설치할 수 있다.
library(ggplot2)
다운받은 패키지 활성화한다.
'데이터 분석 > R' 카테고리의 다른 글
데이터 분석[R] - 6차시 (0) | 2021.07.02 |
---|---|
데이터 분석[R] - 5차시 (0) | 2021.07.01 |
데이터분석[R] - 4차시 (0) | 2021.06.30 |
데이터 분석[R] - 3차시 (0) | 2021.06.29 |
데이터분석 [R] - 2차시 (0) | 2021.06.28 |