본문 바로가기
R Programming

R Programming-데이터 유형과 데이터 구조

by 카멜리아 시넨시스 2021. 1. 1.
반응형

  R에서 다루는 데이터 객체의 유형(Class)으로는 크게 5가지를 들 수 있다.

 

1. Character

  문자형인 데이터로, "A", "1", "?"와 같이 "" 사이에 문자를 적어 표현한다.

 

2. Numeric

  숫자, 그중에서도 실수를 뜻한다. 정수 1의 경우 뒤의 integer에 속하기도 하나, 본질적으로 1은 1.000000과 같은 식으로 표현할 수 있으므로 Numeric이기도 하다. 기본적으로 모든 수는 Numeric으로 처리되며, 다른 유형으로 정의하고 싶으면 뒤에 접미사를 붙여 표현한다.

 

3. Integer

  정수형. Integer로 정의하는 방법은 숫자 뒤에 접미사 L을 붙이면 된다.

 

e.g.  x <- 5L

 

4. Complex

  복소수. 1 + 5i와 같은 데이터가 해당한다.

 

5. Logical

  논리형. True, False 두 가지로 구분되며 True는 1, False는 0에 해당한다.

 

  그 외에 Inf, NaN 등 여러 종류가 있으나 다음 기회에...

 

 

 

 

  데이터 유형의 경우 각각의 데이터가 취하는 형태라면, 데이터 구조(type)는 데이터 집합이 띄는 구조를 뜻한다. 이 중 5개, vector, matrix, list, factor, data frame에 대해 간단히 알아보자.

 

1. Vector

  벡터는 같은 유형의 데이터를 한 줄로 늘어놓은 구조이다. c( ), :, vector( ) 등 여러 방법을 통해 벡터를 만들 수 있으나, 문자형은 문자형끼리, 숫자형은 숫자형끼리라는 벡터의 대전제는 맞춰주어야 한다.

 

e.g. 1 2 3 4 5 6 7 / e.g. "A" "B" "C" "D" "E"

 

2. Matrices

  행렬은 벡터에 차원(dimension)이 추가된 것으로, 2차원의 데이터 구조이다. 데이터를 행과 열로 나누어 구분하며, 벡터와 같이 모든 데이터는 같은 유형으로 구성되어야 한다.

 

e.g.     [,1] [,2] [,3]

[1,]  1   3   5

[2,]  2   4   6

 

2행, 3열의 행렬

 

3. Lists

  리스트는 벡터와 유사하나 벡터와는 다르게 서로 다른 유형의 데이터를 포함할 수 있다. 리스트의 경우 영수증과 같은 방법으로 표현된다.

 

e.g.

[[1]]

[1] 1

 

[[2]]

[1] "x"

 

[[3]]

[1] False

 

4. Factors

  팩터는 범주형 데이터를 표현하는데 쓰인다. 팩터는 벡터와 비슷하게 쓰이나, level이란 개념이 있어 살짝 다르다. 다음에 팩터에 대해 자세히 다루겠다.

 

e.g.

yes yes no yes no

Levels: no yes

 

5. Data Frames

  데이터 프레임은 행렬과 비슷하다. 다만, 행렬과는 다르게 다양한 유형의 데이터를 포함할 수 있다. 데이터 프레임은 리스트를 여러 개 붙여 놓은 꼴을 하고 있다.

 

e.g.

    people  age

1    A   22

2    B   30

3    C   13

 

 

 

  이렇게 데이터 유형과 구조에 대해 간단히 알아보았다. 다음 글에서는 각 데이터 구조에 대해서 보다 상세히, 여러 함수들을 알아보겠다.

 

 

 

 

 

반응형

'R Programming' 카테고리의 다른 글

R Programming- c(), vector() 함수  (1) 2021.01.13
R Programming-":" 와 seq(), rep() 함수  (0) 2021.01.05

댓글