본문 바로가기

카테고리 없음

plyr 패키지

plyr 패키지는 데이터를 분할하고, 분할된 데이터에 특정 함수를 적용한 뒤, 그 결과를 재조합하는 3단계로 데이터를 처리하는 함수를 제공한다.


형식은 {a,d,l} + {a, d, l, _ } + ply로 이루어진다.


문자

용도

의미

a

입력, 출력

배열

d

입력, 출력

데이터프레임

l

입력, 출력

리스트

_

출력

아무런 출력도 없음


a는 array(배열), d는 data frame(데이터 프레임), l은 list이다.


원하는 입력 방식과, 원하는 출력 방식을 기호에 맞게 골라서 쓰면 된다.


조합의 개수는 3 x 4 = 12개가 나올 것이다.


대표적인 함수를 살펴보겠다.


adply() : 입력(array, 배열) + 출력(dataframe, 데이터프레임)


즉, 배열을 받아 데이터 프레임으로 출력하는 함수이다.


ddply() : 입력(데이터 프레임) + 출력(데이터 프레임)