plyr 패키지는 데이터를 분할하고, 분할된 데이터에 특정 함수를 적용한 뒤, 그 결과를 재조합하는 3단계로 데이터를 처리하는 함수를 제공한다.
형식은 {a,d,l} + {a, d, l, _ } + ply로 이루어진다.
문자 |
용도 |
의미 |
a |
입력, 출력 |
배열 |
d |
입력, 출력 |
데이터프레임 |
l |
입력, 출력 |
리스트 |
_ |
출력 |
아무런 출력도 없음 |
a는 array(배열), d는 data frame(데이터 프레임), l은 list이다.
원하는 입력 방식과, 원하는 출력 방식을 기호에 맞게 골라서 쓰면 된다.
조합의 개수는 3 x 4 = 12개가 나올 것이다.
대표적인 함수를 살펴보겠다.
adply() : 입력(array, 배열) + 출력(dataframe, 데이터프레임)
즉, 배열을 받아 데이터 프레임으로 출력하는 함수이다.
ddply() : 입력(데이터 프레임) + 출력(데이터 프레임)