Loading...
2022. 2. 19. 03:20

데이터분석 전문가(ADP)를 위한 R프로그래밍 시각화편2

1. 히스토그램 > data(diamonds) > head(diamonds) # A tibble: 6 × 10 carat cut color clarity depth table price x y z 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31 3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31 4 0.29 Premium I VS2 62.4 58 334 4.2 4.23 2.63 5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75 6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48 > k k ..

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편7

factor로 집단을 정의하고 벡터를 factor에 의해 집단으로 분할 split(벡터, factor)함수를 이용 tapply(vec,factor,func)를 이용하여 집단별로 함수를 적용한다 > v w f groups groups $A [1] 24 23 25 $B [1] 52 46 $C [1] 75 > groups2 groups2 $A [1] 87 86 68 $B [1] 92 84 $C [1] 77 > groups3 groups3 $A [1] 24 23 25 $B [1] 52 46 $C [1] 75 > tapply(v,f,mean) A B C 24 49 75 > tapply(w,f,sum) A B C 241 176 77 데이터프레임을 여러 집단으로 분할하기 역시 split(벡터, factor)함수를 이..

데이터분석 전문가(ADP)를 위한 R 프로그래밍 기초편6

1. 문자열 다루기 nchar(var) 단어나 문장 또는 벡터내 원소의 문자열 길이를 반환 벡터를 넣을경우 문자열의 길이가 아니라 벡터내 원소들의 문자열 길이를 벡터로 반환 > nchar('abcdefg') [1] 7 > nchar(c(1,2,3,4,5,6)) [1] 1 1 1 1 1 1 > nchar(c('ab',1,2,3,'abcdef')) [1] 2 1 1 1 6 paste(단어1, 단어2, sep=, collapse=) 주어진 문자열들을 sep를 연결해서 출력함 collapse는 벡터들을 연결해서 연결되는 결과가 여러개가 나오는경우 collapse에서 지정한 문자로 이들을 연결시켜서 하나로 만든다 > paste('taeyeon','love',sep='-') [1] "taeyeon-love" > p..

2022. 2. 8. 01:28

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편5

1. 데이터프레임 데이터에서 각각의 변수에 해당하는 열들의 모임 data.frame(벡터, 벡터, 벡터, ...) 벡터들로 데이터셋을 생성함 혹은 열 변수벡터로 데이터셋을 생성 혹은 data.frame(변수1이름=값, 변수2이름=값, 변수3이름=값,.....) > a b c d d a b c 1 1 5 9 2 2 6 10 3 3 7 11 4 4 8 12 > new new a b c d 1 1 2 3 a N=100 > dtfm dtfm$lab [1] "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" "" [42] "" "" "" "" "" ""..

데이터분석 전문가(ADP)를 위한 R프로그래밍 기초편4

1. 벡터 벡터의 원소들은 동질적 한 벡터의 모든 원소는 같은 자료형 또는 같은 모드(mode)를 가진다. 예를 들어 문자형과 수치형을 넣으면 모두 문자형으로 통일된다 > v v [1] "yun" "13" "22" 벡터는 위치로 indexing가능 v[2]는 v의 2번째 원소 벡터는 인덱스를 통해 여러 개의 원소로 구성된 하위 벡터를 반환할 수 있다 v[c(2,3)]은 v벡터의 2번째, 3번째 원소로 구성된 하위벡터 인덱스에 -를 붙이면 해당 번호는 제외한 나머지 번호의 원소를 가져옴 v[-c(2,3)]은 2,3번째 값을 제외한 하위벡터 > v v[2] [1] 21 > v[c(2,3)] [1] 21 42 > v[-c(2,3)] [1] 33 32 5 4 432 21 벡터의 원소들도 이름을 가질 수 있다 >..

2021. 12. 23. 01:26

빅데이터 분석기사 실기를 준비하는 사람들에게 드리는 팁(3회 이후)

이번 3회 예비?합격자입니다 가끔 카페를 보는 정도만으로 이용하는데 시험이 시행된지 얼마 되지도 않았고 공부 어떻게 해야할지 모르시는 분들이 많아 몇가지 팁을 드리고자 합니다. 본인은 R을 사용하다가 Pyhon으로 넘어온 사람이라 Python위주로 설명되어 있습니다. 1. 깔끔한 시험이 아니기 때문에 확실하게 대비할 필요가 있다. ADsP나 SQLD를 보신 분들이라면 여기서 출제하는 시험이 국가공인시험이 맞는지 의심이 될 정도로 생각보다 깔끔한 시험이 아닙니다. 애초에 문제가 이상한 것 같다고 질문하면 답변도 안해줍니다. 제가 쓴 단답형이 다 맞다고도 생각하는데 뭐가 틀렸는지 잘 모르겠네요 그 외에도 자신의 능력과 무관하게 어떤 변수가 생길 수 있기 때문에 철저한 대비가 필요합니다. 2. 단답형은 필기시..