Pandas 기초 3편

1. delete column

 

1-1) del

 

del df[‘debt’] 로 ‘debt’ 열을 삭제함

 

del은 열의 메모리 주소를 삭제함

 

그림1. del 예시

 

1-2) df.drop()

 

df.drop((열이름),axis=)으로도 삭제가 가능하다

 

그러나 얘는 원본을 변화시키진 않음 새로 할당시켜야함

 

그림2. df.drop() 예시

 

 

2. column selection

 

1개 열을 선택할 때는 df[‘account’]로 문자열만 들어가지만

 

2개 이상의 열을 선택할때는 반드시 리스트가 들어가야한다

 

예를 들어 df[ [‘account’,’street’,’state’] ]

 

그림3. 열을 선택할때 방식의 차이

 

위 그림을 보면 1개 열을 선택하더라도 df['account']와 df[['account']] 차이가 있다

 

전자는 series로 가져오지만 후자는 dataframe으로 가져온다

 

-------------------------------------------------------------------------------------------------------------------------

 

그림4. 2개 이상의 열을 선택할 때

 

2개 이상의 열을 선택할 때는 인덱스에 반드시 리스트로 넣어줘야한다

 

-----------------------------------------------------------------------------------------------------------------------------

 

 

series에서는 여러 index 리스트로 지정해서 뽑을 수 있음(fancy index)

 

인덱스 하나만 쓰면 (=df[1,2]가 아니라 df[:3]과 같이) row index로 생각해서 row로만 뽑음

 

그림5. series에서 행을 가져오는 방식

 

boolean index, fancy index, index change 등 가능

 

boolean index는 조건문을 index에 넣어서 조건이 참이 되는 행을 추출함

 

fancy index는 index 리스트를 넣어서 그에 맞는 행을 추출함

 

그림6. boolean indexing과 fancy indexing

 

 

index를 바꿨을 때 loc와 iloc의 차이를 다시 한번 느끼고 가자

 

그림7. loc와 iloc의 차이

 

loc는 index name으로 추출하는 것이고 iloc는 index position number로 추출을 함

 

 

3. reindexing

 

df.index = () 로 index를 변경시킬수 있음

 

df.reset_index()로 변경시킨 index를 df의 열로 병합시키고 원래 기본 인덱스로 바꿀 수 있다

 

그림8. index를 변경하는 예시

 

df.reset_index(drop=True)하면 df의 열로 변경시킨 index 열을 완전히 제거

 

df.reset_index(inplace=True)하면 원본 df를 변화시킴

 

그림9. reset_index 활용

 

'프로그래밍 > Pandas' 카테고리의 다른 글

Pandas 기초 6편  (0) 2021.11.25
Pandas 기초 5편  (0) 2021.11.25
Pandas 기초 4편  (0) 2021.11.24
Pandas 기초 2편  (0) 2021.11.23
Pandas 기초 1편  (0) 2021.11.23
TAGS.

Comments