Pandas 기초 4편

1. drop

 

df.drop((index_number))로 index_number에 해당하는 행 제거

 

그림1. df.drop() 예시

 

인덱스 리스트를 넣어 지정하는 행 제거(fancy index)

 

그림2. df.drop()에 리스트를 넣어 여러개의 행을 제거

 

axis 연산도 가능

 

그림3. df.drop() axis 연산

 

axis=1로 해서 city와 state에 해당하는 column을 제거함

 

---------------------------------------------------------------------------------------------------------------------------

 

2. dataframe operation

 

index를 기준으로 연산을 수행함

 

겹치는 index가 없는 경우에는 NaN을 집어넣음

 

dataframe은 column index도 고려함

 

fill_value= 으로 겹치는 부분이 없는 곳이 있는 dataframe에 미리 집어넣는 값을 지정하고 연산을 수행하게함

 

axis연산도 가능, broadcasting도 가능

 

그림4. 두 series 덧셈 예시

 

두 series s1,s2에 모두 존재하는 index는 중복되어서 나올 수 있다

 

s1+s2여서 s1의 index가 먼저 나오고 s2의 index가 나중에 나옴

 

그림5. series 덧셈 예시

 

s1+s2 말고도 s1.add(s2)와 같이 쓸 수도 있다

 

그림6. 데이터프레임 예시

 

데이터프레임 df1, df2가 위와 같이 주어질 때 두 데이터프레임의 덧셈은

 

 

그림6. fill_value 사용 예시

 

덧셈을 했는데 NaN이 있는 경우 fill_value=에 지정하면 미리 채워넣을 수 있다

 

위에선 df1의 4행, 4열에 0을 채워넣은 뒤에 덧셈을 한 것을 추측 할 수 있다

 

그림7. axis연산을 적용한 모습

 

덧셈에 axis 연산도 가능함

 

그림8. mul 연산 예시

 

add말고도 mul, sub, div 등 다양한 연산이 있다

 

 

'프로그래밍 > Pandas' 카테고리의 다른 글

Pandas 기초 6편  (0) 2021.11.25
Pandas 기초 5편  (0) 2021.11.25
Pandas 기초 3편  (0) 2021.11.24
Pandas 기초 2편  (0) 2021.11.23
Pandas 기초 1편  (0) 2021.11.23
TAGS.

Comments