본문 바로가기

파이썬 100일 챌린지

[100일 챌린지] 파이썬 pandas 자료형 DataFrame 완전 정복 4탄 (sorting, 열 삭제, top) #034

 

통계청에서 새로운 데이터를 가지고 왔다. 

 

출처-통계청 (성씨·본관별 인구(5인 이상) - 전국)

 

위 내용을 읽어 원그래프를 그려보려 한다. 

 

한국의 성이 이렇게나 많다니...

 

1. DataFrame 정렬 Sorting (ascending)

 

500개를 모두 사용할 수 없어, 30개만 추리려고 한다. 

먼저 숫자를 내림차순 한다. 

 

.sort_values('칼럼명', ascending=False)

오름차순이라면 ascending에 True를 넣어주면 된다. 

 

김씨가 제일 많군여!

 

2. DataFrame 열 삭제 (drop)

 

첫 줄 '전국' 데이터는 쓰지 않을 것이다. 

그래서 삭제를 해주어야 한다. 

 

.drop(인덱스)

인덱스 대신 칼럼명을 넣으면 칼럼 삭제도 가능하다.

 

534개에서 533개로 줄어듬

 

3. DataFrame 상위 항목 호출, top (head)

 

이제 상위 항목 30개만 가지고 오면 된다. 

 

.head(숫자)

 

다 보이지 않지만 30개만 보인다.

 

 

어쩌다 보니 DataFrame만 공부했네 ㅎ

내일부터 원그래프 그린다!! 

728x90