본문 바로가기

파이썬 100일 챌린지

[100일 챌린지] 파이썬 엑셀을 읽어 간단하게 그래프 그리기 (인덱스 지정, 열 삭제) #024

 

 

이젠 pandas를 주로 이용하려고 한다. 

[100일 챌린지] 파이썬 csv 모듈과 pandas 차이점, 비교 정리 #014

 

pandas가 간단하게 코딩되니...ㅎㅎ

 

오랜만에 엑셀 데이터를 읽고 그래프를 그려보고자 한다. 

아래 정보는 통계청에서 다운로드한 데이터이다. (이름은 sample2로 변경함)

 

 

출처 - 통계청 (지출목적별 소비자물가지수)

 

 

1. 엑셀 정보를 읽어오기 (feat. pandas)

 

pandas 라이브러리의 read_excel을 이용하면, 엑셀 데이터를 DataFrame으로 읽어온다. 

DataFrame은 그대로 출력이 가능하다. 

 

pandas로 엑셀 읽어오기

 

하지만 엑셀에서 A열은 필요 없다. 

그리고 데이터를 조회할 때, 어차피 '지출목적별'로 불러오기를 할 것 같다.

 

 

2. 인덱스 지정하기 (feat. pandas)

 

DataFrame에서 인덱스를 지정해 주면, 검색하기 용이해진다. 

'지출목적별' 기준으로 정보를 불러온다면 인덱스를 지정해 주자!

index_col='인덱스명'

 

가장 왼쪽 인덱스 부분을 보면 데이터가 변경되었다.

 

그런데 '시도별' 열이 신경 쓰인다. 

 

 

3. 열 지우기 (feat. pandas)

 

'시도별' 열을 모두 지워버린다.

data.drop(columns=['칼럼명'])

 

'시도별' 열이 모두 지워졌다.

 

4. 그래프 그리기

 

데이터를 깔끔하게 정리했으니, 그래프를 그려본다. 

DataFrame에 plot 함수만 사용해 주면 된다.

data.plot()

 

뭔가 보기 불편하다...

 

하지만 한글이라 글씨가 깨진다...

 

 

5. 최종 정리 

 

핵심은 "pandas read_excel로 엑셀을 읽어와 plot으로 그래프를 그린다." 이다.

만약, 엑셀에 한글 데이터 설정이 없었다면, 4번에서 끝났다.

데이터가 깔끔했다면 3번 열지우기도 필요 없었다.

 

아래는 한글 폰트 설정과 그래프 크기를 추가로 지정해 준 것뿐이다. 

 

원하는 그래프는 아니지만, 간단한 그래프는 완성!!

 

 

 

앞으로 DataFrame을 이용하여 좀 더 그래프를 그려보겠다.

 

 

 

728x90