본문 바로가기

파이썬 100일 챌린지

[100일 챌린지] 파이썬 csv 모듈과 pandas 차이점, 비교 정리 #014

 

 

13일 동안 무조건 달려오다 보니 복습이 필요하다. 

현재 csv 파일을 2가지 방법으로 읽을 수 있다. 

 

1. 파이썬 내부 모듈인 csv 모듈 사용

2. 파이썬 외부 라이브러리인 pandas 이용

 

2가지를 혼용하니 헷갈리기 시작한다. 

 

오늘 이것을 정리한다!!!!

 

1. csv 모듈보다 pandas 가 코드가 간단해 보인다.

 

예제로 사용할 csv 파일이다.

2행부터 원하는 데이터이다.

 

csv 모듈을 사용하면 open과 close를 해줘야 한다. 

 

 

하지만 pandas를 이용하면 불필요!! 

 

csv 모듈보다 짤막하다..

 

 

2. csv 데이터가 저장된 객체가 다르다. 

 

csv 모듈은 reader( ) 함수에서 csv reader 객체를 생성한다. 

하지만 pandas는 read_csv( ) 함수에서 DataFrame 객체를 생성한다.

 

 

csv 모듈에서는 data가 iterator (이터레이터) 형식이기 때문에 next( ) 함수를 사용할 수 있다.

그리고 각 행은 list 형식이다. 

 

next 함수 사용 예시

 

pandas는 DataFrame이기에 csv 모듈에서 불러온 데이터와 사용법이 다르다.

 

DataFrame은 print( ) 없이도 출력 가능하다.

 

 

그러면 어떤 모듈을 써야할까??

 

초보자라면 csv 모듈을 사용, csv 모듈이 익숙해졌다면 pandas로!!

csv 모듈은 파이썬 내부 모듈이기에 데이터 형식도 기본적인 것들이 많다. (list나 iterator 등...)

물론 코드가 길어지긴 하지만 그 또한 공부 아니겠나.. 

csv 모듈을 통해 파이썬이 익숙해졌다면 

pandas를 설치하고 Series, DataFrame를 익히면서 더 공부하면 될 듯하다. 

 

 

아직 파이썬이 익숙하지 않은 파린이기에... 

당분간은 csv 모듈을 사용하겠다!! 

 

 

 

 

728x90