13일 동안 무조건 달려오다 보니 복습이 필요하다.
현재 csv 파일을 2가지 방법으로 읽을 수 있다.
1. 파이썬 내부 모듈인 csv 모듈 사용
2. 파이썬 외부 라이브러리인 pandas 이용
2가지를 혼용하니 헷갈리기 시작한다.
오늘 이것을 정리한다!!!!
1. csv 모듈보다 pandas 가 코드가 간단해 보인다.
예제로 사용할 csv 파일이다.
csv 모듈을 사용하면 open과 close를 해줘야 한다.
하지만 pandas를 이용하면 불필요!!
2. csv 데이터가 저장된 객체가 다르다.
csv 모듈은 reader( ) 함수에서 csv reader 객체를 생성한다.
하지만 pandas는 read_csv( ) 함수에서 DataFrame 객체를 생성한다.
csv 모듈에서는 data가 iterator (이터레이터) 형식이기 때문에 next( ) 함수를 사용할 수 있다.
그리고 각 행은 list 형식이다.
pandas는 DataFrame이기에 csv 모듈에서 불러온 데이터와 사용법이 다르다.
그러면 어떤 모듈을 써야할까??
초보자라면 csv 모듈을 사용, csv 모듈이 익숙해졌다면 pandas로!!
csv 모듈은 파이썬 내부 모듈이기에 데이터 형식도 기본적인 것들이 많다. (list나 iterator 등...)
물론 코드가 길어지긴 하지만 그 또한 공부 아니겠나..
csv 모듈을 통해 파이썬이 익숙해졌다면
pandas를 설치하고 Series, DataFrame를 익히면서 더 공부하면 될 듯하다.
아직 파이썬이 익숙하지 않은 파린이기에...
당분간은 csv 모듈을 사용하겠다!!
'파이썬 100일 챌린지' 카테고리의 다른 글
[100일 챌린지] 파이썬 matplotlib의 rcParams를 default 세팅하기, style 원복하기 #016 (0) | 2021.05.30 |
---|---|
[100일 챌린지] 파이썬 Matplotlib 그래프 격자 스타일(ggplot), 그래프 크기(figsize) #015 (0) | 2021.05.29 |
[100일 챌린지] 파이썬 csv 파일 행 단위 읽기, 행 넘기기 next() #013 (0) | 2021.05.25 |
[100일 챌린지] 파이썬 배열, 리스트, 튜플, 딕셔너리 (array, list, tuple, set, dictionary) 괄호 차이 #012 (0) | 2021.05.22 |
[100일 챌린지] 파이썬 pandas 자료형 Series, DataFrame #011 (0) | 2021.05.20 |