pandas의 자료형은 Series와 DataFrame이며, 이는 무조건 알아야 한다!
Series와 DataFrame를 간단히 설명하자면...
Series는 1차원 형태이고
가 | 나 | 다 |
DataFrame는 2차원 형태이다.
가 | 나 | 다 |
A | B | C |
김 | 이 | 박 |
위 예시를 어떻게 구현하는지 아래를 살펴보자.
1. Series
1-1. Series 선언
Series를 선언하는 방법은 pd.Series() 안에 [] 대괄호로 리스트를 넣어준다.
이때 pd는 pandas를 명칭 한 것이다.
아래 코드를 보면~
1-2. Series의 index 옵션 지정
앞에 숫자는 배열의 위치, index를 말한다.
index를 숫자가 아닌 다르 명칭으로 부르고 싶다면?
Series에 index를 옵션으로 추가로 지정해 주면 된다.
1-3. Series의 index로 정보 찾기
index는 원하는 정보를 찾을 때 이용된다.
1-4. dictionary로 Series 선언
Series를 선언할 때, {} 중괄호로 dictionary를 이용해도 된다.
index와 데이터 순서대로 입력하고, 쉼표로 구분한다.
그리고 pd.Series 함수에 dictionary를 넣어준다.
2. DataFrame
2-1. DataFrame 선언
상단 1-4처럼 {} 중괄호로 dictionary를 응용해 주면 된다.
Series는 1차원이기에 데이터 1개만 넣어줬다면, DataFrame은 리스트를 넣어준다.
dictionary를 pd.DataFrame 함수에 쏘옥 넣어주기만 하면 된다.
아래처럼~
2-2. DataFrame의 열 검색하기
대괄호안에 칼럼명을 넣어준다.
그런데... 2개를 조회해서 보고 싶다면?
DataFrame이 Series와 비슷하면서도 약간 다르다.
계속 반복하는 수밖에 없다....
2-3. DataFrame의 행 검색하기
그란데... 이게 열로는 검색을 해봤는데 만약 행만 검색하고 싶다면???
DataFrame변수.loc[숫자] 로 검색해 주면 된다.
여기까지 공부하면 #010에서 못한 숙제는 풀 수 있겠지..?
먼저 다시 데이터를 읽어와 프린트해보자.
그럼.. 엑셀을 다시 바꿔야지...
그러면??
pandas를 이용해 엑셀에서 데이터를 불러와 그래프를 그렸다!!!!
11일 만에 완성~
나중에 이 과정을 다시 정리하는 날이 있을 것이다!!
그전에 파이썬을 공부하다 헷갈리는 것을 발견했다.
중괄호와 대괄호를 언제 사용하는지 아리송하다.
dictionary도 처음 듣는 데이터 유형이다.
내일은 그 부분에 대해 공부하겠다.
'파이썬 100일 챌린지' 카테고리의 다른 글
[100일 챌린지] 파이썬 csv 파일 행 단위 읽기, 행 넘기기 next() #013 (0) | 2021.05.25 |
---|---|
[100일 챌린지] 파이썬 배열, 리스트, 튜플, 딕셔너리 (array, list, tuple, set, dictionary) 괄호 차이 #012 (0) | 2021.05.22 |
[100일 챌린지] 파이썬 pandas 설치와 csv 읽기 #010 (0) | 2021.05.17 |
[100일 챌린지] 파이썬 int 변환, csv 모듈 숫자 읽기, 이중 for문 #009 (0) | 2021.05.16 |
[100일 챌린지] 파이썬에서 자주 쓰는 기초 문법 (list형, for, if) #008 (0) | 2021.05.15 |