본문 바로가기

파이썬 100일 챌린지

[100일 챌린지] 파이썬 pandas 자료형 Series, DataFrame #011

 

 

pandas의 자료형은 Series와 DataFrame이며, 이는 무조건 알아야 한다!

 

 

Series와 DataFrame를 간단히 설명하자면...

Series는 1차원 형태이고

DataFrame는 2차원 형태이다. 

A B C

 

위 예시를 어떻게 구현하는지 아래를 살펴보자.

 

 

1. Series 

 

1-1. Series 선언 

Series를 선언하는 방법은 pd.Series() 안에 [] 대괄호로 리스트를 넣어준다. 

이때 pd는 pandas를 명칭 한 것이다. 

아래 코드를 보면~

 

Series 선언 방법

 

1-2. Series의 index 옵션 지정 

앞에 숫자는 배열의 위치, index를 말한다. 

index를 숫자가 아닌 다르 명칭으로 부르고 싶다면?

Series에 index를 옵션으로 추가로 지정해 주면 된다.

 

Series의 index 사용방법

 

1-3. Series의 index로 정보 찾기 

index는 원하는 정보를 찾을 때 이용된다. 

 

index '2번'을 찾아 값을 보여준다.

 

1-4. dictionary로 Series 선언 

Series를 선언할 때, {} 중괄호로 dictionary를 이용해도 된다. 

index와 데이터 순서대로 입력하고, 쉼표로 구분한다. 

그리고 pd.Series 함수에 dictionary를 넣어준다.

dictionary가 뭐지...?

 

 

 

2. DataFrame 

 

2-1. DataFrame 선언 

상단 1-4처럼 {} 중괄호로 dictionary를 응용해 주면 된다. 

Series는 1차원이기에 데이터 1개만 넣어줬다면, DataFrame은 리스트를 넣어준다. 

dictionary를 pd.DataFrame 함수에 쏘옥 넣어주기만 하면 된다.

아래처럼~

 

복잡해보이긴하지만, 익숙해지겠지...

 

2-2. DataFrame의 열 검색하기 

대괄호안에 칼럼명을 넣어준다.

 

영어의 ABC만 보인다. 

그런데... 2개를 조회해서 보고 싶다면?

 

검색 조건이 2개 이상이면 리스트로...

 

DataFrame이 Series와 비슷하면서도 약간 다르다.

계속 반복하는 수밖에 없다....

 

2-3. DataFrame의 행 검색하기 

그란데... 이게 열로는 검색을 해봤는데 만약 행만 검색하고 싶다면???

DataFrame변수.loc[숫자] 로 검색해 주면 된다.

 

각 열의 0번째 가, A, 김이 검색된다.

 

 

여기까지 공부하면 #010에서 못한 숙제는 풀 수 있겠지..?

 

 


 

먼저 다시 데이터를 읽어와 프린트해보자.

 

음.. 위에 있는 데이터를 열 index로 인식한다...

 

그럼.. 엑셀을 다시 바꿔야지...

 

1행을 추가하고 열에 이름을 부여한다.

 

그러면??

 

오호~

 

완성~~~~~~~~~~~

 

pandas를 이용해 엑셀에서 데이터를 불러와 그래프를 그렸다!!!!

11일 만에 완성~

나중에 이 과정을 다시 정리하는 날이 있을 것이다!!

 

그전에 파이썬을 공부하다 헷갈리는 것을 발견했다. 

중괄호와 대괄호를 언제 사용하는지 아리송하다. 

dictionary도 처음 듣는 데이터 유형이다. 

 

내일은 그 부분에 대해 공부하겠다. 

 

 

 

728x90