본문 바로가기

파이썬 DataFrame

[100일 챌린지] 파이썬 pandas 자료형 DataFrame 완전 정복 4탄 (sorting, 열 삭제, top) #034 통계청에서 새로운 데이터를 가지고 왔다. 위 내용을 읽어 원그래프를 그려보려 한다. 1. DataFrame 정렬 Sorting (ascending) 500개를 모두 사용할 수 없어, 30개만 추리려고 한다. 먼저 숫자를 내림차순 한다. .sort_values('칼럼명', ascending=False) 오름차순이라면 ascending에 True를 넣어주면 된다. 2. DataFrame 열 삭제 (drop) 첫 줄 '전국' 데이터는 쓰지 않을 것이다. 그래서 삭제를 해주어야 한다. .drop(인덱스) 인덱스 대신 칼럼명을 넣으면 칼럼 삭제도 가능하다. 3. DataFrame 상위 항목 호출, top (head) 이제 상위 항목 30개만 가지고 오면 된다. .head(숫자) 어쩌다 보니 DataFrame만 공.. 더보기
[100일 챌린지] 파이썬 pandas 자료형 DataFrame 완전 정복 3탄 (column, index 정보 가져오기) #029 위 정보에서 '0 총지수' 만 추출해 막대그래프를 그려보고 싶다. x축, y축에 원하는 값을 넣어주어야 하는데... y축 정보야 loc 함수를 이용하면 된다. 그러면 x축은?? 1. DataFrame에서 column 추출 pandas API 사이트에서 확인해보면... DataFrame 뒤에 .columns 라고 붙여주기만 하면 된다. x축 정보에 data.columns을 넣어주면?? 2. DataFrame에서 index 추출 pandas API 사이트에서 확인해보면... DataFrame 뒤에 .index 라고 붙여주기만 하면 된다. 더보기
[100일 챌린지] 파이썬 pandas 자료형 DataFrame 완전 정복 2탄 (loc와 iloc 차이) #027 DataFrame에서 행을 조회하는 방법은 loc이다. (#026 참고) [100일 챌린지] 파이썬 pandas 자료형 DataFrame 완전 정복 1탄 (다시 기초부터!) #026 그런데 가끔 iloc도 사용된다. loc와 iloc의 차이는 무엇일까? 다시 아래 엑셀 파일로 테스트해보자. pandas로 엑셀을 읽어와 iloc를 해보면, loc로 호출한 내용과 동일하다. (loc 내용은 #026을 참고해 주세요) 1. DataFrame에서 인덱스를 지정한다면? #024에서 인덱스 칼럼을 지정했었다. (B열 '지출목적별') [100일 챌린지] 엑셀을 읽어 간단하게 그래프 그리기 (인덱스 지정, 열 삭제) #024 그리고 나서 loc를 호출해보면... 위 내용 때문에 멘붕이 왔다. loc면 다 되는거 아니었.. 더보기
[100일 챌린지] 파이썬 pandas 자료형 DataFrame 완전 정복 1탄 (다시 기초부터!) #026 파이썬 100일 챌린지의 1쿼터를 넘기면서 헷갈리는 부분이 자료형이 DataFrame이다. 이번에 제대로 DataFrame을 공부해보고자 한다. 1. DataFrame 개념!! 인덱스(index) 와 컬럼(column) 헷갈리지 말자! 행과 열도 헷갈리지 말자! 222222 (칼럼이 표준어인데.. 왜 책에서 컬럼으로 쓰는걸까?) 2. 행과 열, 왜 헷갈리지 말아야 하는데?? 왜냐하면 검색 방법이 다르기 때문이다. #024에서 했던 작업을 다시 진행해보면.... 여기서 행과 열을 검색해본다고 가정하자. 행을 검색할 때는 번호(인덱스)를 이용하면 된다. 열을 검색할 때는 컬럼명을 이용하면 된다. 행을 검색하는 방법은 loc[인덱스] 이다. 열을 검색하는 방법은 ['칼럼명'] 이다. 대~충 공부하고 파이썬하면.. 더보기