본문 바로가기

파이썬 100일 챌린지

[100일 챌린지] 파이썬 pandas 엑셀로 저장, html 읽어오기 #035

 

1. 데이터 엑셀에 저장하기 

 

엑셀 데이터를 가공하여 다른 이름으로 저장하고 싶다면?

 

.to_excel("파일명") 

 

간단하다!!

 

데이터를 정리해두면 코드를 활용하기 편할 것이다.

 

실제 저장된 예시

 

위의 데이터를 이용해서 원 그래프를 그려본다!!! 

 

 

2. 웹 페이지 데이터 읽어오기 

 

웹 페이지에서 데이터를 읽어오는 방법도 있다. 

 

먼저 lxml 라이브러리를 설치해야 한다. 

cmd 창에서~ 

pip install lxml 

 

설치되는 모습

 

음~ 읽어올만한 페이지가 없을까?

 

요거 읽어볼까??

 

웹페이지 읽는 방법도 간단하다. 

pd.read_html('웹 페이지 주소')

 

오호 신기하다~

 

위의 내용은 내가 여러번 수행해서 결과만 깔끔하게 나왔다. 

처음에는 읽어오는 과정도 같이 보인다. 

데이터가 많을 수록 오래걸리니 기다리면 된다. 

 

 

This function searches for <table> elements and only for <tr> and <th> rows and <td> elements within each <tr> or <th> element in the table.
- https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_html.html

 

데이터를 읽을 때 html 안에 Table 태그 tr, th, td 기준으로 읽어온다. 

728x90