반응형
파이썬크롤링
-
크롤링으로 교보문고, 리디북스 책 목록 가져오기, 데이터프레임만들기, 엑셀로 저장하기!!!공부/Python 2021. 7. 27. 00:20
순서 1. 리디북스 베스트셀러 책 목록 가져오기 2. 교보문고 베스트셀러 책 목록 가져오기 3. 교보문고 베스트셀러 책 목록, 저자, 가격 가져오기 4. 3에서 가져온 리스트들을 데이트 프레임으로 만들기 5. 만든 데이터 프레임을 엑셀로 저장하기 1. 먼저 리디북스 부터 해본다. 해당 부분은 https://hyongdoc.tistory.com/191 블로그를 참고했다. 1. 필요한 패키지 불러오기 import requests # 웹페이지를 불러오기 위한 패키지 import lxml.html 여기서 lxml은 Python에서 XML parser로서 주로 이용되는 패키지는 로서 음... 그냥 html을 활용하기 위해 쓰인다고 하면 될 거 같다. 2. 웹 페이지 불러오기 url='https://ridibook..