본문 바로가기

Python35

Python - 엑셀파일과 크롤링 인프런 파이썬 입문 수업을 듣고 중요한 내용을 정리했습니다. 개인 공부 후 자료를 남기기 위한 목적이므로 내용 상에 오류가 있을 수 있습니다. 크롤링 & 엑셀파일(Python) 크롤링으로 추출한 데이터를 엑셀파일의 생성·저장 및 읽기의 방법과 접목시켜 다양한 기능을 구현하고자 한다. 엑셀파일 생성하기 import openpyxl excel_file = openpyxl.Workbook() 우선, 엑셀파일을 읽고 저장할 수 있는 openpyxl 라이브러리를 임포트 한다. 그리고 openpyxl 라이브러리의 Workbook() 함수를 활용하여, 엑셀파일을 생성한 후 변수 excel_file에 할당한다. excel_sheet = excel_file.active excel_sheet.title = '리포트' 이렇.. 2021. 11. 1.
Python - 크롤링 기법 인프런 파이썬 입문 수업을 듣고 중요한 내용을 정리했습니다. 개인 공부 후 자료를 남기기 위한 목적이므로 내용 상에 오류가 있을 수 있습니다. 크롤링 기법(Python) 예제를 통한 크롤링 기법 연습 여러 페이지를 한 번에 크롤링하는 기법 import requests from bs4 import BeautifulSoup for page_num in range(10): if page_num == 0: res = requests.get('https://davelee-fun.github.io/') else: res = requests.get('https://davelee-fun.github.io/page' + str(page_num + 1)) soup = BeautifulSoup(res.content, 'ht.. 2021. 10. 31.
Python - 크롤링 라이브러리 비교(requests vs urllib) 인프런 파이썬 입문 수업을 듣고 중요한 내용을 정리했습니다. 개인 공부 후 자료를 남기기 위한 목적이므로 내용 상에 오류가 있을 수 있습니다. 크롤링 라이브러리 비교(Python) 예제를 통해 두 개의 라이브러리 사용법을 비교해보고자 한다. requests 라이브러리 사용 예시 import requests from bs4 import BeautifulSoup res = requests.get('https://davelee-fun.github.io/') soup = BeautifulSoup(res.content, 'html.parser') data = soup.select('h4.card-text') for item in data: print(item.get_text().strip()) ``` 결과 : 상.. 2021. 10. 31.
Python - 크롤링 실전 연습(1) 인프런 파이썬 입문 수업을 듣고 중요한 내용을 정리했습니다. 개인 공부 후 자료를 남기기 위한 목적이므로 내용 상에 오류가 있을 수 있습니다. 크롤링 연습(Python) 예제를 통해 크롤링 실전 연습을 하고자 한다. 쇼핑 사이트 크롤링 (예제 연습을 위해 만든 예제 사이트) import requests from bs4 import BeautifulSoup res = requests.get('https://davelee-fun.github.io/') soup = BeautifulSoup(res.content, 'html.parser') items = soup.select('div.mainheading > h1') for item in items: print(item.get_text()) ``` 결과 : T.. 2021. 10. 31.
Python - CSS selector를 활용한 크롤링 인프런 파이썬 입문 수업을 듣고 중요한 내용을 정리했습니다. 개인 공부 후 자료를 남기기 위한 목적이므로 내용 상에 오류가 있을 수 있습니다. 크롤링 with CSS selector(Python) CSS selector를 사용하여, 크롤링하는 방법을 다루고자 한다. 크롤링 연습(selector 사용) import requests from bs4 import BeautifulSoup res = requests.get('https://davelee-fun.github.io/blog/crawl_test_css.html') soup = BeautifulSoup(res.content, 'html.parser') items = soup.select('li') for item in items: print(item.g.. 2021. 10. 29.
Python - 크롤링 기술 팁 인프런 파이썬 입문 수업을 듣고 중요한 내용을 정리했습니다. 개인 공부 후 자료를 남기기 위한 목적이므로 내용 상에 오류가 있을 수 있습니다. 크롤링 기술 tips(Python) 추출한 데이터를 다시 한 번 추출하는 방법과 데이터 전처리(가공, 정제) 방법에 대해 다루고자 한다. 크롤링 기술(데이터 재추출) import requests from bs4 import BeautifulSoup res = requests.get('https://davelee-fun.github.io/blog/crawl_test') soup = BeautifulSoup(res.content, 'html.parser') titles = soup.find_all('li', 'course') for title in titles: pr.. 2021. 10. 29.