본문 바로가기

크롤링5

배당주 리스트 정리 1. 개요  - 네이버증권에서 배당종목 리스트를 크롤링하여 엑셀로 불러와 추가 가공을 통해 배당투자 후보군을 압축[개발/파이썬] - 웹크롤링_네이버증권 배당 기업정보  2. 자료정리(1) 웹크롤링 파일정리  - 네이버증권 ‘배당’탭에서 다운받은 리스트에서 배당수익 6% 미만 종목 삭제   - 최근년도+직전3년(총4개년도) 중 한해라도 배당 미지급한 종목 삭제   - 리츠와 같은 특수한 종목이나 실적이 (-)인 종목 삭제   - 최근년도 배당액이 직전3년과 비교해서 현저히 높은 종목 삭제 (2) 추가정보 입력  - 배당시기(분기 / 반기 / 연말)* 참고 - 증권정보포탈 세이브로 → 주식 → 배당정보* 2023년도 배당내역을 바탕으로 정리하되, 정부의 ‘배당선진화 가이드라인’ 발표에 따라 2023년~202.. 2024. 6. 9.
웹크롤링_네이버증권 배당 기업정보 1. 개요  - 배당주에 투자하기 위해 네이버증권에서 직전 3개년 배당금과 최근연도기준 배당수익률 등 기업정보 크롤링하기  2. 웹크로링 실행(1) 라이브러리 설치pip install requestspip install bs4 (2) 라이브러리 불러오기 import requestsfrom bs4 import BeautifulSoupimport csv (3) 데이터 요청 및 추출 url = "https://finance.naver.com/sise/sise_market_sum.naver?&page="for page in range(1, 5): res = requests.get(url + str(page)) res.raise_for_status() soup = BeautifulSoup(res... 2024. 6. 9.
웹크롤링_네이버증권 시가총액순 기업정보(심화) 1. 개요  - 네이버증권에서 시가총액순으로 기업정보 정렬시 기본 체크된 항목을 해제하고 다른 투자지표로 적용한 후 크롤링하기  2. 웹크로링 실행(1) 라이브러리 설치pip install pandas, selenium, lxml* pandas – 테이블 형태의 데이터 조작과 분석* selenium – 웹 브라우저에서 페이지 이동, 입력, 클릭 등 자동으로 실행* lxml – XML, HTML 문서에서 구조화된 데이터 가공 (2) 라이브러리 불러오기 import osimport pandas as pdfrom selenium import webdriverfrom selenium.webdriver.common.by import By (3) 데이터 요청 및 추출 browser = webdriver.Chrome.. 2024. 6. 9.
웹크롤링_네이버증권 시가총액순 기업정보 1. 개요  - 투자를 위한 기업의 기초정보 수집을 위해 네이버증권에서 코스피 시가총액순으로 정리된 기업정보 크롤링하기  2. 웹크로링 실행(1) 라이브러리 설치pip install requestspip install bs4* requests – 웹페이지에서 HTML 데이터 추출* beautifulsoup – requests 로 수집한 HTML 데이터를 분석하고 구조화된 형태로 변환 (2) 라이브러리 불러오기 import requestsfrom bs4 import BeautifulSoupimport csv (3) 데이터 요청 및 추출 url = "https://finance.naver.com/sise/sise_market_sum.naver?&page="for page in range(1, 5): r.. 2024. 6. 9.