일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 해커랭크
- 비밀지도
- 데이터수집
- googlefont
- FinanceDataReader
- 구글폰트
- 숫자형
- Repositories
- github blog
- seaborn
- 깊은복사
- 120주요질문
- 네이버금융
- GIT
- 깃허브블로그
- 한국주식
- Github
- dataframe
- numpy
- Beautifulsoup
- 프로그래머스
- Requests
- 서울정보소통광장
- 수치형변수
- PANDAS
- hackerrank
- Python
- 영어한글폰트차이
- 카카오채용코테'
- SettingWithCopyWarning
- Today
- Total
목록데이터수집 (3)
데린이 재영
목표 설정 - 멋쟁이사자 AI 스쿨 11, 12일차(221004, 221005) 학습 내용 정리하기 - 서울정보소통광장 ▶ 시민소통 ▶ 120 주요 민원 수집하기 데이터 수집 과정 1. 라이브러리 로드 # 파이썬에서 사용할 수 있는 엑셀과 유사한 데이터분석 도구 import pandas as pd import numpy as np # 매우 작은 브라우저로 웹사이트의 내용과 정보를 불러옴 import requests # request로 가져온 웹사이트의 html 태그를 찾기위해 사용 from bs4 import BeautifulSoup as bs # 간격을 두고 가져오기 위해 사용 import time # 진행 상황 확인하기 from tqdm.notebook import tqdm 2. url 가져오기 # ..
목표 설정 - 멋쟁이사자 AI 스쿨 8일차(220928) 학습 내용 정리하기 - Pandas, Requests, BeautifulSoup 라이브러리를 이용해서 네이버 금융 개별종식 데이터 수집하기 배운 내용 정리 1) 사용한 라이브러리 목록 # 테이블형태의 데이터 불러올 때 pd.read_html 사용 import pandas as pd # pandas 짝꿍 import numpy as np # HTTP 요청 import requests # table 태그 찾을 때 사용 from bs4 import BeautifulSoup as bs # time.sleep()으로 시간간격 두고 데이터 수집할 때 사용 - 서버 부담이 되기 때문 import time # 실시간 시간정보 가져올 수 있음 from dateti..
목표 설정 - 멋쟁이사자 AI 스쿨 7일차(220927) 학습 내용 정리하기 - FinanceDataReader 라이브러리를 이용해서 한국 주식 정보 가져오기 FinanceDataReader 한국 주식 가격, 미국 주식 가격, 지수, 환율, 암호화폐 가격, 종목 리스팅 등 금융 데이터 수집 라이브러리 가져온 데이터는 클라우드상의 메모리에 저장되어 있음 단점 : 사이트의 내용 (리뉴얼, 내부코드 변경, 디자인 변경 등) 이 변경되면 그에 맞게 코드를 다시 수정해야 함 결측치 : 채권이나 다른 종목 (금융 상품) 이 포함되어있어 데이터에 결측치 값이 많음 # 라이브러리 설치 !pip install -U finance-datareader # 라이브러리 불러오기 import FinanceDataReader as..