일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 프로그래머스
- 한국주식
- 카카오채용코테'
- github blog
- 120주요질문
- GIT
- 깃허브블로그
- 비밀지도
- 숫자형
- 데이터수집
- Repositories
- 네이버금융
- 수치형변수
- 구글폰트
- dataframe
- googlefont
- numpy
- 해커랭크
- Python
- 영어한글폰트차이
- Requests
- SettingWithCopyWarning
- 서울정보소통광장
- Github
- 깊은복사
- seaborn
- FinanceDataReader
- PANDAS
- hackerrank
- Beautifulsoup
- Today
- Total
목록PANDAS (5)
데린이 재영

목표 설정 - 멋쟁이사자 AI 스쿨 11, 12일차(221004, 221005) 학습 내용 정리하기 - 서울정보소통광장 ▶ 시민소통 ▶ 120 주요 민원 수집하기 데이터 수집 과정 1. 라이브러리 로드 # 파이썬에서 사용할 수 있는 엑셀과 유사한 데이터분석 도구 import pandas as pd import numpy as np # 매우 작은 브라우저로 웹사이트의 내용과 정보를 불러옴 import requests # request로 가져온 웹사이트의 html 태그를 찾기위해 사용 from bs4 import BeautifulSoup as bs # 간격을 두고 가져오기 위해 사용 import time # 진행 상황 확인하기 from tqdm.notebook import tqdm 2. url 가져오기 # ..

목표 설정 - 멋쟁이사자 AI 스쿨 8일차(220928) 학습 내용 정리하기 - Pandas, Requests, BeautifulSoup 라이브러리를 이용해서 네이버 금융 개별종식 데이터 수집하기 배운 내용 정리 1) 사용한 라이브러리 목록 # 테이블형태의 데이터 불러올 때 pd.read_html 사용 import pandas as pd # pandas 짝꿍 import numpy as np # HTTP 요청 import requests # table 태그 찾을 때 사용 from bs4 import BeautifulSoup as bs # time.sleep()으로 시간간격 두고 데이터 수집할 때 사용 - 서버 부담이 되기 때문 import time # 실시간 시간정보 가져올 수 있음 from dateti..

목표 설정 - 멋쟁이사자 AI 스쿨 7일차(220927) 학습 내용 정리하기 - FinanceDataReader 라이브러리를 이용해서 한국 주식 정보 가져오기 FinanceDataReader 한국 주식 가격, 미국 주식 가격, 지수, 환율, 암호화폐 가격, 종목 리스팅 등 금융 데이터 수집 라이브러리 가져온 데이터는 클라우드상의 메모리에 저장되어 있음 단점 : 사이트의 내용 (리뉴얼, 내부코드 변경, 디자인 변경 등) 이 변경되면 그에 맞게 코드를 다시 수정해야 함 결측치 : 채권이나 다른 종목 (금융 상품) 이 포함되어있어 데이터에 결측치 값이 많음 # 라이브러리 설치 !pip install -U finance-datareader # 라이브러리 불러오기 import FinanceDataReader as..
목표 설정 - 멋쟁이사자 AI 스쿨 6일차(220926) 학습 내용 정리하기 - Seaborn 에서 제공하는 시각화 도구 개념 정리 배운 내용 정리 라이브러리, 데이터 로드 import pandas as pd import numpy as np import seaborn as sns # seaborn 에서 제공하는 앤스컴콰르텟 데이터셋 로드 방법 df = sns.load_dataset("anscombe") 버전 확인, 최신 버전으로 업그레이드 하는 방법 # 버전 확인 pd.__version__ # 최신 버전으로 업그레이드 !pip install seaborn --upgrade 컬러맵 확인 : plt.colormap() 기술 통계값 확인 수치형 변수에 대한 기술통계값 : df.describe() 범주형 변수..
목표 설정 - 멋쟁이사자 AI 스쿨 3일차(220921) 학습 내용 정리하기 - Pandas 라이브러리에 대해 이해하기 배운 내용 정리 분석에 주로 사용할 라이브러리 pandas, numpy, matplotlib, seaborn 등 시각화 - 심리적인 정보 전달 (다양한 라이브러리로 데이터 표현 가능) Matplotlib : 정적인 데이터 표현 (수학적 연산에 대한 그래프를 그려주는 라이브러리) Javascript : 동적인 데이터 표현 Pandas (판다스) 엑셀과 같이 행, 열로 된 구조를 다루는 데이터 분석 도구 DataFrame과 Series 이해 필요 Numpy (넘파이) 파이썬에서 사용할 수 있는 공학용 계산기 파이썬은 접착제 언어라서 다른 언어와의 연결을 통해 직간접적으로 성능 향상 가능 P..