일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 깃허브블로그
- dataframe
- 수치형변수
- 120주요질문
- 영어한글폰트차이
- 카카오채용코테'
- seaborn
- 데이터수집
- FinanceDataReader
- SettingWithCopyWarning
- 구글폰트
- GIT
- numpy
- Python
- github blog
- Beautifulsoup
- Repositories
- 비밀지도
- 서울정보소통광장
- 깊은복사
- PANDAS
- 한국주식
- 숫자형
- 해커랭크
- 프로그래머스
- Github
- googlefont
- 네이버금융
- Requests
- hackerrank
- Today
- Total
목록멋사 AI school 7기/TIL (8)
데린이 재영
목표 설정 - 멋쟁이사자 AI 스쿨 11, 12일차(221004, 221005) 학습 내용 정리하기 - 서울정보소통광장 ▶ 시민소통 ▶ 120 주요 민원 수집하기 데이터 수집 과정 1. 라이브러리 로드 # 파이썬에서 사용할 수 있는 엑셀과 유사한 데이터분석 도구 import pandas as pd import numpy as np # 매우 작은 브라우저로 웹사이트의 내용과 정보를 불러옴 import requests # request로 가져온 웹사이트의 html 태그를 찾기위해 사용 from bs4 import BeautifulSoup as bs # 간격을 두고 가져오기 위해 사용 import time # 진행 상황 확인하기 from tqdm.notebook import tqdm 2. url 가져오기 # ..
목표 설정 - 멋쟁이사자 AI 스쿨 8일차(220928) 학습 내용 정리하기 - Pandas, Requests, BeautifulSoup 라이브러리를 이용해서 네이버 금융 개별종식 데이터 수집하기 배운 내용 정리 1) 사용한 라이브러리 목록 # 테이블형태의 데이터 불러올 때 pd.read_html 사용 import pandas as pd # pandas 짝꿍 import numpy as np # HTTP 요청 import requests # table 태그 찾을 때 사용 from bs4 import BeautifulSoup as bs # time.sleep()으로 시간간격 두고 데이터 수집할 때 사용 - 서버 부담이 되기 때문 import time # 실시간 시간정보 가져올 수 있음 from dateti..
목표 설정 - 멋쟁이사자 AI 스쿨 7일차(220927) 학습 내용 정리하기 - FinanceDataReader 라이브러리를 이용해서 한국 주식 정보 가져오기 FinanceDataReader 한국 주식 가격, 미국 주식 가격, 지수, 환율, 암호화폐 가격, 종목 리스팅 등 금융 데이터 수집 라이브러리 가져온 데이터는 클라우드상의 메모리에 저장되어 있음 단점 : 사이트의 내용 (리뉴얼, 내부코드 변경, 디자인 변경 등) 이 변경되면 그에 맞게 코드를 다시 수정해야 함 결측치 : 채권이나 다른 종목 (금융 상품) 이 포함되어있어 데이터에 결측치 값이 많음 # 라이브러리 설치 !pip install -U finance-datareader # 라이브러리 불러오기 import FinanceDataReader as..
목표 설정 - 멋쟁이사자 AI 스쿨 7일차(220927) 학습 내용 정리하기 - Seaborn 에서 제공하는 시각화 도구 개념 정리 배운 내용 정리 subplot 그릴 수 있는 것 ▶ relplot, displot, catplot (facetgrid 기능 제공) describe(include="number or object") ▶ 특정 데이터 타입에 대한 통계를 볼 수 있음 기본값 : 수치형 데이터 (include="object") include="object" : 범주형 데이터 include="all" : 모든 데이터 exclude : 제외하는 기능 (예 : exclude=np.int64, int64 제외) 범주형 데이터라고 무조건 object 형식은 아님 bool 이나 숫자(int, float)로 된..
목표 설정 - 멋쟁이사자 AI 스쿨 6일차(220926) 학습 내용 정리하기 - Seaborn 에서 제공하는 시각화 도구 개념 정리 배운 내용 정리 라이브러리, 데이터 로드 import pandas as pd import numpy as np import seaborn as sns # seaborn 에서 제공하는 앤스컴콰르텟 데이터셋 로드 방법 df = sns.load_dataset("anscombe") 버전 확인, 최신 버전으로 업그레이드 하는 방법 # 버전 확인 pd.__version__ # 최신 버전으로 업그레이드 !pip install seaborn --upgrade 컬러맵 확인 : plt.colormap() 기술 통계값 확인 수치형 변수에 대한 기술통계값 : df.describe() 범주형 변수..
목표 설정 - 멋쟁이사자 AI 스쿨 3일차(220921) 학습 내용 정리하기 - Pandas 라이브러리에 대해 이해하기 배운 내용 정리 분석에 주로 사용할 라이브러리 pandas, numpy, matplotlib, seaborn 등 시각화 - 심리적인 정보 전달 (다양한 라이브러리로 데이터 표현 가능) Matplotlib : 정적인 데이터 표현 (수학적 연산에 대한 그래프를 그려주는 라이브러리) Javascript : 동적인 데이터 표현 Pandas (판다스) 엑셀과 같이 행, 열로 된 구조를 다루는 데이터 분석 도구 DataFrame과 Series 이해 필요 Numpy (넘파이) 파이썬에서 사용할 수 있는 공학용 계산기 파이썬은 접착제 언어라서 다른 언어와의 연결을 통해 직간접적으로 성능 향상 가능 P..
목표 설정 - 멋쟁이사자 AI 스쿨 2일차(220920) 학습 내용 정리하기 - 파이썬 프로그램의 구조를 만드는 제어문(조건문, 반복문)과 함수 이해하기 1. 조건문 2. 반복문 3. 함수 알아두면 좋은 연산자 목록 연산자 설명 x or y x와 y 둘중에 하나만 참이어도 참 x and y x와 y 모두 참이어야 참 not x x가 거짓이면 참 in 과 not in 설명 x in (리스트/튜플/문자열) 자료형 안에 x 있으면 참 x not in (리스트/튜플/문자열) 자료형 안에 x 없으면 참 1. 조건문(if문) if문은 조건을 판단하여 해당 조건에 맞는 상황을 수행하는데 쓰는 것으로, 기본 구조는 if와 else로 구성됨 - 들여쓰기 : 4개의 공백 or Tab - if 조건문 뒤에 콜론(:) 사용하..
자료형은 데이터의 '종류'를 말하며 영어로는 Type이라고 합니다. 정수라면 integer 타입, 실수라면 float 타입, 이름과 같이 문자 형태라면 string 타입 등 데이터 종류에는 여러가지 타입이 있습니다. 목표 설정 - 멋쟁이사자 AI 스쿨 1일차(220919) 학습 내용 정리하기 - 파이썬의 기초인 자료형 (Bool, 숫자, 문자열, 리스트, 딕셔너리, 튜플, 집합) 이해하기 1. 숫자형 (Number) 2. 문자열 자료형 (String) 3. 리스트 자료형 (List) 4. 튜플 자료형 (Tuple) 5. 딕셔너리 자료형 (Dictionary) 6. 집합 자료형 (Set) 7. 불 자료형 (Bool) 1. 숫자형 (Number) 파이썬에서 수는 정수 (int) 와 실수 (float) 로 구..