본문 바로가기
AI SCHOOL/WIL

[WEEK 7] 멋쟁이사자처럼 AI 스쿨 7주차

2023. 2. 2.

멋사 AI SCHOOL 8기의 30% 지점을 지나고 있다.

이번주에는 EDA를 했다.
파이썬, 판다스, 데이터 수집을 지나서 이를 활용한 데이터 분석의 시작인 것 같다.
그리고 pandas에 대한 실력과 자신감이 많이 오른 느낌이다.
이번주의 키워드로 pandas, FinanceDataReader, 데이터 시각화(matplotlib, plotly)를 선정한다.

학습 내용 요약 - 각 세부 사항은 TIL로 작성

실제 오픈 데이터인 서울시 코로나 확진자 데이터를 사용하여 인덱스 다루기 파생변수 만들기 등 DataFrame을 다루는 실력을 많이 키운 것 같다.
처음으로 시계열 데이터를 다루었고 시각화도 경험해봤다.
DAY 24 TIL

 

[DAY 24] 서울시 코로나19 발생동향 분석 - index 다루기, 데이터 요약, 기술통계, 파생변수, 시각화

EDA를 시작했다. 서울시 코로나 확진자 데이터를 pandas DataFrame으로 다루어봤다. 실제 데이터를 분석하고 시각화해보는 시간을 가졌다. glob 파일 목록을 간편하게 확인할 수 있는 glob 사용법을 배

icedhotchoco.tistory.com


그 후 두 개의 변수에 대한 빈도수와 빈도 비율을 구하고 이를 시각화했다.
background_gradient, subplot 등 다양한 시각화 방식을 알게 되었다.
DAY 25 TIL

 

[DAY 25] 서울시 코로나19 EDA - crosstab, str.contains와 isin, 데이터 시각화

DAY 24에 이어 서울시 코로나19 확진자 EDA를 했다. 다양한 분석을 하며 pandas에 더 익숙해지고 시각화에 대한 감을 잡은 것 같다. pandas의 crosstab 두 개의 변수에 대한 빈도수, 빈도 비율 구하기 # 연

icedhotchoco.tistory.com


직접 수집한 데이터를 통한 EDA를 경험했다.
FinanceDataReader를 이용하여 주가 데이터를 수집했고 matplotlib을 이용하여 주가 추세, 수익률 등을 시각화하며 EDA에 대한 시야를 넓힌 것 같다.
DAY 26 TIL

 

[DAY 26] 시가총액 상위 10종목 EDA - 주가추세, 수익률, pandas, matplotlib

KRX 상장 종목 중 시가총액 상위 10개 종목 데이터를 수집하여 분석하고 시각화했다. 데이터 수집에 FinanceDataReader를 활용했다. 데이터 수집 우선 Anaconda Prompt에서 finance-datareader를 설치했다. 그 후

icedhotchoco.tistory.com


EDA는 반복학습과 많은 경험이 필요할 것 같다.

반응형

댓글