본문 바로가기

멋쟁이사자처럼109

[DAY 18] BeautifulSoup 태그 찾기 방법 3가지, 매직 커맨드, 시리즈를 list로 변경, map, apply BeautifulSoup로 같은 문서에 같은 텍스트를 찾아도 여러 방식으로 작성할 수 있다는 것을 알게 되었다. 시간을 측정하는 매직 커맨드와 시리즈 다루기, 판다스의 메소드 등을 공부했다. BeautifulSoup 메소드 3가지 만약 어떤 BeautifulSoup 객체 soup에서 class가 sample인 div 태그를 찾는다고 한다면, 그 태그의 텍스트는 아래와 같은 방법으로 추출할 수 있다. 1. soup.select("div.sample")[0].text 2. soup.find('div', {'class':'sample'}.text 3. soup.find_all('div', {'class':'sample'}[0].text 매직 커맨드(Magic Commands) Ipython 환경에서 %기호로 .. 2023. 1. 18.
[DAY 17] Jupyter Notebook 사용, 장점, 단축키 오늘부터 Google Colab에서 Jupyter Notebook으로 환경을 바꿨다. Jupyter Notebook이 무엇이고, 어떤 장점이 있으며, 어떻게 사용할까? Jupyter Notebook Jupyter에서 제작한 Python IDE이다. 웹 브라우저에서 Python 코드를 작성하고 실행해 볼 수 있다. 과거 명칭은 Ipython Notebook이었으나 Python 뿐 아니라 여러 프로그래밍 언어를 지원하게 되며 명칭을 변경하였다. 지원하는 언어 중 핵심 언어 3가지인 Julia, Python, R에서 Jupyter라는 이름이 유래되었다고 한다. Jupyter Notebook 사용시 장점 Colab과 Jupyter Notebook 모두 Interactive mode를 지원하는데, Colab에 비.. 2023. 1. 17.
[DAY 16] 코랩, 개발자도구, 파이썬에 대한 팁 오늘은 웹 스크래핑도 진행했지만 강의 중에 여러 팁이 있었다. 코랩, 개발자도구, 파이썬을 사용할 때 알아야 할(알면 좋은) 팁들을 남겨 본다. Google Colab - 코드 실행 결과가 출력되어 있으면 복잡해지고 문제를 찾기 어렵다. - 상단의 수정 -> 모든 출력 지우기를 통해 한 번에 지울 수 있다. - 셀 순서를 유의해서 실행해야 한다. 변수가 정의되지 않은 상태거나 의도치 않는 값이 저장된 상태로 실행될 수 있다. - module import는 항상 우선적으로 신경써야한다. 개발자도구 - 검사 -> Network에서 주로 Fetch/XHR, JS, Doc을 사용할 것이다. - 화면의 원하는 부분에서 우클릭 -> 검사를 통해 코드를 확인해보자. GET/POST - 일반적으론 GET 방식으로 요청.. 2023. 1. 16.
[DAY 15] SQL 첫 강의 - distinct, as, limit, 집계함수, where, group by Special Lecture인 SQL 첫 강의였다. 수업 진행 방법 안내 후 SQL의 역할, RDBMS, SQL 문법 종류에 대해 강의 후 실습 환경을 구성했다. 실습 환경 : Google BigQuery - 머신러닝, 지리정보 분석, 비즈니스 인텔리전스와 같은 기본 제공 기능으로 데이터를 관리하고 분석할 수 있게 해주는 완전 관리형 엔터프라이즈 데이터 웨어하우스 빅쿼리에 접속해서 새 프로젝트를 생성하고 프로젝트에 데이터셋을 추가해서 실습했다. 데이터셋을 추가했더니 실습에 사용할 수 있는 여러 테이블이 생겼다. 실제 데이터를 조회한 양만큼 과금이 되며 일정 수준까지는 무료인 시스템인데 강사님이 실습 과정에서 금액이 발생할 일은 없을 거라고 하셨다. 빅쿼리를 처음 사용해 봤는데, 지금까지 사용해봤던 Ora.. 2023. 1. 13.
[WEEK 4] 멋쟁이사자처럼 AI 스쿨 4주차 AI SCHOOL 8기 - 데이터 분석 트랙이 벌써 4주차가 되었다. 저번주까지는 파이썬에 대해 공부했고 이번주부터 정말 데이터 분석 관련 내용이 시작된것 같다. 지금 WIL을 작성하고 있긴 하지만.. 한 주에 월화수 3일 공부하고 목요일에 WIL 작성하고 다음날인 금요일에 다시 강의 듣는 이 구조가 음.. 효율적인지는 모르겠다. 아무튼 이번주 내용을 요약하자면 아래와 같다. 각 세부 사항은 TIL로 작성하였다. 먼저 pandas 기초에 대해 배웠다. DataFrame과 Series에 대한 이해부터, 데이터 타입 확인, 컬럼 다루기, 데이터 요약, 데이터 타입별 기술통계 값 확인, 파일로 저장하고 로드하는 방법 등의 내용이었다. DAY 11 TIL [DAY 11] pandas 기초 - DataFrame,.. 2023. 1. 12.
반응형