본문 바로가기

딥러닝6

[DAY 80] Bidirectional RNN을 통해 삼성전자 주가 예측하기 RNN 모델을 사용하여 삼성전자 주가 데이터를 예측하고 실제와 비교했다. 먼저 RNN과 Sequence 데이터의 개념을 이해했다. RNN(Recurrent Neural Network, 순환신경망) 인공신경망의 한 종류로, 유닛 간의 연결이 순환적 구조를 갖는다. 결과값을 출력층 방향으로 보내면서 다시 은닉층 노드의 다음 계산의 입력으로도 보내는 특징 다양한 길이의 입력 시퀀스를 처리할 수 있는 인공신경망 시퀀스 데이터(순서가 중요한 데이터)를 처리할 때 강력 은닉층이 입력층과 이전 타임스텝의 은닉층으로부터 정보를 받는다. 타임스텝(timesteps)은 시점의 수를 의미하며 입력 시퀀스의 길이라고 표현하기도 한다. Sequence Data(시퀀스 데이터) 연관된, 연속의 데이터로 순서(과거)의 영향을 받는.. 2023. 4. 19.
[DAY 79] CNN과 날씨 이미지를 활용한 멀티클래스 분류 CNN과 날씨 이미지를 사용하여 다중 분류를 했다. 결과적으로 5개 종류의 날씨 이미지 30장 중 21장을 정확히 예측했다. 이미지 미리 보기 cloudy, foggy, rainy, shine, sunrise 총 5개 종류의 날씨 이미지가 있으며 alien_test는 예측할 이미지다. 각 날씨의 이름으로 된 폴더에 저장되어 있는 이미지를 하나씩 가져와서 확인해 봤다. 이미지 데이터셋 만들기 이미지를 array 형태로 만드는 것은 복잡하다. def img_read_resize(img_path): "이미지 읽기, 채널 변경, resize" img = cv2.imread(img_path) img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) img = cv2.resize(img, (12.. 2023. 4. 18.
[DAY 78] CNN과 이미지 데이터를 활용한 말라리아 감염 여부 이진 분류 예측 CNN 모델과 혈액 도말 이미지를 활용해서 말라리아 감염 여부를 예측했다. CNN 관련 용어를 이해하고 네트워크 구조를 코드로 작성했다. 라이브러리 로드 import numpy as np import pandas as pd import matplotlib.pyplot as plt 수치 연산, 데이터 핸들링, 시각화 라이브러리 로드 import tensorflow as tf from tensorflow.keras import Sequential from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dropout, Flatten, Dense from tensorflow.keras.callbacks import EarlyStopping 모델 구성, 학습에 필요.. 2023. 4. 17.
[DAY 75] PyTorch를 활용한 자동차 연비 회귀 예측 PyTorch를 활용하여 자동차 연비 회귀 예측을 했다. 어제 같은 데이터셋으로 Tensorflow를 활용한 것과 비교하며 동작 과정을 이해해 봤다. 데이터 준비 train = pd.read_csv('train.csv.zip', index_col="ID") test = pd.read_csv('test.csv.zip', index_col="ID") train.shape, test.shape # 실행 결과 ((4209, 377), (4209, 376)) pandas를 사용하여 train set, test set을 로드. categorical_feature = train.select_dtypes(include="object").columns train[categorical_feature] = train[cat.. 2023. 4. 12.
[DAY 74] Tensorflow를 활용한 자동차 연비 회귀 예측 Tensorflow를 활용하여 자동차 연비 회귀 예측을 했다. Kaggle의 Mercedes-Benz Greener Manufacturing 데이터를 사용하며 딥러닝 동작 과정을 이해해 봤다. 데이터 준비 데이터 로드 pandas를 이용하여 train set, test set을 로드했다. train = pd.read_csv('train.csv.zip', index_col="ID") test = pd.read_csv('test.csv.zip', index_col="ID") train.shape, test.shape # 실행 결과 ((4209, 377), (4209, 376)) Mercedes-Benz Greener Manufacturing 데이터는 학습용, 예측용 데이터 비율이 1:1이다. 타깃은 연비 값.. 2023. 4. 11.