본문 바로가기

머신러닝과 딥러닝/실습5

TensorFlow로 Logistic Classification의 구현 및 당뇨병 예측 실습 import tensorflow as tf # 선형 회귀를 위해서 텐서 플로우 1의 코드 실행을 위한 임포트 # 현재는 텐서 플로우 2로 선형 회귀를 훨씬 간단하게 구현할 수 있다. import tensorflow.compat.v1 as tf tf.disable_v2_behavior() x_data = [[1,2],[2,3],[3,1],[4,3],[5,3],[6,2]] y_data = [[0],[0],[0],[1],[1],[1]] # 0은 fail, 1은 pass X = tf.placeholder(tf.float32, shape=[None, 2]) Y = tf.placeholder(tf.float32, shape=[None, 1]) W = tf.Variable(tf.random_normal([2,1]),.. 2020. 2. 13.
TensorFlow로 파일에서 데이터 읽어오기 실습 파일 자료 https://github.com/hunkim/DeepLearningZeroToAll 데이터가 많아지면, 소스 코드에 일일이 써놓기가 힘들어진다. 그래서 이제는 콤마로 나눠진 텍스트 파일을 읽어와서 실습을 해볼 것이다. 간단하게 numpy의 loadtxt를 이용해보자. import numpy as np xy = np.loadtxt('data-01-test-score.csv', delimiter=',', dtype=np.float32) x_data = xy[:, 0:-1] y_data = xy[:, [-1]] # Make sure the shape and data are OK print(x_data.shape, x_data, len(x_data)) print(y_data.shape, y_d.. 2020. 2. 11.
TensorFlow로 Multi-variable Linear Regression 실습 import tensorflow as tf import matplotlib.pyplot as plt # 선형 회귀를 위해서 텐서 플로우 1의 코드 실행을 위한 임포트 # 현재는 텐서 플로우 2로 선형 회귀를 훨씬 간단하게 구현할 수 있다. import tensorflow.compat.v1 as tf tf.disable_v2_behavior() # H(x1, x2, x3) = x1w1 + x2w2 + x3w3 #x1, x2, x3은 feature들 x1_data = [73, 93, 89, 96, 73] x2_data = [80, 88, 91, 98, 66] x3_data = [75, 93, 90, 100, 70] y_data = [152, 185, 180, 196, 142] x1 = tf.placehold.. 2020. 2. 11.
TensorFlow로 Linear Regression 실습 * 김성훈 교수님의 유튜브강의를 공부 목적으로 정리하여 작성하였습니다. 실제 주어진 y값과 H(x)인 예측값을 얼마나 잘 예측했느냐의 cost 함수를 구할 것이다. 학습을 한다는 이야기는 W, b를 조정해서 가장 작은 cost값을 찾아나간다는 말이다. # TensonFlow Mechanics step-1) 그래프를 build 한다. step-2) sess를 통해 실행을 한다. step-3) 변수들을 반복적으로 조정하여 가장 작은 cost를 찾는다. step-1) X, Y에 대한 데이터가 주어졌다고 가정하고, 이제 W과 b를 정의해야 되는데 Variable이라는 노드로 정의할 수 있다. 여기서 Variable 개념은 프로그래밍에서의 변수의 의미와는 조금 다르다. Tensorflow가 사용하는 Variabl.. 2020. 2. 6.
장르 유사도 기반 영화 추천 시스템 / Scikit-Learn의 문제점 * 코사인 유사도 개념을 이용하여, 장르가 유사한 영화를 추천해주는 시스템을 만들어보았습니다. [ 데이터 전처리와 벡터화 ] 1) 영화 데이터셋은 https://www.kaggle.com/tmdb/tmdb-movie-metadata 사용 2) 각 장르를 feature 벡터화 한 후, 형렬로 만든 다음 행렬 데이터로 코사인 유사도로 계산 -> 코사인 유사도가 1에 가까울수록 두 영화 간의 장르가 비슷하다고 할 수 있습니다. 3) 데이터 전처리 과정 중 Scikit-Learn의 문서 전처리용 클래스인 CountVectorizer 문제점 발견 -> 이를 순수 파이썬 코드를 작성하여 비교해보았습니다. import pandas as pd import numpy as np from sklearn.metrics.pa.. 2020. 1. 28.