혼자 공부하는 머신러닝+딥러닝 / 박해선 저 검증세트 - 기존처럼 데이터를 triain set과 test set으로만 분할해서 활용하면, 내가 구축한 모델이 과대적합인지 과소적합인지 판단하기 어려움. - 이 때 테스트 세트를 활용하지 않고 내 모델을 평가하기 위해 별도로 검증세트를 두는 개념임. - 일반적으로 전체 100의 데이터 중 훈련 세트를 약 60%, 검증과 테스트 세트를 각 20%씩으로 분할해서 활용. 1. 검증세트의 개념 직접 만들어보기 import pandas as pd import numpy as np wine = pd.read_csv('https://bit.ly/wine_csv_data') data = wine[['alcohol', 'sugar', 'pH']].to_numpy() targ..
왜인지 링크가 날아가서 다시 수정함. 코딩 시에 맨 윗줄에 # -*- coding: utf-8 -*- 를 입력하는 경우를 많이 볼 수 있는데, 내 주변의 생각보다 많은 사람들이 이것이 코드 자체를 UTF-8로 변환하여 한글 폰트를 깨지지 않게 해 주는것이라고 알고있더라. 내가보기엔 그냥 아무리봐도 그저 주석일 뿐이었는데, 도저히 이해가 안되어 좀 더 확실히 찾아 본 결과는 아래와 같다. 과거, 주로 파이썬2를 사용할 때에는 기본 인코딩이 ascii였기 때문에 한글로 코딩을 하게되는 경우 폰트가 깨지게되었고, 이를 명시하기 위해 코드 맨 윗줄에 '이 코드는 ascii로 표현되지 않는 한글을 포함하고 있으므로 UTF-8로 인코딩 해서 읽을 것' 이라는 일종의 알림 메시지를 작성한 것이고, 파이썬 3부터는 기..