전체 글

나라 지키던 개발자
Data

검증세트 활용방법 - 교차 검증

혼자 공부하는 머신러닝+딥러닝 / 박해선 저 검증세트 - 기존처럼 데이터를 triain set과 test set으로만 분할해서 활용하면, 내가 구축한 모델이 과대적합인지 과소적합인지 판단하기 어려움. - 이 때 테스트 세트를 활용하지 않고 내 모델을 평가하기 위해 별도로 검증세트를 두는 개념임. - 일반적으로 전체 100의 데이터 중 훈련 세트를 약 60%, 검증과 테스트 세트를 각 20%씩으로 분할해서 활용. 1. 검증세트의 개념 직접 만들어보기 import pandas as pd import numpy as np wine = pd.read_csv('https://bit.ly/wine_csv_data') data = wine[['alcohol', 'sugar', 'pH']].to_numpy() targ..

Tools/Git

git 지우고 다시 설정하기

출처 : velog.io/@hwang-eunji/github-%ED%8C%8C%EC%9D%BC-%EB%AA%A8%EB%91%90-%EC%82%AD%EC%A0%9C-%ED%9B%84-%EC%B4%88%EA%B8%B0-%EC%83%81%ED%83%9C%EB%A1%9C-%EB%90%98%EB%8F%8C%EB%A6%AC%EA%B8%B0 .git 지우기 rm -rf .git 프로젝트 폴더로 이동한 뒤 명령어를 통해 .git 파일을 지우면 git commit history가 삭제된다. 히스토리가 지워진다고 해서 프로젝트디렉토리의 파일내용이 변경/삭제되지 않는다. 혹시나 싶으면 테스트해보고 쓰도록 하자! git init git init git add . git commit -m 'initial commit' git ..

Languages/Python

%matplotlib inline 의 의미

%matplotlib inline jupyter notebook 에서 위 문장의 의미는 Rich output(그림, 소리, 애니메이션 등의 결과물)을 창 내부에 출력하도록 하는 것. 별도 창으로 뜨게 하고싶다면 %matplotlib tk 활용할 것.

Languages/Python

코드 맨 윗줄 # -*- coding: utf-8 -*- 의 이유

왜인지 링크가 날아가서 다시 수정함. 코딩 시에 맨 윗줄에 # -*- coding: utf-8 -*- 를 입력하는 경우를 많이 볼 수 있는데, 내 주변의 생각보다 많은 사람들이 이것이 코드 자체를 UTF-8로 변환하여 한글 폰트를 깨지지 않게 해 주는것이라고 알고있더라. 내가보기엔 그냥 아무리봐도 그저 주석일 뿐이었는데, 도저히 이해가 안되어 좀 더 확실히 찾아 본 결과는 아래와 같다. 과거, 주로 파이썬2를 사용할 때에는 기본 인코딩이 ascii였기 때문에 한글로 코딩을 하게되는 경우 폰트가 깨지게되었고, 이를 명시하기 위해 코드 맨 윗줄에 '이 코드는 ascii로 표현되지 않는 한글을 포함하고 있으므로 UTF-8로 인코딩 해서 읽을 것' 이라는 일종의 알림 메시지를 작성한 것이고, 파이썬 3부터는 기..

HC-Kang
HC-kang