Recent posts

(Matplotlib) DateFormatter 사용하여 날짜 포맷팅하기

1 minute read

DateFormatter 사용하여 날짜 포맷팅하기 Matplotlib. Seaborn으로 x축이 datetime 타입인 시계열 그래프를 그릴때, 원하는 날짜 포맷으로 표기하기 위해서는 추가 작업이 필요하다. 이때 DateFormatter을 사용하여 날짜를 포맷팅하는 방법을 알...

PyCaret - AutoML 라이브러리

2 minute read

PyCaret PyCaret은 적은 코드로 머신러닝 워크 플로우를 자동화하는 오픈 소스 라이브러리입니다. 머신러닝 모델 개발시 많은 시간을 소요했던 코딩, 전처리, 모델 선택, 파라미터 튜닝 작업을 자동화해주어 쉽고, 높은 생산성의 작업을 가능하게 합니다. 공식 사이트에서 ...

(ML) 분류의 성능 평가

1 minute read

[ML] 분류의 성능 평가 머신러닝의 분류 기법의 성능을 평가하는 다양한 지표를 공부해보자 정확도(Accuracy score) 정확도는 실제 데이터와 예측 데이터가 얼마나 같은지를 나타내는 지표이다. Code (sklearn) from skle...

(ML) 데이터 전처리

3 minute read

데이터 전처리란 수집한 데이터를 분석에 적합한 형태로 만드는 과정입니다. 머신러닝 알고리즘의 학습 결과는 데이터의 품질이 결정하기에, 데이터를 올바르게 가공하는 작업은 대단히 중요합니다. 1. 누락 데이터 처리 누락 데이터는 NaN (Not a Number) 로 표시됩니다. 누...

(ML) 데이터 인코딩

2 minute read

컴퓨터에서 인코딩이란, 사람이 인지할 수 있는 형태의 데이터를 약속된 규칙에 의해 컴퓨터가 이해할 수 있는 0과 1로 변환하는 과정입니다. 즉 데이터 인코딩은 머신러닝 알고리즘에서 사용가능하도록 데이터를 변환하는 것입니다. 사이킷런 머신러닝 알고리즘은 문자열 값을 입력 값으로 허...