knn.predict
confusion matrix
혼동행렬
만약 데이터가 편향데이터라면 우수한 머신러닝 알고리즘을 사용할 지라도 99퍼 정확도 가지는 분류기는 매우 구현이 어려움
정밀도 , 재현율
혼동행렬
재현율, 정밀도 개념 확보
정밀도 진짜맞는지
재현율 진짜 아닌지
앙상블 머신러닝의 집단지성
서로다른 모델로 각각의 분류기를 만들기
서로다른 학습데이터를 통해 다양성을 확보
확률 통계에서는 복원추출 비복원 추출
배깅기법 개선 부스팅 기법
군집화. 유유상종
초깃값 지정 중요
k=3 이면 원을 그렸을 때 3개가 포함되면 그걸로 예측
kmeans
평균값 초깃값
초기평균값에 따라 성능이 달라짐
art계열은 그 문제를 해결하긴 함
다항회귀
선형회귀
f(x) is linear
비선형으로 다양화를 시켜야 함.
다변량은 특징이 여러개
polynomialFeatures클래스 사용
차수를 지정하고 다항회구에 필요한 형태로 변환 - 다항특징변환
degree = 2
[a, b] --> 트랜스포머 해줌
standard스케일로 학습시키고 변환 시켜줌
다항회귀 문제
과적합, 폭발적인 복잡도 증가
과적합은 사용된 데이터에 좋은성능 but 새로운데이터에서는 성능이 좋지 않음
과소적합은 훈련이 되어있지 않음
typical example을 잘 못 해서 특이한것만 뽑아서 훈련시켰을 경우
결정 경계선이 잘 못 형성 함
error 발생
'Tech Stack > Machine learning' 카테고리의 다른 글
기계학습 6 - 역전파 공부 (0) | 2024.01.08 |
---|---|
기계학습 - 5 다항회귀, 지니 불순도, SVM (3) | 2024.01.02 |
기계학습 - 3 (0) | 2023.12.27 |
기계학습 - 2 (1) | 2023.12.27 |
기계학습 - 1 (1) | 2023.12.26 |