y=wx+b
비선형
회귀 : 지도학습 알고리즘
선형회귀 : x에 대응되는 실수 y들이 주어지고 추정치 f(x)가 가진 오차를 측정
숨겨진 관계를 표현하고 약품 투입량과 같은 독립 변수에 대해 오염도라는 종속 변수가 어떤 값을 가질지 예측하는 fa(x)와 fb(x)를 가설이라고 부름
좋은 가설은 오차가 작은 가설
데이터에 제시된 목표값을 레이블이라고 부름
이진 분류 : 데이터를 양분하는 경계 직선 혹은 곡선을 찾는 것
특징 : 관찰되는 현상에서 측정할 수 있는 개별적인 속성을 의미
기계학습 특징 예
사람의 키와 몸무게
개의 몸통길이와 높이
주택 가격에 영향을 주는 주택의 특징
특징에 대한 분석이 선행되어야 기계학습이 효과적으로 이루어짐
연쇄법칙 : 매개변수를 통해서 연결이 되는 구조
좋은 가설이라면 데이터가 직선들 근처에 있을 것
에타(학습률)는 0~1사이의 값을 사용
0.01정도의 작은값을 사용
mean_squared_error() 함수를 사용하여 오차를 계산
learning_rate라는 하이퍼 파라미터로 제어
learning_rate = 0.001(느린수렴)
0.05 (발산으로 학습 실패)
scikit-learn을 통해 선형회귀를 구현
fit() 메소드를 통해 수렴과정을 자동화
정규 방정식을 푸는 것은 넘파이의 선형대수 서브 모듈인 linalg를 이용
이 행렬의 각 원소는 m차원 벡터를 내적하여 얻을 수 있고, 벡터화 연산을 통해 효율적으로 처리
매우 많은 입력에 대해서 나쁜성능을 보일 수 있음
사이킷런의 model_selection서브 모듈에 있는 train_test_split()이라는 함수를 이용하여 X,y에 담긴 데이터 가운데 80훈련
20 검증으로 나눔
'Tech Stack > Machine learning' 카테고리의 다른 글
기계학습 6 - 역전파 공부 (0) | 2024.01.08 |
---|---|
기계학습 - 5 다항회귀, 지니 불순도, SVM (3) | 2024.01.02 |
기계학습 4 - predict, 분류, 등 (1) | 2024.01.01 |
기계학습 - 3 (0) | 2023.12.27 |
기계학습 - 1 (1) | 2023.12.26 |