1. 소개
예시
문제 : 손글씨로 쓰인 숫자를 인식해보자.
해결법 : 28X28 픽셀 이미지를 784개의 실수로 구성된 벡터로 표현 가능
그 후 벡터 x를 입력값으로 받으면 0~9 중 하나의 값으로 출력하는 기계를 만들어야 한다.
- 방법 1 : 직접 작성한 규칙, 휴리스틱 알고리즘을 통해 생성된 규칙으로 해결
- 한계 : 수 많은 규칙이 필요하고 예외 사항들에 대해 계속 수많은 룰을 만들어야한다.
- 방법 2 : 머신러닝을 사용한다.
- N개의 숫자들 {$X_1$, ..., $X_N$}을 trianing set으로 활용
- 정답은 미리 주어져서 target vector -> t로 표현 가능
- training을 통해 test에 대한 정답을 찾기
- 방법 1 : 직접 작성한 규칙, 휴리스틱 알고리즘을 통해 생성된 규칙으로 해결
머신러닝
학습의 결과물 : $y(x)$ ( 입력값 x를 받으면서 벡터 y를 출력)
- y(x)는 훈련단계에서 training set을 바탕으로 결정
- 그 다음 test set에 새로운 숫자 이미지들의 정체를 찾아내는데 활용
일반화(generalization) : 훈련 단계에서 사용되지 않았던 새로운 test set을 올바르게 분류하는 성능
전처리(preprocessed) : 입력 변수 -> 새로운 변수 (패턴 인식 문제를 더 쉽게 해결할 수 있다.)
- 이미지를 축소, 확대, 변환
- feature extraction(특징 추출)이라고도 한다.
- train에서 사용한 전처리는 test도 동일하게 적용해야한다.
- 계산 과정에서 속도를 높이기 위해서도 사용
- 실시간으로 얼굴을 확인해야하는 일이 있을 수 있는데 모든 데이터를 사용하기에는 픽셀의 계산량이 무척 많다.
- 얼굴과 얼굴이 아닌 것들을 구별하는 차별적인 정보를 가지고 있으면서 동시에 빠르게 계산 가능한 유용한 특징들만 찾아서 활용
- ex) 차원축소, cnn 등
- 전처리 과정에서 버리는 정보가 문제 해결에 중요한 정보였을 수도 있기 때문에 항상 주의해야한다. (필자는 이걸로 고생을 한 기억이..)
지도학습(supervised learning) : 정답이 있는 training set을 이용해 결과를 낸다.
- ex) 분류, 회귀
비지도학습(unsupervised learning) : 표적 벡터 없이 오직 입력 벡터 x로만 결과를 찾는다.(정답이 없는 training set을 이용) - ex) clustering, density estimation, visualization
- (필자는... 레이블을 넣는 과정이 상당히 귀찮고 어려워서 주로 비지도학습만을 사용해 온 경향이 있다.)
강화학습(reinforcement learning) : 주어진 상황에서 보상을 최대화하기 위한 행동을 찾는 문제를 푸는 방법 - 지도학습과는 달리 입력값과 최적의 출력값을 예시로 주지 않는다.
- 시행착오를 통해서 이들을 직접 찾아내게 된다.
- https://www.youtube.com/watch?v=nReMgotclXU 다음 영상에서는 볼링을 강화학습으로 어떻게 해결했는지 확인할수있다.
- 일반적으로 탐사와 이용간의 trade off 관계가있다.
- 탐사 : 시스템이 새로운 종류의 행동을 시도하여 각각이 얼마나 효과적인지 확인
- 이용 : 시스템이 높은 보상을 주는 것으로 알려진 행동을 시행
- 탐사는 새로운 행위를 계속 도전하는 반면 이용은 보수적인 방법으로 도전하기 때문에 당연히 trade-off
- 어느 하나에 너무 집중하면 안 좋아서 각각 잘 이용해야 한다.앞으로 여러가지 문제를 해결하는데 서로 다른 방법과 기술들이 필요하다.
그래서 확률론, 의사 결정 이론, 정보 이론에 대해 설명할 것이다.
후기
분명 다 아는 내용인데 한번 더 정리를 하니까 빠진 부분없이 잘 공부하는 것 같아서 좋다. 일단은 하루에 소단원 하나라도 올리는게 목표긴한데.... 화이팅!
'PRML > chap1' 카테고리의 다른 글
1.2.5 곡선 피팅 (0) | 2021.12.29 |
---|---|
1.2.4 가우시안 분포 (0) | 2021.12.29 |
1.2.3 베이지안 확률 (0) | 2021.12.27 |
1.2.2 기댓값과 공분산 (0) | 2021.12.27 |
1.1 예시_ 다항식 곡선 피팅 (0) | 2021.12.21 |