ML

1.2.4 비지도학습

math_tbro 2022. 1. 3. 00:32

비지도학습은 정답 혹은 레이블이 주어지지 않은 상태에서의 학습 방법.

군집화(clstering)

  • 데이터를 분류하기 위한 명확한 기준이 존재하지 않은 상태에서 특징이 유사한 데이터끼리 묶어 여러 개의 군집으로 나누는 방법
  • 군집의 개수는 사전의 정의하거나 군집 정도를 나타내는 지표(Dunn Index, Silhouette)등을 이용할 수 있다.
  • 군집 내 응집도 최대화 : 동일한 군집에 소속된 개체들은 서로 유사할수록 좋음
  • 군집 간 분리도 최대화 : 상이한 군집에 소속된 개체들은 서로 다를수록 좋음
  • 대표적인 방법론 : k-Means Clustering, Hierarchical Clustering, Density-Based Spatial Clustering of Application with Noise(DBSCAN)

차원축소(Dimensionality Reduction)

  • 차원이 높아질수록 학습데이터수가 차원의 수보다 적어서 성능이 저하될 때 차원의 저주에 걸렸다고 한다.
  • 부가설명을 하면 관측치는 200개인데 변수가 600개이면 좋은 성능을 가질수 없게된다.
  • 차원의 저주 해결법
    • 변수 선택 : 갖고 있던 변수 중 일부만 선택해서 사용
    • 변수 추출 : 변수를 조합해서 새로운 변수로 재창조
  • 대표적인 방법론 : PCA, MDS, LLE, t-SNE 등이 있고 다음 내용은 차차 알아보도록하겠다.

'ML' 카테고리의 다른 글

1.2.6 성능 지표  (0) 2022.01.03
1.2.5 과적합과 모델 학습법  (0) 2022.01.03
1.2 머신러닝(Machine Learning)  (0) 2022.01.02