ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [KT 에이블스쿨 4기 DX트랙] 머신러닝 (비지도 학습) 후기
    KT 에이블스쿨/학습내용 2023. 9. 20. 17:41

     

    # 머신러닝 (비지도 학습) 이란?

     

    지난번 머신러닝 (지도 학습) 부분에 이어서 이번에는 머신러닝 (비지도 학습) 부분을 배웠습니다.

     

    지도 학습은 '정답을 찾아라!' 라는 관점이라면

    비지도 학습은 '유사한 데이터 끼리 묶어라~' 라는 관점입니다.

     

     

    ◾머신러닝 - 학습방법에 따른 분류

     

    지도 학습 정답이 있는 데이터를 활용해 데이터를 학습시키는 것
    비지도 학습 정답이 없는 데이터 만으로 배우게 하는 학습 방법
    강화 학습 선택한 결과에 대해 보상을 받아 행동을 개선하면서 배우게 하는 학습 방법

     

    # 학습 내용

     

    1. 차원축소

    설명 차원 축소는 고차원 데이터의 특성을 낮은 차원으로 축소하여 데이터를 더 간결하게 표현하는 기술
    종류 주성분 분석 PCA - 데이터 분산을 최대한 유지하며 축소하는 선형 차원 축소 알고리즘
    - 차원의 수 : feature 수 만큼
    - 활용 : 지도학습에 연계
    t-SNE - 고차원 데이터를 저차원(주로 2차원 또는 3차원)으로 투영하여 데이터의 구조를 시각화하는 데 사용되는 비선형 차원 축소 알고리즘
    - 차원의 수 : 2~3차원
    - 활용 : 주로 데이터 시각화에 활용

    2. 클러스터링

    설명 - 유사한 데이터 포인트를 그룹으로 묶는 비지도 학습 기술
    - 데이터를 그룹화하여 패턴을 발견하고 분류하는 데 사용
    종류 K-means - 주어진 데이터를 사용자가 정한 클러스터 개수(k)로 나누는 알고리즘
    - K개의 평균으로부터 거리를 계산하고, 가까운 평균으로 묶어 클러스터를 나누는 방식
    DBSCAN - 데이터 포인트의 밀도에 기반하여 클러스터를 형성하는 알고리즘
    - 지정된 반경 내 최소포인트수가 존재하는지 확인하여 군집 형성

    3. 이상탐지

    설명 - 일반적인 값과 다른 특이한 값이나 드문 사건을 탐지하는 기법
    - 비정상적인 데이터를 식별하여 시스템의 오류, 사기 행위, 잠재적인 문제를 감지하거나 예방하는 데 사용
    종류 Isolation Forest Isolation Tree를 생성하여 각 Tree의 Depth를 측정하여 이상치를 식별하고, 이를 여러 트리에서 결합하여 최종적으로 이상치를 탐지
    - Normal 데이터일수록 많은 split이 요구되며 depth가 깊어짐
    - Abnormal 데이터일수록 적은 split이 요구되며 depth가 얕아짐
    One-Class SVM 주어진 데이터에 대한 '하나의 클래스'를 학습하고, 그 클래스에서 벗어나는 데이터를 이상치로 간주하는 알고리즘

     

     

    # 학습 소감

     

    머신러닝 참 쉽지 않았습니다..ㅎ허 😂

    정말 복습이 꼭 필요하더라구요

    그래도 천천히 복습하면서 대략적인 이론은 이해를 하였으나,

    실제 데이터 속에서 어떻게 구현되는건지는 감이 제대로 안잡히더라구요.

    머신러닝 관련 실습을 많이 해봐야할 것 같다는 생각이 들었습니다.

     

    이제 이번에 배운 머신러닝 내용을 기반으로 무려 5일간의 미니프로젝트를 진행하게됩니다.

    3차 미니프로젝트도 화이팅~!

Designed by Tistory.