-
[KT 에이블스쿨 4기 DX트랙] 머신러닝 (비지도 학습) 후기KT 에이블스쿨/학습내용 2023. 9. 20. 17:41
# 머신러닝 (비지도 학습) 이란?
지난번 머신러닝 (지도 학습) 부분에 이어서 이번에는 머신러닝 (비지도 학습) 부분을 배웠습니다.
지도 학습은 '정답을 찾아라!' 라는 관점이라면
비지도 학습은 '유사한 데이터 끼리 묶어라~' 라는 관점입니다.
◾머신러닝 - 학습방법에 따른 분류
지도 학습 정답이 있는 데이터를 활용해 데이터를 학습시키는 것 비지도 학습 정답이 없는 데이터 만으로 배우게 하는 학습 방법 강화 학습 선택한 결과에 대해 보상을 받아 행동을 개선하면서 배우게 하는 학습 방법 # 학습 내용
1. 차원축소
설명 차원 축소는 고차원 데이터의 특성을 낮은 차원으로 축소하여 데이터를 더 간결하게 표현하는 기술 종류 주성분 분석 PCA - 데이터 분산을 최대한 유지하며 축소하는 선형 차원 축소 알고리즘
- 차원의 수 : feature 수 만큼
- 활용 : 지도학습에 연계t-SNE - 고차원 데이터를 저차원(주로 2차원 또는 3차원)으로 투영하여 데이터의 구조를 시각화하는 데 사용되는 비선형 차원 축소 알고리즘
- 차원의 수 : 2~3차원
- 활용 : 주로 데이터 시각화에 활용
2. 클러스터링
설명 - 유사한 데이터 포인트를 그룹으로 묶는 비지도 학습 기술
- 데이터를 그룹화하여 패턴을 발견하고 분류하는 데 사용종류 K-means - 주어진 데이터를 사용자가 정한 클러스터 개수(k)로 나누는 알고리즘
- K개의 평균으로부터 거리를 계산하고, 가까운 평균으로 묶어 클러스터를 나누는 방식DBSCAN - 데이터 포인트의 밀도에 기반하여 클러스터를 형성하는 알고리즘
- 지정된 반경 내 최소포인트수가 존재하는지 확인하여 군집 형성
3. 이상탐지
설명 - 일반적인 값과 다른 특이한 값이나 드문 사건을 탐지하는 기법
- 비정상적인 데이터를 식별하여 시스템의 오류, 사기 행위, 잠재적인 문제를 감지하거나 예방하는 데 사용종류 Isolation Forest Isolation Tree를 생성하여 각 Tree의 Depth를 측정하여 이상치를 식별하고, 이를 여러 트리에서 결합하여 최종적으로 이상치를 탐지
- Normal 데이터일수록 많은 split이 요구되며 depth가 깊어짐
- Abnormal 데이터일수록 적은 split이 요구되며 depth가 얕아짐One-Class SVM 주어진 데이터에 대한 '하나의 클래스'를 학습하고, 그 클래스에서 벗어나는 데이터를 이상치로 간주하는 알고리즘 # 학습 소감
머신러닝 참 쉽지 않았습니다..ㅎ허 😂
정말 복습이 꼭 필요하더라구요
그래도 천천히 복습하면서 대략적인 이론은 이해를 하였으나,
실제 데이터 속에서 어떻게 구현되는건지는 감이 제대로 안잡히더라구요.
머신러닝 관련 실습을 많이 해봐야할 것 같다는 생각이 들었습니다.
이제 이번에 배운 머신러닝 내용을 기반으로 무려 5일간의 미니프로젝트를 진행하게됩니다.
3차 미니프로젝트도 화이팅~!
'KT 에이블스쿨 > 학습내용' 카테고리의 다른 글
[KT 에이블스쿨 4기 DX트랙] 언어&시각지능 후기 (2) 2023.10.30 [KT 에이블스쿨 4기 DX트랙] 딥러닝 후기 (0) 2023.10.06 [KT 에이블스쿨 4기 DX트랙] 머신러닝 (지도학습) 후기 (0) 2023.09.16 [KT 에이블스쿨 4기 DX트랙] 데이터 수집 후기 (0) 2023.09.10 [KT 에이블스쿨 4기 DX트랙] 데이터 분석 후기 (0) 2023.09.10