-
[KT 에이블스쿨 4기 DX트랙] 데이터 분석 후기KT 에이블스쿨/학습내용 2023. 9. 10. 16:19
# 데이터 분석이란?
수집된 데이터를 조사하고 해석하여 유용한 정보와 인사이트를 추출하는 과정
# 데이터 분석 과정 목표
1. 분석/모델링을 위한 데이터 구조 이해
2. 정보의 종류(숫자, 범주)에 따라 데이터의 분포 확인 및 비즈니스 파악
3. 두 정보를 분석할 때, 적절한 도구를 사용하여 관계 파악
# 학습 내용
▶ 데이터 분석 방법론 (CRISP-DM)
CRISP-DM 분석 절차 CRISP-DM
: 데이터 마이닝 및 머신 러닝 프로젝트를 계획하고 실행하기 위한 프로세스 프레임워크
1. 업무 이해 (Business Understanding) 무엇이 문제인가?
- 프로젝트의 목적과 비즈니스 요구 사항을 이해하고 문제를 정의
- 어떤 정보를 얻고자 하는지 이해하고 비즈니스 목표 설정
2. 데이터 이해 (Data Understanding)
- 사용 가능한 데이터 수집, 데이터 품질 평가, 데이터의 특성과 구조 이해
- 데이터를 탐색 및 분석하여 문제 해결에 필요한 정보 도출
3. 데이터 준비 (Data Preparation)
- 모델링을 위한 데이터 구조 만들기
- 결측치 조치, 가변수화, 스케일링, 데이터 분할
4. 모델링 (Modeling)
- 다양한 알고리즘을 시도하고 최적의 모델을 선택
- 모델을 학습하고 평가하여 문제 해결을 위한 최상의 예측 모델 생성
5. 평가 (Evaluation) 문제가 해결되었는가?
- 기술적 관점 평가 (모델을 테스트 데이터에 적용하고 예측 성능을 측정)
- 비즈니스적 관점 평가 (비즈니스 목표를 충족하는지 확인)
6. 전개/배포 (Deployment)
- 시스템 유효성 검사 : 배포된 모델과 고객 요구사항을 충족하는지 확인
- 프로젝트 이전 : 운영환경으로 배포
- 데이터 수집부터 모델 배포 관리까지 파이프라인으로 구성
▶ 개별 변수 분석 (단별량 분석)
▶ 두 변수의 관계분석 (이변량 분석)
# 학습 소감
데이터 분석 시간을 통해 정보의 종류(숫자, 범주)에 따라 적절한 도구를 사용하여 시각화와 수치화를 해보았습니다.
시각화와 수치화에 있어 등장하는 도구들이 많아서 참 헷갈렸습니다😂 (사실 아직도 헷갈려요🤣)
그래도 이를 통해 데이터의 특성을 눈으로 직접 확인하고 이해할 수 있어서 매우 유용했고,
도출된 결과를 통해 비즈니스 관점에서 생각해보는 시간을 가져 흥미로웠습니다.
'KT 에이블스쿨 > 학습내용' 카테고리의 다른 글
[KT 에이블스쿨 4기 DX트랙] 머신러닝 (비지도 학습) 후기 (0) 2023.09.20 [KT 에이블스쿨 4기 DX트랙] 머신러닝 (지도학습) 후기 (0) 2023.09.16 [KT 에이블스쿨 4기 DX트랙] 데이터 수집 후기 (0) 2023.09.10 [KT 에이블스쿨 4기 DX트랙] 데이터 다듬기 후기 (0) 2023.08.26 [KT 에이블스쿨 4기 DX트랙] 데이터 다루기 후기 (0) 2023.08.26