ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [KT 에이블스쿨 4기 DX트랙] 데이터 분석 후기
    KT 에이블스쿨/학습내용 2023. 9. 10. 16:19

     

    # 데이터 분석이란?

     

    수집된 데이터를 조사하고 해석하여 유용한 정보와 인사이트를 추출하는 과정

     

     

    # 데이터 분석 과정 목표

     

    1. 분석/모델링을 위한 데이터 구조 이해

    2. 정보의 종류(숫자, 범주)에 따라 데이터의 분포 확인비즈니스 파악

    3. 두 정보를 분석할 때, 적절한 도구를 사용하여 관계 파악

     

     

    # 학습 내용

     

    ▶ 데이터 분석 방법론 (CRISP-DM)

     

    CRISP-DM 분석 절차

     

    CRISP-DM

    : 데이터 마이닝 및 머신 러닝 프로젝트를 계획하고 실행하기 위한 프로세스 프레임워크

     

     

    1. 업무 이해 (Business Understanding) 무엇이 문제인가?

    - 프로젝트의 목적과 비즈니스 요구 사항을 이해하고 문제를 정의

    - 어떤 정보를 얻고자 하는지 이해하고 비즈니스 목표 설정

     

    2. 데이터 이해 (Data Understanding)

    - 사용 가능한 데이터 수집, 데이터 품질 평가, 데이터의 특성과 구조 이해

    - 데이터를 탐색 및 분석하여 문제 해결에 필요한 정보 도출

     

    3. 데이터 준비 (Data Preparation)

    - 모델링을 위한 데이터 구조 만들기

    - 결측치 조치, 가변수화, 스케일링, 데이터 분할

     

    4. 모델링 (Modeling)

    - 다양한 알고리즘을 시도하고 최적의 모델을 선택

    - 모델을 학습하고 평가하여 문제 해결을 위한 최상의 예측 모델 생성

     

    5. 평가 (Evaluation) 문제가 해결되었는가?

    - 기술적 관점 평가 (모델을 테스트 데이터에 적용하고 예측 성능을 측정)

    - 비즈니스적 관점 평가 (비즈니스 목표를 충족하는지 확인)

     

    6. 전개/배포 (Deployment)

    - 시스템 유효성 검사 : 배포된 모델과 고객 요구사항을 충족하는지 확인

    - 프로젝트 이전 : 운영환경으로 배포

    - 데이터 수집부터 모델 배포 관리까지 파이프라인으로 구성

     

     

     개별 변수 분석 (단별량 분석) 

     

     

     두 변수의 관계분석 (이변량 분석)

     

     

     

    # 학습 소감

     

    데이터 분석 시간을 통해 정보의 종류(숫자, 범주)에 따라 적절한 도구를 사용하여 시각화와 수치화를 해보았습니다.

    시각화와 수치화에 있어 등장하는 도구들이 많아서 참 헷갈렸습니다😂 (사실 아직도 헷갈려요🤣)

    그래도 이를 통해 데이터의 특성을 눈으로 직접 확인하고 이해할 수 있어서 매우 유용했고,

    도출된 결과를 통해 비즈니스 관점에서 생각해보는 시간을 가져 흥미로웠습니다.

Designed by Tistory.