이번 3차 미니프로젝트는 머신러닝을 주제로 5일간 이루어졌습니다. 3일은 지도학습, 2일은 비지도학습과 관련되어 진행되었습니다.
저희 조 같은 경우에는 5일 중에서 3일차 그리고 마지막 5일차 때 대면으로 진행하였습니다.
[머신러닝 - 지도학습] 국민건강 증진을 위한 스마트워치 데이터 분석
DAY 01. [ 데이터 분석 ] 중요한 Feature 찾기
• 탐색적 데이터 분석 - 과제 이해하기 - 데이터 탐색하기
• 행동분류 Feature 분석 - Feature 별 행동패턴 분류 중요도 시각화 - 행동패턴 분류 중요도 상위 5개 Feature 선별
→ 데이터를 탐색적으로 분석하여 행동 분류에 영향도가 높은 상위 Feature를 도출
DAY 02. [ 모델 튜닝 ] 고성능 모델 만들기
• 다양한 모델 사용하기 - 머신러닝 분류 모델링 (SVM, KNN, Logistic Regression, GBM, XGBoost) - 최고의 성능 모델 찾아내기
• 모델 튜닝 - Hyperparameter Tuning (최상의 성능을 달성하는 파라미터를 찾고 이를 모델에 적용) - Feature Selection (중요도 상위 Feature 학습하기)
→ 여러가지 머신러닝 알고리즘을 사용하여 적절한 알고리즘을 선정하고 모델 튜닝을 통해 정확도를 개선
DAY 03. [ 모델 검증 ] 특정 행동 분류 결과 도출
• 모델 검증 - Train 데이터/Test 데이터 결과 비교 - 과대적합 해소
• 행동 추론 - 특정 행동 분류 모델링 - Real 데이터 행동 추론
→ Test 데이터를 활용하여 생성한 모델을 검증하고, 특정 행동분류에 대한 행동 추론을 실시
▶ 최종 목표 : 단말기 개발팀에서 의뢰한 스마트워치 데이터로특정 행동패턴을 분류할 수 있는 AI 모델을 만들고 데이터셋에서 행동 분류에 영향을 미치는 중요 feature를 선별
[머신러닝 - 비지도학습] 보험사 마케팅 활용을 위한 고객 군집화 모델
DAY 04. [ 데이터 분석 및 전처리 ]
• 탐색적 데이터 분석 - 미션 이해하기 - 데이터 탐색하기
• 데이터 전처리 - 데이터 전처리 진행 - 데이터 스케일링
→ 데이터에 대한 이해도 증가 및 전처리를 통한 모델 사전 처리
DAY 05. [ 모델 개발 및 마케팅 전략 수립 ]
• k means 활용한 모델 개발 - 군집 분석 모델 개발 (k means) - 프로파일링 (군집의 구조와 내용을 분석 하고 도메인 지식 및 업무 관점으로 추론 하고 추론한 것을 바탕으로 분석의 결과를 적용 가능하도록 하는 과정) - 군집별 특성 정의 마케팅 전략 수립
→ 군집 모델 개발 및 군집별 특성 정의 후 마케팅 전략 수립
▶ 최종 목표 : 파인애플 보험사의 일원이 되어 효율적인 마케팅 전략을 위해 (1) 데이터 기반 고객 군집화를 진행하고 (2) 군집화된 고객별 마케팅 전략 수립
# 3차 미니프로젝트 소감
이번 미니프로젝트를 통해 머신러닝에 대한 이해를 한층 더 높일 수 있었습니다 특히, 이전에 머신러닝 비지도 학습 부분 강의를 들었을 때, 이론은 대략적으로 이해했지만 실제로 어떻게 적용하는지에 대한 감이 부족했습니다. 이번 미프 통해 그래도 비지도 학습 중에서 클러스터링 부분에 있어서는 감을 잡을 수 있었던 좋은 시간이였습니다. 그리고 비지도 학습 부분은 데이터 분석과 더불어 마케팅 전략을 수립해야하는 부분도 있어 이전에 했던 미프들보다 조원들과 의견을 더 많이 주고 받으며 진행이 되었습니다.
머신러닝을 주제로 진행된 이번 미프 역시 쉽지 않았는데 그래도 정말 멋진 조원분들과 으쌰으쌰 함께 해서 잘 마무리 할 수 있었던 것 같습니다😄 (10조 최고👍❤️)
이번 3차 프로젝트 종료 후에는 반 회식이 있었습니다. 2D에서 3D가 되는 순간 ㅎㅎ 제가 속한 3반 같은 경우에는 미니프로젝트를 하며 대면할 수 있는 기회가 있지만, 4반과는 그럴 기회가 없었는데요, 이번 회식을 통해 4반 분들이랑도 소통할 수 있는 시간을 가져 좋았습니다. DX 트랙 수도권 3/4반 앞으로도 화이팅입니다! 😊❤️
2일차 때는 수업 종료 후 근처 노들섬에 가서 노을을 바라보며 치킨과 라면을 먹었습니다 ㅎㅎ 너무나도 행복하고 힐링되었던 하루🍀