-
[KT 에이블스쿨 4기 DX트랙] 데이터 다듬기 후기KT 에이블스쿨/학습내용 2023. 8. 26. 19:40
'데이터 다루기' 이후 5일간 '데이터 다듬기'를 주제로 강의를 수강하였습니다.
# 데이터 다듬기란?
데이터 다듬기란, 초기에 수집한 데이터를 깔끔하게 만드는 작업입니다.
이 과정에서 데이터를 정제하고 조작하여 불필요한 정보를 제거하거나 결측치를 처리하는 등의 작업을 수행합니다.
실제 데이터 분석을 시작하기 전에 필수적으로 수행되어야 하는 단계이며, 데이터 다듬기 과정은 데이터의 품질을 향상시키고 분석 결과의 신뢰성을 높이는 역할을 한다고 합니다.
# 학습 내용
5일간의 데이터 다듬기 과정에서 아래 내용을 학습하였습니다.
1. 데이터 프레임 생성
엑셀처럼 열과 행으로 이루어진 표 같은 데이터 프레임을 Pandas를 사용하여 CSV 파일, 엑셀 파일 등에서 데이터를 읽어와 생성합니다.
2. 데이터프레임 탐색
데이터 프레임에 어떤 정보가 있는지 확인하는 과정입니다. 데이터 프레임의 어떤 데이터들이 있는지, 크기는 어떠한지, 어떤 자료형을 가졌는지 등을 파악하는 과정입니다.
3. 데이터프레임 조회
특정 조건을 만족하는 데이터를 조회하여 원하는 정보를 골라내서 보는 방법을 배웠습니다.
4. 데이터프레임 집계
데이터 프레임에서 특정 열 혹은 여러열의 합이나 평균, 최댓값, 최솟값 등을 구해 데이터를 요약하는 작업입니다.
5. 데이터 프레임 변경
1) 열 및 범주값 내용 변경 : 열 이름 변경, 열 추가 및 삭제, 범주값 변경 등을 통해 데이터를 가공하고 분석에 적합한 형태로 변경합니다.
2) 결측치 처리 : 데이터에서 비어있느 부분인 결측치를 찾고 이를 채우거나 지우는 등의 작업을 해서 데이터를 완전하게 만듭니다.
3) 데이터 합치기 : 여러 개의 데이터를 합쳐서 하나로 만드는 과정입니다. 서로 다른 데이터프레임을 가로로나 세로로 합치거나, 공통된 열을 기준으로 조인하여 더 큰 데이터프레임을 만듭니다.# 학습 소감
어렵기는 했지만 여러 실습 자료 파일들을 통해 데이터를 가공하는 과정은 재밌었습니다!
하지만 아직은 코드를 작성할 때 이게 여기 들어가는 게 맞는지, 괄호를 넣어야 하는건지 등등은 많이 헷갈려하고 있습니다 허허
아직 수강한지 얼마 안되었으니 계속 반복 학습하면 되겠죠!
그리고 '데이터 다루기'와 '데이터 다듬기' 를 강의해주셨던 이장래 강사님과는 이제 잠시 헤어지고 다음에 머신러닝 수업때 뵙게 됩니다.
장래 강사님 그동안 정말 알기 쉽게 가르쳐 주셔서 감사했으며 강사님께서 그리신 그림 보는 재미가 쏠쏠하였습니다 ㅎㅎ
다음 과정인 '데이터 분석'에서는 또 어떤 내용을 학습하게 될 지 기대됩니다!
'KT 에이블스쿨 > 학습내용' 카테고리의 다른 글
[KT 에이블스쿨 4기 DX트랙] 머신러닝 (비지도 학습) 후기 (0) 2023.09.20 [KT 에이블스쿨 4기 DX트랙] 머신러닝 (지도학습) 후기 (0) 2023.09.16 [KT 에이블스쿨 4기 DX트랙] 데이터 수집 후기 (0) 2023.09.10 [KT 에이블스쿨 4기 DX트랙] 데이터 분석 후기 (0) 2023.09.10 [KT 에이블스쿨 4기 DX트랙] 데이터 다루기 후기 (0) 2023.08.26