빅데이터분석기사 실기 시험환경 체험하기-작업형 2유형
문제
제공된 데이터는 백화점 고객이 1년간 상품을 구매한 속성 데이터이다. 제공된 학습용 데이터(data/customer_train.csv)를 이용하여 백화점 구매 고객의 성별을 예측하는 모델을 개발하고, 개발한 모델에 기반하여 평가용 데이터(data/customer_test.csv)에 적용하여 얻은 성별 예측 결과를 아래 【제출 형식】에 따라 CSV 파일로 생성하여 제출하시오.
* 예측 결과는 ROC-AUC 평가지표에 따라 평가함
* 성능이 우수한 예측 모델을 구축하기 위해서는 데이터 정제, Feature Engineering, 하이퍼 파라미터(hyper parameter) 최적화, 모델 비교 등이 필요할 수 있음. 다만, 과적합에 유의하여야 함.
【제출 형식】
㉠ CSV 파일명 : result.csv (파일명에 디렉토리·폴더 지정불가)
㉡ 예측 성별 칼럼명 : pred
㉢ 제출 칼럼 개수 : pred 칼럼 1개
㉣ 평가용 데이터 개수와 예측 결과 데이터 개수 일치 : 2,482개
코드 답
실행결과
Line별 해석
3~4: train, test csv를 로드
7: 컬럼 모두 보기 옵션
11~17: 결측치 확인 .info(), .isnull().sum()으로 데이터 프레임 정보 확인 및 결측치 확인 후 결측치 0으로 채움
20~26: 범주형 변수를 LabelEncoder로 변환
29~31: train 데이터를 X_train과 y_train으로 나눔, test데이터를 X_test로 변경
34~39: RandomForest를 이용하여 모델 학습 및 예측
42~45: predict된 예측값을 데이터프레임으로 변환후 result.csv로 저장
48~49: 저장한 result.csv데이터를 다시 불러와서 print
'개발 공부 > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터 분석 기사] tip, 제 1유형, 제 2유형, 제 3유형 통합 요약 (0) | 2024.06.22 |
---|---|
빅데이터분석기사 실기 시험환경 체험하기-작업형 3유형 (0) | 2023.12.01 |
빅데이터 분석기사 실기 Tip (0) | 2023.12.01 |
빅데이터분석기사 실기 시험환경 체험하기 - 작업형 1유형 (0) | 2023.11.30 |