본문 바로가기
개발 공부/빅데이터분석기사

빅데이터분석기사 실기 시험환경 체험하기-작업형 2유형

by momo'sdad 2023. 12. 1.

빅데이터분석기사 실기 시험환경 체험하기-작업형 2유형

 

 

https://dataq.goorm.io/exam/3/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%EC%B2%B4%ED%97%98/quiz/4

 

구름EDU - 모두를 위한 맞춤형 IT교육

구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 수업, 기업/

edu.goorm.io

 

 


문제

 
(체험) 제2유형
 

제공된 데이터는 백화점 고객이 1년간 상품을 구매한 속성 데이터이다. 제공된 학습용 데이터(data/customer_train.csv)를 이용하여 백화점 구매 고객의 성별을 예측하는 모델을 개발하고, 개발한 모델에 기반하여 평가용 데이터(data/customer_test.csv)에 적용하여 얻은 성별 예측 결과를 아래 【제출 형식】에 따라 CSV 파일로 생성하여 제출하시오.

* 예측 결과는 ROC-AUC 평가지표에 따라 평가함

* 성능이 우수한 예측 모델을 구축하기 위해서는 데이터 정제, Feature Engineering, 하이퍼 파라미터(hyper parameter) 최적화, 모델 비교 등이 필요할 수 있음. 다만, 과적합에 유의하여야 함.

【제출 형식】

  ㉠ CSV 파일명 : result.csv (파일명에 디렉토리·폴더 지정불가)
  ㉡ 예측 성별 칼럼명 : pred
  ㉢ 제출 칼럼 개수 : pred 칼럼 1개 
   평가용 데이터 개수와 예측 결과 데이터 개수 일치 : 2,482개

 


 

코드 답

실행결과

 

Line별 해석

3~4: train, test csv를 로드

7: 컬럼 모두 보기 옵션

11~17: 결측치 확인 .info(), .isnull().sum()으로 데이터 프레임 정보 확인 및 결측치 확인 후 결측치 0으로 채움

20~26: 범주형 변수를 LabelEncoder로 변환

29~31: train 데이터를 X_train과 y_train으로 나눔, test데이터를 X_test로 변경

34~39: RandomForest를 이용하여 모델 학습 및 예측

42~45: predict된 예측값을 데이터프레임으로 변환후 result.csv로 저장

48~49: 저장한 result.csv데이터를 다시 불러와서 print

 

반응형