빅데이터분석기사 실기 시험환경 체험하기-작업형 3유형
문제
제공된 데이터(data/Titanic.csv)는 타이타닉호의 침몰 사건에서 생존한 승객 및 사망한 승객의 정보를 포함한 자료이다. 아래 데이터를 이용하여 생존 여부(Survived)를 예측하고자 한다. 각 문항의 답을 【제출 형식】에 맞춰 답안 작성 페이지에 입력하시오. (단, 벌점화(penalty)는 부여하지 않는다.)
① Gender와 Survived 변수 간의 독립성 검정을 실시하였을 때, 카이제곱 통계량은? (반올림하여 소수 셋째 자리까지 계산)
② Gender, SibSp, Parch, Fare를 독립변수로 사용하여 로지스틱 회귀모형을 실시하였을 때, Parch 변수의 계수값은? (반올림하여 소수 셋째 자리까지 계산)
③ 위 ②번 문제에서 추정된 로지스틱 회귀모형에서 SibSp 변수가 한 단위 증가할 때 생존할 오즈비(Odds ratio) 값은? (반올림하여 소수 셋째 자리까지 계산)
【제출 형식】
㉠ 소수 넷째 자리에서 반올림하여 소수 셋째 자리까지만 계산
코드 답
① Gender와 Survived 변수 간의 독립성 검정을 실시하였을 때, 카이제곱 통계량은? (반올림하여 소수 셋째 자리까지 계산)
# 1. 독립성 검정 : chi2_contingency
from scipy.stats import chi2_contingency
df1 = pd.crosstab(df['Gender'], df['Survived'])
chi2, p, dof, expected = chi2_contingency(df1) # 귀무가설 기각
print(round(chi2, 3))
답: 260.717
② Gender, SibSp, Parch, Fare를 독립변수로 사용하여 로지스틱 회귀모형을 실시하였을 때, Parch 변수의 계수값은? (반올림하여 소수 셋째 자리까지 계산)
# 2. 로지스틱 회귀모형 : statsmodels.formula.api import logit
from statsmodels.formula.api import logit
formula = 'Survived ~ Gender + SibSp + Parch + Fare'
model = logit(formula, data=df).fit()
print(round(model.params['Parch'], 3))
# model.params 대신 model.summary()로 확인해도 답 나옴
답: -0.201
③ 위 ②번 문제에서 추정된 로지스틱 회귀모형에서 SibSp 변수가 한 단위 증가할 때 생존할 오즈비(Odds ratio) 값은? (반올림하여 소수 셋째 자리까지 계산)
# 3. SibSp 변수가 한 단위 증가할 때 생존할 오즈비 : np.exp
result = np.exp(model.params)
print(round(result['SibSp'], 3))
답: 0.702
'개발 공부 > 빅데이터분석기사' 카테고리의 다른 글
[빅데이터 분석 기사] tip, 제 1유형, 제 2유형, 제 3유형 통합 요약 (0) | 2024.06.22 |
---|---|
빅데이터 분석기사 실기 Tip (0) | 2023.12.01 |
빅데이터분석기사 실기 시험환경 체험하기-작업형 2유형 (0) | 2023.12.01 |
빅데이터분석기사 실기 시험환경 체험하기 - 작업형 1유형 (0) | 2023.11.30 |