빅데이터 분석기사 제 3회 실기 시험(12/4일 시행)에서 합격했다. 시험에 참고할 만한 후기나 정보들이 많지 않아서 달리 준비는 못 했지만 합격해서 다행이다. 시험 결과가 발표된 뒤(12/31일) 한참이 지난 뒤늦은 후기지만, 준비할 때 정보가 워낙 없었던 점을 감안해서 공유해보기로 했다.
시험 시간 & 문제 유형
시험 시간은 3시간이 주어진다. 필기 시험에서 공부했던 내용들이 단답형으로 10문항 출제되는데, 문제 하나에 3점이다. 필기 시험이 끝난 후로 2달 뒤 시점이기 때문에 대부분이 기억이 잘 안 났지만, 꾸역꾸역 풀어봤다. 사실상 다 틀려도 나머지 코딩에서 잘 맞추면 합격할 순 있다. 신뢰도, 정규화, 표준화 등의 기본적인 대답을 묻는 문제이지만 죽어도 생각이 안 나는 것도 많았다.. 반타작 했다.
코딩 문제는 4문제가 등장하는데, 10점 짜리 작업1유형 3문항과, 무려 40점이 배점 된 작업2유형 1문항이다. 유형 자체는 주최 기관에서 공개한 응시 환경 체험에서 제공하는 문제와 유형이 매우 유사하다.
[응시환경 체험하기]
클라우드 환경으로 시험이 진행되니, 익숙해지기 위해서 사전에 꼭! 사용법을 익히고 가야 한다. 사용법은 간단하다. 저장하기 전에 실행 미리 꼭 해서 결과값과 실행시간 테스트 해보고 넘어갈 것.
https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1
작업1유형은 주어진 데이터셋을 다룰 수 있는지에 대한 질문이다. 특정 컬럼값을 추출해서 오름차순 혹은 내림차순으로 정렬해서 특정 서열값을 출력한다는 식이다. Scaler를 사용해서 데이터를 정규화할 수 있는지 등을 묻는데, 문제를 차근차근 읽으면서 잘 이해해야한다. 주의할 점은, 17이 정답이라면 최종 print(____)를 통해서 정수 ‘17’만 출력해야 한다. 실행을 통해서 꼭 확인하시길! 그리고 17이 정답인걸 안다고 하더라도 print(‘17’) 이렇게 결과값만 주는 것이 아니라, print(data[‘col1’][1]) << 이런 식으로 풀이 과정을 알 수 있는 형태로 제출해야 한다.
A = data[‘col1’][1]
print(A)
물론 위와 같은 형태도 가능하다.
작업2유형은 머신러닝을 돌릴 수 있어야 한다. 난이도가 높은 것은 아니고, 데이터셋 특징에 따라서 분류 모델이 필요한 경우 분류 알고리즘을 몇 가지 외워가고, 회귀 모델이 필요한 경우에는 회귀 알고리즘을 몇 가지 준비해서 응용하면 되겠다. 알고리즘만 떡하니 쓰기보다는 StandardScaler를 fit, transform 해주고 텍스트 데이터의 경우에는 수치화할 수 있는 OnehotEncoding, LabelEncoding을 적용해주는 정도의 전처리는 필요하다.
나의 경우에는 분류모델 문제가 출제되어서, RandomForest를 적용했다. 평소에 편리하게 구글코랩이서 이용하던 자동완성 기능은 결코 없으니, 필수 요소는 몇 가지 정리하여 꼭 외워가시길!
요약하자면 다음은 필수로 준비해보자!
1. 데이터 전처리
- StandardScaler, MinMaxScaler 사용방법
- OnehotEncoding, LabelEncoding 사용방법
- 불필요한 컬럼/행 삭제, 특정 컬럼/행 추출
- 내림차순, 오름차순 ascending=True
- 최솟값, 최댓값, 중앙값 등 추출
2. 머신러닝 알고리즘 적용방법
- 분류, 회귀, 군집 등 알고리즘 적용방법
- scoring도 준비해서 몇 가지 알고리즘 비교해서 가장 성능 좋은 알고리즘으로 채택할 것 (준비 시간이 부족하다면 pass 가능)
3. 연습하기
- 싸이킷런에서 제공하는 Iris species 분류, Boston 집값 예측 등 데이터셋 불러와서 연습해보기 (해당 데이터 다루고 머신러닝 돌려보는 예제는 무수히 많다)
마지막으로 결과인증 및 올해 시험 일정정보 공유!
2022년 빅데이터 분석기사 시험일정
제 4회
[필기] 4/9(토) : 접수 3/7~3/14, 발표 4/29
[실기] 6/25(토) : 접수 5/23~27, 발표 7/15
제 5회
[필기] 10/1(토) : 접수 8/29~9/2, 발표 10/21
[실기] 12/3(토) : 접수 10/24~11/3, 발표 12/23
** 출처: 데이터자격검정시스템(www.dataq.or.kr)
'Berry talks' 카테고리의 다른 글
Filter Bubble, 편향적 알고리즘의 노예를 피하는 법 (0) | 2024.07.09 |
---|---|
빅데이터 분석기사 필기 합격후기 (응시자격, 시험준비방법) (0) | 2021.10.24 |
제3회 빅데이터 분석기사 필기시험 데이터에듀로 공부한 비전공자 후기, 기출 문제복원 (2) | 2021.10.02 |