글번호
166640

[광고홍보학전공 자격증 시리즈] 5. 빅데이터분석사

수정일
2023.08.04
작성자
이제영
조회수
272
등록일
2023.08.04

빅데이터 분석사

 

대한민국의 기사급 자격증. 2019년에 창설되었다. 유사자격증인 ADP, ADsP와 통합되는 안과 별개로 추진되는 안이 논의되었으나 결국 별개의 자격증으로 확정되었다. ADP, ADsP, 빅데이터분석기사 모두 한국데이터산업진흥원에서 주관한다는 점과 출제 기준에서 상당한 공통점을 보이나 난이도의 차이가 있다. 공식적이진 않지만 일반적으로 ADsP < 빅데이터분석기사 < ADP 순으로 인식된다. 빅데이터분석기사 시험은 2021 417 첫 시험을 치렀고, 1년에 2회 실시한다. 이 자격의 주관은 과학기술정보통신부와 통계청이며, 자격증에는 과학기술정보통신부장관과 통계청장이 적혀나온다. 자격증은 상장형과 카드형 실물자격증으로 발급된다.

 

2. 상세

2.1. 신설

수탁기관 심의결과 2020128일부로 20201231일까지 약 1년간 한국데이터산업진흥원이[1] 빅데이터 분석기사 수탁기관으로 지정되었다. 관련 공지에 따르면 주무부처가 수탁기관 변경을 요청하지 않으면 자동 연장된다고 써있는 것으로 보아 계속 한국데이터산업진흥원이 수탁업무를 수행할 것으로 보인다.

 

2.2. 기본정보

자격분류국가기술자격

시행기관한국데이터산업진흥원

응시자격: 제한있음(국가기술자격법 시행령 별표42) [2]

근거법: 국가기술자격법 및 동법 시행령

자격개요: 빅데이터분석기사란 한국데이터산업진흥원에서 시행하는 빅데이터분석기사 시험에 합격하여 그 자격을 취득한 자를 말한다.

자격특징: 대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행한다.

응시수수료: 필기 17,800, 실기 40,800

홈페이지: https://www.dataq.or.kr

 

2.3. 시험정보

2.3.1. 응시자격

 

다음 중 하나에 해당하는 사람 (졸업증명서 및 경력증명서 제출 필요)

대학졸업자등 또는 졸업예정자 (전공 무관)

기사 등급 이상의 자격을 취득한 사람 (종목 무관)

3년제 전문대학 졸업자등으로서 졸업 후 1년 이상 직장경력이 있는 사람 (전공, 직무분야 무관)

2년제 전문대학 졸업자등으로서 졸업 후 2년 이상 직장경력이 있는 사람 (전공, 직무분야 무관)

기사 수준 기술훈련과정 이수자 또는 그 이수예정자 (종목 무관)

산업기사 수준 기술훈련과정 이수자로서 이수 후 2년 이상 직장경력이 있는 사람 (종목, 직무분야 무관)

4년 이상 직장경력이 있는 사람 (직무분야 무관)

 

2.3.2. 합격기준 및 기타

필기: 100점을 만점으로 하여 과목당 40점 이상, 전 과목 평균 60점 이상

실기: 100점을 만점으로 하여 60점 이상

필기시험에 합격한 자에 대하여는 필기시험 합격자 발표일로부터 2년간 필기시험을 면제한다.


   2.3.3. 필기

구분

과목명

배점

1과목

빅데이터 분석기획

25

2과목

빅데이터 탐색

25

3과목

빅데이터 모델링

25

4과목

빅데이터 결과 해석

25


시험 방식은 객관식, 각 과목당 20문제로 구성되어 있다. 시험 시간은 총 120분이다. 과목당 8문제 이상을 맞춰야 하며, 한 과목이라도 8문제 미만으로 맞출 경우 총점이 평균 60점 이상이라도 과락으로 불합격이다. 문제는 공개하지 않으며, 시험장에서 시험지를 걷어간다. 현행 기사 제도에서는 유일한 필기 비공개 시험이다[4] [5] 최초 시행된 2021년 제2회 필기시험에서는 예상보다 통계 관련 문제가 많이 나와 수험생들을 멘붕에 빠트렸다. 합격률이 한 자릿수가 아니냐는 의견도 나왔으나 필기 합격률은 40%대로 꽤 높은 편이다.

 

2.3.3.1. 빅데이터 분석 기획[편집]

주요항목

세부항목

세세항목

빅데이터의 이해

빅데이터 개요 및 활용

빅데이터의 특징
빅데이터의 가치
데이터 산업의 이해
빅데이터 조직 및 인력

빅데이터 기술 및 제도

빅데이터 플랫폼
빅데이터와 인공지능
개인정보 법·제도
개인정보 활용

데이터 분석 계획

분석 방안 수립

분석 로드맵 설정
분석 문제 정의
데이터 분석 방안

분석 작업 계획

데이터 확보 계획
분석 절차 및 작업 계획

데이터 수집 및 저장 계획

데이터 수집 및 전환

데이터 수집
데이터 유형 및 속성 파악
데이터 변환
데이터 비식별화
데이터 품질 검증

데이터 적재 및 저장

데이터 적재
데이터 저장

 

2.3.3.2. 빅데이터 탐색

주요항목

세부항목

세세항목

데이터 전처리

데이터 정제

데이터 정제
데이터 결측값 처리
데이터 이상값 처리

분석 변수 처리

변수 선택
차원축소
파생변수 생성
변수 변환
불균형 데이터 처리

데이터 탐색

데이터 탐색 기초

데이터 탐색 개요
상관관계 분석
기초통계량 추출 및 이해
시각적 데이터 탐색

고급 데이터 탐색

시공간 데이터 탐색
다변량 데이터 탐색
비정형 데이터 탐색

통계기법 이해

기술통계

데이터요약
표본추출
확률분포
표본분포

추론통계

점추정
구간추정
가설검정

 

2.3.3.3. 빅데이터 모델링

주요항목

세부항목

세세항목

분석모형 설계

분석절차 수립

분석모형 선정
분석모형 정의
분석모형 구축 절차

분석 환경 구축

분석 도구 선정
데이터 분할

분석기법 적용

분석기법

회귀분석
로지스틱 회귀분석
의사결정나무
인공신경망
서포트벡터머신
연관성분석
군집분석

고급 분석기법

범주형 자료 분석
다변량 분석
시계열 분석
베이지안 기법
딥러닝 분석
비정형 데이터 분석
앙상블 분석
비모수 통계

 

2.3.3.4. 빅데이터 결과 해석

주요항목

세부항목

세세항목

분석모형 평가 및 개선

분석모형 평가

평가 지표
분석모형 진단
교차 검증
모수 유의성 검정
적합도 검정

분석모형 개선

과대적합 방지
매개변수 최적화
분석모형 융합
최종모형 선정

분석결과 해석 및 활용

분석결과 해석

분석모형 해석
비즈니스 기여도 평가

분석결과 시각화

시공간 시각화
관계 시각화
비교 시각화
인포그래픽

분석결과 활용

분석모형 전개
분석결과 활용 시나리오 개발
분석모형 모니터링
분석모형 리모델링

 

2.3.4. 실기

실기 프로그램은 R(프로그래밍 언어또는 Python 중에서 수험자가 직접 선택하여 응시 가능하다. 시험 시간은 180.

5회 실기시험까지 단답형 10문제(3점씩)와 데이터 전처리 능력을 보는 작업형1 3문제(10점씩), 제공되는 데이터를 전처리하여 예측 모델링을 수행하는 작업형2 1문제(40)가 출제되었으나, 6회 실기시험부터는 단답형 10문제가 없어지고 가설검정 능력을 평가하는 작업형3 2문제(30)가 출제된다. 총점 60점을 넘으면 합격한다.

실제 6회 시험에서는 작업형3 문제가 3문제 출제되었고, 출간된 교재나 강의에서 다루는 범위가 아닌 회귀문제도 나왔다.
문제오류로 인해서 전원 정답처리되는 문제가 2문제 가량 있었는데, 시험 자체가 자리를 잡지 못하고 매번 유형이 바뀌고 있는 점이 수험생들에게는 난이도 떡상의 요인이 될 것으로 보인다.

작업형3 문제를 풀기위해서는 통계학 개론 수준의 내용은 알고 있어야 하는만큼 기존에 작업형2 문제까지 나오는 빅데이터분석기사를 생각하고 시험장에 들어가는 상황이 되면 안될 것이고, 철저한 코딩 준비가 필요하다.

 

2.3.4.1. 제공환경

클라우드 기반 코딩 플랫폼이 제공된다. Jupyter Notebook처럼 셀 혹은 줄 단위로 실행시킬 수 없고, 전체 코드를 한 번에 실행해야 한다. 또한 자동완성 기능도 제공되지 않으므로 유의할 것. 코드 실행시간은 최대 1분이며, 1분을 넘기면 자동 실행취소된다. 아래 링크의 환경을 참고.

진흥원에서 제공하는 예시 환경

구름devth

프로그래머스

 

2.3.4.2. 검정과목

검정과목은 1개로 '빅데이터 분석 실무'이며 주요 항목은 아래와 같다.

데이터 수집 작업

데이터 전처리 작업

데이터 모형 구축 작업

데이터 모형 평가 작업


3. 기타

종목 개발 연구에 따르면 ADsP ADP 사이의 수준이다.

1회 필기 시험 접수 시작일인 20201123일에 사이트가 먹통이 되어 아무도 접수하지 못하고 일정이 늦춰졌다뉴스기사 202011월 말부터 코로나 확산세가 심해져서 1219일에 예정이었던 제 1회 시험은 20212회차 시험으로 미뤄졌다. 나흘 앞두고 갑작스러운 취소 통보가 논란이 되었으며, 주관기관의 무능함을 고발하는 청와대 국민청원이 올라오기도 하였다뉴스기사 국민청원

첫 시험은 여러모로 문제가 많은 시험으로 평가된다. 빅데이터분석기사이지만 사실상 통계학 위주로 출제되어 통계분석기사가 아니냐는 말이 돌 정도로 편향된 출제경향을 보였으며, 오탈자가 난무하는 것은 기본이고 심지어 두 문제는 주관기관에서 복수정답으로 인정하는 사태까지 벌어졌다진흥원 공지 실기 작업형2 1문제 같은 경우 40점으로 당락에 많은 영향을 끼치는데 많은 응시생들이 0점처리되는 문제가 있었다. 무능원이라는 말이 돌 정도로 여러 가지 측면에서 주관기관 대응이 미흡한 점이 눈에 띄며, 빅분기 역시 큐넷으로 이관하는 것이 좋겠다는 의견이 수험생들 사이에서 전반적으로 돌고 있다.

2020년에 정보처리기사가 개정되어 난이도가 올라가자 정보처리기사를 징검다리 삼아 다른 기사 응시자격을 갖추려던 비전공자들이 전자계산기조직응용기사나 빅데이터분석기사를 대신 보겠다고 하기도 했다. 하지만 빅데이터 분야가 상당한 통계학 지식을 요구하는지라 비전공자가 접근하기엔 어려울 것으로 보인다.

2회 실기시험의 경우 제2유형에서 점수가 상당히 엇갈리고 있다. 만점(40)0점이라는 극단적인 분포로 갈라져 있으며, 파이썬으로 코드를 제출한 경우가 만점이 많고 R로 코드를 제출한 경우가 0점이 많은 것으로 나타났다. 주관기관의 일처리 특성상 향후 조치에 따른 채점결과의 변화가 나타날 가능성이 있어 보인다긴급공지 커뮤니티에 따르면 합격에서 불합격으로 번복 통보를 받았다는 사례가 잇따라 발생하고 있다. 점수 구간의 문제가 아니라 아예 채점 자체가 잘못된 것으로 밝혀져 주최 측의 무능함이 제대로 드러나고 있다뉴스기사 사례1 사례진흥원 측에서는 전수조사를 실시한 결과를 수험자 개별로 문자를 발송하여 변동 여부를 통보하였으며, 사전사후 검사결과를 비교할 수 있도록 공개할 것임을 공지하였고 실기 재검토 결과를 안내하였다관련공지관련공지점수 변동으로 인해 합격/불합격이 변화된 경우가 상당수 있는 것으로 보이며, 진흥원에 직접 방문하여 코드 확인을 한 사례가 존재한다방문 후기 이 글에서처럼 코드 실행 시간의 1분 준수 여부가 매우 큰 제약점으로 작용하였으며, 향후 시험을 준비하는 수험생들이 반드시 염두에 두어야 할 사항이다.

 

   

첨부파일
첨부파일이(가) 없습니다.