개요
다음은 2020년 국가공무원 5급 상황판단영역 나책형 39번, 40번 문제 해설이다.
문제
※ 다음 글을 읽고 물음에 답하시오. [문 39.~문 40.]
‘알파고’는 기존 인공지능의 수읽기 능력뿐만 아니라 정책망과 가치망이라는 두 가지 인공신경망을 통해 인간 고수 못지않은 감각적 예측 능력(정책망)과 형세판단 능력(가치망)을 구현한 바둑 인공지능이다. 인간의 지능활동은 물리적인 차원에서 보면 뇌 안의 시냅스로 연결된 뉴런들이 주고받는 전기신호의 상호작용으로 인해 나타난다. 인공신경망은 인간의 뇌가 작동하는 방식에서 착안하여 만든 것이다.
‘학습’을 거치지 않은 인공신경망은 무작위로 설정한 다수의 가중치를 갖고 있다. 이를 갖고 입력값을 처리했을 때 옳지 않은 출력값이 나온 경우, 올바른 결과를 도출하기 위해 가중치를 조절하는 것이 인공신경망의 학습과정이다. 따라서 오답에 따른 학습을 반복할수록 인공신경망의 정확도는 향상된다. 알파고의 첫 번째 인공신경망인 ‘정책망’은 “인간 고수라면 다음 수를 어디에 둘까?”를 예측한다. 입력(현 바둑판의 상황)과 출력(그 상황에서의 인간 고수의 착점) 사이의 관계를 간단한 함수로 표현할 수는 없다. 하지만 알파고는 일련의 사고가 단계별로 진행되므로 인공신경망의 입력과 출력 사이에 13개의 중간층을 둔 심층신경망을 통해 다음 수를 결정한다. 이 복잡한 인공신경망은 인간의 뇌에서 뉴런들이 주고받는 전기신호의 세기에 해당하는 가중치를 최적화해 나아간다. 이를 위해 인터넷 바둑 사이트의 6~9단 사용자의 기보 16만 건에서 추출된 약 3,000만 건의 착점을 학습했다. 3,000만 개의 예제를 학습하여 입력값을 넣었을 때 원하는 출력값이 나오게끔 하는 가중치를 각종 최적화 기법으로 찾는 방식이다. 이러한 ‘지도학습’이 끝나면 ‘강화학습’이 시작된다. 지도학습으로 찾아낸 각 가중치를 조금씩 바꿔보는 것이다. 예를 들어 지도학습 결과 어떤 가중치가 0.3이었다면, 나머지 모든 조건은 동일한 상태에서 그 가중치만 0.4로 바꾼 인공신경망과 가중치가 0.3인 기존의 인공신경망을 여러 번 대국시켰을 때, 주로 이긴 인공신경망의 가중치를 선택하게 된다. 모든 가중치에 대해 이와 같은 과정을 반복하여 최적의 가중치를 찾게 되는 것이다. 알파고의 두 번째 인공신경망인 ‘가치망’은 바둑의 대국이 끝날 때까지 시뮬레이션을 해보고 결과를 판단하는 대신에, 현재 장면으로부터 앞으로 몇 수만 진행시켜보고 그 상황에서 형세를 판단하는 것이다. 현대 바둑 이론으로도 형세의 유불리를 판단하는 기준이 몇 집인지 정량적으로 환산하기는 어렵다. 마찬가지로 정확한 평가 함수를 프로그래머가 알아야 할 필요가 없다. 평가 함수의 초깃값을 임의로 설정해놓고 정책망의 강화학습 때와 같이 두 가지 버전의 인공신경망을 대국시킨다. 만약 변경된 버전이 주로 이겼다면 그 다음 실험에서는 변경된 버전을 채택하는 과정을 무수히 반복한다. 이런 식으로 아주 정확한 평가 함수를 찾아갈 수 있는 것이다. |
문 39. 윗글을 근거로 판단할 때 옳은 것은?
① 오답을 통한 학습과정을 더 많이 거칠수록 인공신경망의 정확도는 떨어진다.
② 알파고는 가중치를 최적화하는 과정에서 기보 한 건당 1,000건 이상의 착점을 학습했다.
③ 알파고는 빠른 데이터 처리 능력 덕분에 인터넷 기보를 이용한 지도학습만으로도 정확한 형세판단 능력의 평가 함수를 찾을 수 있었다.
④ 알파고가 바둑의 형세를 판단하도록 하기 위해서 프로그래머는 정확한 평가 함수를 알아야 한다.
⑤ 최초에는 동일한 인공신경망이라고 해도 강화학습의 유무에 따라 인공신경망의 가중치는 달라질 수 있다.
문 40. 윗글과 다음 <상황>을 근거로 판단할 때, 최종적으로 선택할 알파고의 가중치 A와 B를 옳게 짝지은 것은?
<상 황> |
○ 다른 모든 조건이 동일한 상태에서 가중치 A, B만을 변경한다.
○ 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망이 가중치 A가 0.3이고 가중치 B가 0.3인 인공신경망을 주로 이겼다. ○ 가중치 A가 0.5이고 가중치 B가 0.3인 인공신경망이 가중치 A가 0.3이고 가중치 B가 0.3인 인공신경망을 주로 이겼다. ○ 가중치 A가 0.4이고 가중치 B가 0.4인 인공신경망은 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망에게 주로 졌다. ○ 가중치 A가 0.5이고 가중치 B가 0.3인 인공신경망은 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망에게 주로 졌다. ○ 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망이 가중치 A가 0.4이고 가중치 B가 0.2인 인공신경망을 주로 이겼다. |
가중치 A | 가중치 B | |
① | 0.3 | 0.3 |
② | 0.4 | 0.2 |
③ | 0.4 | 0.3 |
④ | 0.4 | 0.4 |
⑤ | 0.5 | 0.3 |
출처: 사이버국가고시센터
39번 문제 해설
① 오답을 통한 학습과정을 더 많이 거칠수록 인공신경망의 정확도는 떨어진다.
따라서 오답에 따른 학습을 반복할수록 인공신경망의 정확도는 향상된다. |
보기의 내용은 옳지 않다.
② 알파고는 가중치를 최적화하는 과정에서 기보 한 건당 1,000건 이상의 착점을 학습했다.
이를 위해 인터넷 바둑 사이트의 6~9단 사용자의 기보 16만 건에서 추출된 약 3,000만 건의 착점을 학습했다. 3,000만 개의 예제를 학습하여 입력값을 넣었을 때 원하는 출력값이 나오게끔 하는 가중치를 각종 최적화 기법으로 찾는 방식이다. |
3,000만 건 ÷ 16만 건 = 187.5건의 착점
알파고는 가중치를 최적화하는 과정에서 기보 한 건당 평균 187.5건의 착점을 학습했다.
따라서 보기의 내용은 옳지 않다.
③ 알파고는 빠른 데이터 처리 능력 덕분에 인터넷 기보를 이용한 지도학습만으로도 정확한 형세판단 능력의 평가 함수를 찾을 수 있었다.
알파고의 두 번째 인공신경망인 ‘가치망’은 바둑의 대국이 끝날 때까지 시뮬레이션을 해보고 결과를 판단하는 대신에, 현재 장면으로부터 앞으로 몇 수만 진행시켜보고 그 상황에서 형세를 판단하는 것이다. 평가 함수의 초깃값을 임의로 설정해놓고 정책망의 강화학습 때와 같이 두 가지 버전의 인공신경망을 대국시킨다. 만약 변경된 버전이 주로 이겼다면 그 다음 실험에서는 변경된 버전을 채택하는 과정을 무수히 반복한다. 이런 식으로 아주 정확한 평가 함수를 찾아갈 수 있는 것이다. |
지도학습은 알파고의 첫 번째 인공신경망인 ‘정책망’과 관련이 있고, 형세판단 능력은 두 번째 인공신경망인 ‘가치망’과 관련이 있다.
따라서 보기의 내용은 옳지 않다.
④ 알파고가 바둑의 형세를 판단하도록 하기 위해서 프로그래머는 정확한 평가 함수를 알아야 한다.
마찬가지로 정확한 평가 함수를 프로그래머가 알아야 할 필요가 없다. |
보기의 내용은 옳지 않다.
⑤ 최초에는 동일한 인공신경망이라고 해도 강화학습의 유무에 따라 인공신경망의 가중치는 달라질 수 있다.
‘지도학습’이 끝나면 ‘강화학습’이 시작된다. 지도학습으로 찾아낸 각 가중치를 조금씩 바꿔보는 것이다. 예를 들어 지도학습 결과 어떤 가중치가 0.3이었다면, 나머지 모든 조건은 동일한 상태에서 그 가중치만 0.4로 바꾼 인공신경망과 가중치가 0.3인 기존의 인공신경망을 여러 번 대국시켰을 때, 주로 이긴 인공신경망의 가중치를 선택하게 된다. 모든 가중치에 대해 이와 같은 과정을 반복하여 최적의 가중치를 찾게 되는 것이다. |
지도학습 후 강화학습 과정에서 한 가중치만 변경한 인공신경망과 기존의 인공신경망을 여러 번 대국시켰을 때, 주로 이긴 인공신경망의 가중치를 선택하게 된다. 모든 가중치에 대해 이와 같은 과정을 반복하여 최적의 가중치를 찾게 되는 과정에서 인공신경망의 가중치는 달라질 수 있다.
따라서 보기의 내용은 옳다.
정답은 ⑤번이다.
40번 문제 해설
○ 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망이 가중치 A가 0.3이고 가중치 B가 0.3인 인공신경망을 주로 이겼다.
A 0.4 > A 0.3
○ 가중치 A가 0.5이고 가중치 B가 0.3인 인공신경망이 가중치 A가 0.3이고 가중치 B가 0.3인 인공신경망을 주로 이겼다.
A 0.5 > A 0.3
○ 가중치 A가 0.4이고 가중치 B가 0.4인 인공신경망은 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망에게 주로 졌다.
B 0.4 < B 0.3
○ 가중치 A가 0.5이고 가중치 B가 0.3인 인공신경망은 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망에게 주로 졌다.
A 0.4 > A 0.5
○ 가중치 A가 0.4이고 가중치 B가 0.3인 인공신경망이 가중치 A가 0.4이고 가중치 B가 0.2인 인공신경망을 주로 이겼다.
B 0.3 > B 0.2
A 0.4 > A 0.3
A 0.5 > A 0.3
A 0.4 > A 0.5
이므로 최적의 가중치 A는 0.4이다.
B 0.3 > B 0.4
B 0.3 > B 0.2
이므로 최적의 가중치 B는 0.3이다.
정답은 ③번이다.
2020 5급 PSAT 상황판단
- [PSAT 기출] 2020 5급 상황판단 나책형 39번 40번 해설 – 알파고 인공지능 정책망 가치망 인공신경망
- [PSAT 기출] 2020 5급 상황판단 나책형 38번 해설 – 조성물 최소성분량 최대성분량
- [PSAT 기출] 2020 5급 상황판단 나책형 37번 해설 – 품질인증서번호 발급 재발급
- [PSAT 기출] 2020 5급 상황판단 나책형 35번 해설 – 상자 조립 봉사활동 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 34번 해설 – 직장인 커플 매칭 프로그램 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 33번 해설 – 화장실 세면대 샤워실 외출 준비 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 32번 해설 – 방송국 프로그램 출연 오전 오후 펭귄극장 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 31번 해설 – A팀 회식 회식메뉴 메뉴 선호 순위
- [PSAT 기출] 2020 5급 상황판단 나책형 30번 해설 – 공장 작업 최소 시간 작업반 제품 생산 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 29번 해설 – 콩 수확 돌멩이 평행접시 평형 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 28번 해설 – 서연 가전제품 상점 구매 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 27번 해설 – 포상금 사용기준 5,000만 원 우수부서 기념품 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 26번 해설 – 개발도상국 원조 부채 투자 채권 포트폴리오
- [PSAT 기출] 2020 5급 상황판단 나책형 25번 해설 – 소송구조 소송비용 재판비용 납입 유예 면제 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 24번 해설 – 주주총회 결의취소의 소 대표이사 이사 감사 주주 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 23번 해설 – 체육시설업 시설 등록 신고 목욕시설 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 22번 해설 – 빈집정비계획 철거 빈집 소유자 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 21번 해설 – 공무원 신분 임용 파산선고 금고 선고유예 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 19번 20번 해설 – 프로그램 명령문 cards input 중심어 명령문
- [PSAT 기출] 2020 5급 상황판단 나책형 18번 해설 – 태은이 휴일 외식 전시회 쇼핑 만족도 점수 합계 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 17번 해설 – A사업 상황별 대안 기대이익
- [PSAT 기출] 2020 5급 상황판단 나책형 16번 해설 – A청 업무능력 부서 평가항목 최종점수
- [PSAT 기출] 2020 5급 상황판단 나책형 15번 해설 – 과제 제출 점수 갑 을 병 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 14번 해설 – 교통사고 가해차량 번호 목격자 진술
- [PSAT 기출] 2020 5급 상황판단 나책형 13번 해설 – 시계 주사위 시계 문자판 말판 말 짝수 홀수 확률 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 12번 해설 – 내선번호 과장 사무관 주무관 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 11번 해설 – 숫자카드 만능카드 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 10번 해설 – 주민 투표 사업안 A안 B안 C안 논리퀴즈
- [PSAT 기출] 2020 5급 상황판단 나책형 9번 해설 – 도량 두 구 부 종 석
- [PSAT 기출] 2020 5급 상황판단 나책형 8번 해설 – 창렬 인터넷 면세점 가방 영양제 목베개
- [PSAT 기출] 2020 5급 상황판단 나책형 7번 해설 – 출산장려 경제적 지원 수당 월 수당액 지급
- [PSAT 기출] 2020 5급 상황판단 나책형 6번 해설 – 정무직 공무원 국가공무원법 지방공무원법 감사원장 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 5번 해설 – 질의민원 건의민원 고충민원 기타민원 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 4번 해설 – 농식품투자조합 유한책임조합원 업무집행조합원 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 3번 해설 – 청원경찰 배치 임용승인 직무감독 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 2번 해설 – 월령 개 맹견 목줄 입마개 법조문
- [PSAT 기출] 2020 5급 상황판단 나책형 1번 해설 – 적극행정 변호인 선임비용 지원결정 법조문
관련 문서
- 2020 5급 PSAT 해설 모음
- 5급 PSAT 상황판단 해설 모음
- 5급 PSAT 해설 모음
- 국가직 7급 PSAT 상황판단 해설 모음
- 국가직 7급 PSAT 해설 모음
- 민경채 PSAT 상황판단 해설 모음
- 민경채 PSAT 해설 모음
- PSAT 기출 해설 모음
- PSAT 명제 논리 문제 해설 모음
- PSAT 정언 논리 문제 해설 모음
- 정언 논리 공부 자료
- PSAT 추론 문제 해설 모음
- PSAT 강화 약화 문제 해설 모음
- PSAT 법조문 문제 해설 모음
- PSAT 논리퀴즈 문제 해설 모음