[알파고vs커제 대국] 이세돌 꺾은 ‘알파고 v.18’끼리 대결 반복하며 기보 완성

[알파고vs커제 대국] 이세돌 꺾은 ‘알파고 v.18’끼리 대결 반복하며 기보 완성

홍희경 기자
홍희경 기자
입력 2017-05-23 23:20
수정 2017-05-24 03:04
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0

더 강해진 ‘알파고 2.0’

강화학습 통해 ‘또 한번의 진화’
대국 내내 거침없는 ‘한수 한수’
구글의 바둑 인공지능(AI) 알파고가 강화학습(reinforcement learning)을 통해 또 한번의 진화에 성공했다. 알파고가 중국 저장성 우전 국제인터넷컨벤션센터에서 23일 열린 ‘바둑의 미래 서밋’에서 중국의 커제 9단을 첫판부터 무너뜨리자 AI 전문가들은 “예측했던 결과”란 반응을 보였다. 그렇더라도 알파고가 대국 내내 망설임 없이 수를 놓았다는 점, 지난해 3월 이세돌 9단과의 대국 당시와 다르게 바둑 전문가들을 실소하게 만든 의외의 실수를 하지 않았다는 점 등은 기대 수준을 뛰어넘은 장면으로 평가받았다.

●작년엔 아시아 최고수들의 기보로 학습

다른 소프트웨어처럼 ‘알파고’도 진화를 거듭해 왔다. 2015년 10월 판후이 2단과의 대국에서 승리한 ‘알파고 v.(버전) 13’이 유럽 기사들의 아마추어 기보에 의존해 기계학습(딥러닝)을 했다면, 지난해 이세돌과의 대국에 나선 ‘알파고 v.18’은 아시아 최고수들의 기보를 학습해 4승1패를 했다. 이때까지만 해도 알파고는 인간 최고수의 바둑을 흉내내는 수준으로 인식됐다.

이번 커제와의 대국에 선보인 ‘알파고2.0’은 강화학습을 통해 연마했다. 강화학습이란 추가로 기보를 더 입력하는 게 아니라 이세돌을 꺾은 ‘알파고 v.18’끼리 대결을 반복하며 기보를 완성해 갔다는 뜻이라고 전문가들은 설명했다. 이와 관련, 대국에 앞서 알파고 산파인 데미스 허사비스 구글 딥마인드 최고경영자(CEO)는 “인간의 기보를 입력할 필요가 없었고, 저전력으로 구동됐다”고 밝힌 바 있다.

강화학습은 인간이 돌발적인 상황을 직관을 발휘해 돌파하는 것을 흉내낸 알고리즘으로 이뤄진다. 가용할 수 있는 자원을 활용해 목적을 달성하기에 최적화된 방식을 수없이 고려한 뒤 실제로 감행, 시행착오를 거쳐 체화하는 방식이다. 허사비스는 지난해 방한 중 KAIST 강연에서 1980년대 유행했던 전자오락기의 벽돌깨기 게임을 활용해 AI 강화학습을 설명한 바 있다. 아래 판에서 공을 튕겨 내 위쪽에 있는 벽돌을 깨는 게임을 AI에게 시키자 처음 100회까진 잘 못했지만, 300회쯤 게임을 반복하자 아래 판으로 공을 받아야 게임에서 이긴다는 점을 AI가 학습해 내고, 500회쯤에 이르자 게임 고수의 면모를 보였다는 것이다. 사람 역시 같은 방식으로 게임을 연마한다.

●“AI의 실수 발견·시정… 혁신적 역량”

익명을 요구한 국내 AI 전문가는 알파고가 지난해 이세돌과의 대국 때와 다르게 ‘의외의 실수’를 전혀 하지 않은 모습에 주목했다. 그는 “AI의 실수가 어디에 있었는지 발견해 내는 것은 매우 어려운 일”이라면서 “그것을 알아내 시정한 자체가 높이 평가받을 혁신적인 소프트웨어 역량”이라고 치켜세웠다. 하드웨어적 개선도 있었다. 더버지 등 외신은 이번 알파고에 지난해 대국에서 구글이 고안한 AI용 칩인 T텐서프로세서유닛(TPU) 2세대가 활용됐을 가능성이 높다고 보도했는데, TPU 2세대가 적용됐다면 지난해보다 알파고의 연산 속도가 몇 십배 이상 빨라졌을 것으로 보인다.

최상의 경지에서 한 걸음 더 나아간 알파고의 진화상은 국내 AI 연구계에 허탈감을 안겨 주기도 했다. 지난해 ‘알파고 충격’으로 AI 열풍이 분 이후 AI가 빠르게 따라갈 수 있는 분야가 아니라는 자각도 얻었기 때문이다.

김진형 지능정보기술연구원(AIRI) 원장은 연합뉴스와의 인터뷰에서 “지난해 알파고 덕분에 우리나라 정보통신기술(ICT) 업계와 정부가 AI 연구의 중요성을 실감하게 됐다”면서도 “금방 따라갈 수 있는 분야가 아니며 우리나라 AI 연구개발 수준은 미국 등과 큰 격차가 있다”고 설명했다. 그는 “데이터 수집, 분석 기술을 중심으로 더 (연구) 노력을 기울여야 한다”고 덧붙였다.

●이번엔 ‘AI 공포증’ 대신 활용 기대감↑

알파고를 처음 접한 지난해 일각에서 이른바 ‘AI 공포증’이 생긴 것과 다르게 AI의 활용 가능성에 대한 기대감이 높아진 것도 달라진 부분이다.

허사비스는 “알파고에 사용된 기계학습 방식은 이미 에너지 절약, 의료 진단, 헬스케어 등 다양한 부문에서 중요한 문제를 해결하는 데 사용되고 있다”고 설명했다. 이어 “기계학습은 또 여러 구글 제품에 활용돼 불가능했던 일을 현실로 만들고 있다”면서 “사람들은 이제 구글 포토를 사용해 눈 오는 날 찍은 강아지 사진을 바로 검색해 찾을 수 있고, 최근 구글 번역은 지난 10년간 있었던 품질 개선을 모두 합한 것보다 더 큰 개선을 한번에 이뤘다”고 덧붙였다.

지난해 이세돌과의 대국 전 알파고의 승리를 전망했던 서울과학종합대학원 빅데이터학과의 김진호 주임교수는 “주민등록등본을 뗄 때 지문 인식을 하는 것, 스팸메일을 걸러 내는 장치 등이 모두 알파고와 비슷한 AI의 영역”이라고 설명했다. 김 교수는 “알파고가 ‘바둑의 신’처럼 보이지만 사실 알파고는 스스로 바둑을 두는지 인식하지도 못한 채 대국에서 이기는 최적의 방법을 찾는 기계일 뿐”이라면서 “기후예측, 신약 개발 등 최적화된 방법을 찾아야 하는 모든 분야에서 활용될 수 있다”고 설명했다.

홍희경 기자 saloo@seoul.co.kr
2017-05-24 9면
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
광고삭제
광고삭제
위로