비전공자도 이해할 수 있는 AI 지식 [리뷰]

비전공자도 이해할 수 있는 AI 지식

소개

인공지능의 역사와 기술

줄거리

1부 인공지능

초창기에는 규칙 기반으로 구현을 했다. 그러나 정해진 규칙 이외에는 문제를 해결하지 못하는 한계에 부딪힌다. 그래서 사람이 규칙을 입력하지 않고 기계가 스스로 규칙을 찾아 학습하는 기계학습(머신러닝) 방식을 이용하기 시작했다. 그렇게 알파고와 같은 인공지능이 탄생하게 된다.

딥러닝은 머신러닝의 일종으로 인간의 두뇌가 작동하는 구조를 본떠 만든 인공 신경망을 말한다. 수많은 데이터(빅데이터)를 입력받고 결과를 도출시키며 점점 원하는 답에 가깝게 수식을 스스로 조정하는 것이 딥러닝이다. 이러한 인공지능은 이미지 분야에서 성과를 내었고 기계번역, 자율주행 등에도 두각을 나타내고 있다.

2부 알파고

게임에서 나올 수 있는 모든 경우의 수는 트리형식으로 구현할 수 있다. 트리구조에서 모든 경로를 탐색하는 것이 완전탐색이라 한다. 거기서 불필요한 경로를 없애는 것을 가지치기라 한다. 이러한 경우의 수를 계산하여 컴퓨터가 체스로 인간을 이겼다.

그러나 바둑은 체스의 비해 경우의 수가 더 많았고 모든 계산하는 것은 불가능했다. 그래서 '일부만 무작위로 조사하면 원래의 확률과 비슷하게 나온다'라는 원리를 이용한 몬테카를로 트리 검색이라는 알고리즘을 바둑에 적용했다. 여기에 정책망(지점을 고르는 것)과 가치망(승리 가능성을 계산)이라는 인공 신경망을 더해 알파고가 탄생하게 된다. 이세돌을 이긴 알파고는 더욱 발전하여 노베이스 상태에서 스스로 학습하여 바둑의 제왕이 된 알파고 제로, 바둑 뿐만 아니라 모든 보드게임을 섭렵한 알파제로까지 나아가게 된다.

3부 자율주행

자율주행차는 소프트웨어 힘의 의지해 움직인다. 자동차는 센서를 통해 신호를 확인하고 위험 확률을 계산한다. 지속적으로 안전하다는 신호를 받는다면 확률상 안전하다고 판단하는 식으로 굴러간다. 자율주행에 사용되는 센서는 레이더, 라이다, 카메라가 있다.

레이더는 전자파를 이용한다. 정확하진 않지만 야간이나 악천후에도 잘 작동한다.
라이다는 빛을 이용한다. 정밀하지만 악천후에 영향을 받는다. 그리고 비싸다.
카메라는 물체를 특징별로 쪼개어 보는 컨볼루션 신경망을 이용하여 인식한다.

오토파일럿 중에 운전자에게 권한을 넘겨줘도 될지 판단이 어려운 문제, 누구를 희생할지 결정해야 하는 트롤리 문제 등 넘어야 할 산이 많지만 자율주행 차량이 나오면 부동산, 직업, 물류 등에 지대한 영향력을 끼칠 것으로 보고 있다.

4부 검색엔진

크롤러로 웹 페이지 정보를 모으고 색인으로 만드는 과정을 거친다. 권위 있는 문서가 많이 참조할수록 우선순위를 높이는 등의 200여 가지의 랭킹 조건을 이용하여 순서를 매긴다. 그리고 검색 시에는 단어의 빈도수를 이용한 점수와 최신, 품질, 유사도 등을 이용한 점수를 합하여 최종 결과를 보여준다.

그리고 결과가 적합한지 테스트하기 위해서 A/B 테스트를 진행한다. 사용자들이 같은 검색을 하였을 때, 한 그룹은 A를 보여주고 다른 그룹은 B를 보여주고 어떤 결과를 더 선호하는지를 비교하는 것이다. 최근엔 딥러닝을 통해 질문자의 의도를 파악해 오타가 있거나 복잡한 질문에도 답할 수 있게 되었다.

5부 스마트 스피커

애플에 들어가 있는 시리를 만들었던 창업자가 다시 차린 빅스라는 회사를 삼성이 인수하였고 빅스비가 되었다.

인간은 잘못 알아들은 단어도 상식에 기반해 보정해서 이해한다. 규칙 기반의 음성인식이 성과를 내지 못한 이유이다. 이제는 사용 확률이 높은 단어로 보정해 음성을 인식한다고 한다. 인식된 문장을 카테고리로 분류하고 의도를 파악한다. 그리고 정해진 템플릿에 정보를 채워 문장을 생성한다. 그리고 녹음한 목소리를 조합하는 USS 방식을 이용해 음성을 만든다.

6부 기계번역

인간의 언어에는 3가지 특징이 있다. 이러한 특징들로 인해 생각보다 쉬운 일이 아니라고 한다.

역사와 유행에 따라 무작위로 생겨나는 규칙
수많은 오류
언어의 모호성

기계번역 기술은 규칙 기반, 예시 기반, 통계 기반 등의 방법으로 점점 발전해 나갔다. 최근엔 문장을 통째로 한번에 번역했다. 여기에 어텐션이라고 주요 단어에 가중치를 두는 방법을 이용해 번역의 퀄리티를 높였다. 이제는 기계번역에 규칙을 입력하지 않고 스스로 규칙을 학습하도록 하고 있다.

7부 챗봇

데카르트의 좌표 덕분에 기하학을 방정식과 숫자로 표현할 수 있게 되었다. 섀넌의 디지털 논리회로와 정보 이론 덕분에 모든 정보와 숫자를 계산할 수 있게 되었다. 이러한 수학의 발전으로 인해 단어의 의미를 벡터로 표현하는 워드투벡으로 숫자로 표현할 수 있게 되었다. 벡터 공간에서 한 단어와 가까운 다른 단어를 유사단어로 인식한다. 이러한 숫자와 위치를 계산하여 사람의 언어를 해석하고 확률적으로 계산하여 문장을 만든다.

8부 내비게이션

교통 체증 여부를 예측하는 방법은 여러 조건들을 스무 고개하듯이 순차적으로 찾아가는 의사결정나무 방식이 내린 정답보다 랜덤 포레스트라 불리는 병렬적으로 여러 개의 의사결정 나무가 내린 정답을 종합하여 내린 결과를 이용하는 모델을 사용한다. 최단 경로를 찾는 알고리즘은 모든 경로를 검색하는 방식이 아닌, 필요한 경로만 골라 검색하는 A* 알고리즘을 사용한다.

9. 추천 알고리즘

고객의 구매 내역을 분석하는 방식을 장바구니 분석이라 하며 연관성 분석이라고도 한다. 컨텐츠 추천 시스템은 분류를 이용한 콘텐츠 기반 필터링, 나와 취향이 비슷한 고객이 시청한 영화를 추천해 주는 협업 필터링 방식이 있다. 비슷한 취향의 고객을 찾기 위해 행렬 인수분해 기법을 이용한다.

주요 내용

사실상 모든 딥러닝 라이브러리가 CUDA를 우선으로 지원하고 있고 CUDA 플랫폼의 지원 또한 워낙 강력하기 때문에 CUDA를 지원하지 않는 다른 회사에서 출시한 GPU는 사용하기가 어렵습니다. 마치 모든 게임이 윈도우를 지원하고 윈도우에는 DirectX가 있기 때문에 윈도우 OS를 사용할 수밖에 없는 것과 비슷하다고 할 수 있죠

알파고는 고수의 기보로 지도학습을 진행한 다음, 어디에 돌을 내려놓을지 판단하는 정책망을 만들었다. 그리고 정책망을 이용해 스스로 대국을 두어 강화학습을 진행한 다음, 승리할 확률이 얼마나 되는지 알아내는 가치망을 만들어냈다.

"지나치게 기술에 의존해서도 안 되며 그렇다고 기술에 공포를 느껴서도 안 된다"

빛Light과 레이더Raider의 합성어인 라이다LiDAR

자율주행이 보편화된다면 우리 모두 아예 기본적인 운전 방법을 잊어버리게 되지 않을까요? 수십 년간 자율주행에만 의지해온 사람이 긴급 상황이 발생했다고 갑자기 직접 운전을 할 수 있을까요?

우리말에서 가장 위험한 표현은, '여태껏 이렇게 해왔어'입니다.

지능은 결국 엄청난 연산 능력과 방대한 기억력뿐일까요?

후기

인공지능의 인기가 급부상하면서 엔비디아의 주가가 많이 올랐었다. 다른 GPU 업체들도 있을 텐데, 왜 엔비디아만 호재였을까. 인공지능에 사용되는 대부분의 딥러닝 라이브러리가 엔비디아의 CUDA라는 병렬처리 기능에 의존적이기 때문이었다. 더 빨리 이 책을 읽었더라면 엔비디아 주식을 사놓았을 텐데...

저자는 100번 중 1번 오류가 나오는 인공지능은 신뢰도가 떨어져 상용화는 아직 어려운 분야가 많다고 한다. 개인적으로 완벽한 인공지능은 만들 수 없다고 생각한다. 위험한 순간 자율주행의 권한을 넘겨주는 것과 같이 문제가 발생하였을 때 어떻게 처리를 하고 누가 책임을 질지 등의 해결 방법을 찾는 것은 어려울 것이다. 그러나 인간이 실수하여 발생하는 인재보다 인공지능이 실수하여 발생하는 문제보다 확률이 지극히 적어지는 순간이 온다면 사회적으로 어느 정도 타협해야 하는 때가 오지 않을까 싶다.

트롤리 문제는 자율주행에서 빠질 수 없는 문제인데, 이러한 문제를 '디트로이트 비컴 휴먼'이라는 비디오 게임에서는 조금 비인도적인 방법으로 풀어낸다. 그것은 사람의 얼굴을 인식하여 사회적으로 가치를 매긴 뒤, 값이 적은 곳을 희생시키는 방법이다. 공리주의적인 시각으로 보았을 땐, 모든 사람을 살릴 수 없다는 가정 하엔 합리적으로 보일 수 있다. 과연 현실에선 어떻게 이 문제를 풀어낼 수 있을까. 다가올 미래에는 공학자 보다 윤리학자가 더 중요한 시점이 올 것 같다.

인공지능이 어서 빨리 개발이 많이 되어서 키오스크가 음성인식이 되도록 했으면 좋겠다. UI를 'X'같이 만드는 경우가 많아 젊은 사람들도 키오스크 앞에서 쩔쩔매게 만드는 경우도 허다하다. 이러한 상황인데 더 나이가 많은 노년층의 사람들은 얼마나 불편할까. 최신 기기에 익숙하지 않음을 물론이거니와 노안으로 인해 글씨가 잘 보이지 않는 분들도 꽤 계시기 때문이다. 지금의 챗봇정도로만 인식하고 대답하고 주문을 받는 정도만 되어도 많은 불편함이 많이 해소될 것이라 생각된다.

추천

제목처럼 어렵지 않게 AI의 지식을 접할 수 있었다. 한 번 읽어보길 추천.

저작자표시 비영리 변경금지

'독서 > IT' 카테고리의 다른 글

데이터 천재들은 어떻게 기획하고 분석할까? [리뷰] (1)	2023.05.01
IT용어 도감 [리뷰] (0)	2023.01.06
면접을 위한 CS 전공지식 [리뷰] (0)	2023.01.05
그림으로 이해하는 AWS 구조와 기술 [리뷰] (0)	2022.12.18
알아 두면 쓸모 있는 IT 상식 [리뷰] (0)	2022.10.21

비전공자도 이해할 수 있는 AI 지식 [리뷰]