비전공자도 이해할 수 있는 AI 지식

책이 주는 핵심 메시지

인공지능은 당신을 대체하지 않는다. 인공지능을 이해하고 활용하는 사람이 당신을 대체할 뿐이다.

인공지능

인공지능의 역사

1956년: 인공지능이라는 용어 처음 등장.

1980년대: 인공지능 분야에서 머신러닝 알고리즘 활용.

2000년대: 딥러닝 등장. 데이터와 정답 입력하면 스스로 규칙 찾는 머신 러닝에 비해 훨씬 더 많은 데이터 학습할 수 있고 훨씬 더 풍부한 규칙 찾아낼 수 있게 되었다.

오픈소스

오픈소스는 프로그램의 소스코드를 공개하는 것을 의미.

영향력을 공고히 하기 위해 공개함. 또한 열린 연구 문화로 딥러닝 기술이 발전하는 데 엄청난 영향 끼침.

대표적 오픈소스: 리눅스. 투명하게 공개되어 사람들은 리눅스 기술력에 더욱 신뢰하게 되고 신뢰를 바탕으로 리눅스는 업계에 엄청난 영향력 끼침.

알파고

알파고는 딥러닝을 적용해 바둑 실력을 획기적으로 향상.

알파고는 정책망(사람이 만든 기보를 이용해 학습. 어디에 돌을 을지 정함)과 가치망(승패 여부를 예측하는 망)을 가진다.

	정책망	특징
1	사람의 기보를 이용해 학습한 정책망	57%정확도, 5단 수준
2	롤아웃 정책망	24% 정확도, 1,500배 빠름
3	스스로 대국하며 강화학습한 정책망	기보학습 정책망과 대전하면 80% 확률로 승리

알파고 대국 이후

알파고 제로 등장

최강의 바둑 인공지능. 기존 앞파고는 학습을 수행할 인간 바둑기사의 기보가 필요하며 이를 습득해 실력을 키웠다면, 알파고 제로는 자신과의 대국 통해 실력 쌓아나감

자율주행

자율주행 공식 (베이즈 정리)

베이즈 정리는 확률이라는 것은 믿음에 불과(?)할 뿐이며, 세상에는 절대 원칙이란 존재하지 않으므로, 무엇이든 조심스럽게 관찰하며 의심해야 한다고 말한다. 믿음을 지속적으로 업데이트하다가 균형에 이른다고 말한다.

자율주행도 믿음을 업데이트하는 베이즈 정리를 활용한다. 자율주행차는 새로운 신호가 들어올 때마다 기존의 믿음을 새로운 믿음으로 끊임없이 업데이트한다.

센서

레이더

자율주행차에서 레이더는 반사된 전자파를 분석해 많은 정보를 알아낼 수 있죠. 전자파는 빛의 속도로 나아가 순식간에 물체를 인식할 수 있고 야간이나 악천후에서도 안정적으로 작동하는 반면, 정밀하기 못하고 파장이 커 작은 물체는 측정하기 어렵다.

라이다

자율주행의 정체성을 표현하는 센서.

레이더가 전자파를 발사해 반사파를 측정한다면 라이다는 레이저 빛을 발사해 반사되어 돌아오는 것을 측정한다. 레이더에 비해 물체의 거리와 방향을 훨씬 더 정교하고 입체적으로 파악.

다만, 레이저 빛을 이용하는 특성상 악천후에 영향을 받아 안개, 비, 눈 입자에 빛이 반사되면 주변 환경 인식에 왜곡 발생.

	작동원리	장점	단점
레이더	전자파 이용	- 장거리 측정 가능 - 물체 내부까지 감지 - 날씨 영향 거의 안 받음	- 물체의 거리나 방향, 모양이나 구조 파악 어려움
라이다	빛 이용	- 정확하게 물체인식하고 밀도 있게 표현 가능	- 거친 날씨에 영향받음 - 장거리 측정 시 정확도 떨어짐

카메라

카메라는 인간이 사물을 인식하는 방식과 동일하게 환경을 인식할 수 있다.

차선의 경우 카메라만이 인식 가능. 차선은 형태를 띤 물체가 아니라서 레이더나 값비싼 라이다는 인식 불가.

카메라로 들어온 이미지 정보를 컨볼루션 신경망(이미지의 특징을 인식하고 이 특징을 모아서 학습하면 비로소 컨볼루션 방식의 딥러닝) 이용해 인간보다 더 뛰어나게 인식 가능.

테슬라는 라이더와 레이더 필요 없이 카메라만으로 자율주행 기술 구현이 가능하다고 말한다.

자율주행의 딜레마

기술 문제

2009년 에어프랑스의 AF447 편은 운행 중 오토 파일럿 기능이 멈추게 되고, 조종을 인간 조종사에게 넘기게 되었다. (테슬라도 위험 구간에 들어서면 자율주행이 해제되고 인간에게 임무를 넘긴다.)

하지만 이에 대응하지 못한 부기장으로 인해 해당 비행기에 탑승한 228명 전원이 사망하고 말았다.

부기장은 3,000 시간에 가까운 비행 경험을 가지고 있으나, 수동으로 조종해 본 적이 거의 없었다.

이처럼 자동화에 익숙해지면 고도로 훈련된 조종사조차도 기본적인 대응을 하지 못한 채 어처구니없는 사고를 내고 만다.

윤리 문제

질문:

광차가 선로를 따라 이동하고 있다.

선로에는 5명이 묶여 움직이지 못하고 있다. 선로를 변경하는 레버 옆에 서 있고, 선로를 변경하면 5명을 살릴 수 있다. 하지만 다른 선로에도 1명이 서 있어서 변경하면 그 사람이 치여 죽고 만다. 레버를 당겨야 할까?

공리주의에 따라 1명을 희생해 5명을 구하면 합리적일까?

자율주행차가 이런 상황을 직접 판단하고 누군가의 희생을 택하는 것이 과연 옳은 일일까?

자율주행차가 바꿀 미래

산업 전반에 엄청난 변화를 가져올 것이다.

언제든 앱으로 호출하면 집 앞까지 자율주행차가 달려와 대기하는 세상이 될 거라 개인이 더 이상 자동차를 소유할 필요가 없게 된다. 운전사라는 직업도 사라질 것이다.

더 이상 중간 지점에서 숙박을 할 필요가 없어 호텔 산업도 크게 영향을 받을 것이다.

자율주행차가 이동의 제약을 줄이면 대중교통이 편리한 입지의 의미가 약화되면서, 부동산 가격의 기준도 지금과는 많이 달라질 것이다.

검색엔진

우리는 매일 인터넷 검색을 한다. 하루에도 몇 번씩 검색 서비스에 쿼리를 날린다.

구글은 검색 광고를 도입해 엄청난 수익을 내고 있고 엄청난 문서를 색인하고 있다.

색인

검색엔진이 인터넷에 있는 문서를 수집해 검색에 적합하도록 보관하고 있는 것을 말한다.

구글 파일 시스템

효율적인 분산 파일 시스템. 아무리 큰 파일도 여러 대의 서버에 나누어 저렴한 비용으로 저장할 수 있게 되었다. 구글 파일 시스템은 초기 빅데이터 플랫폼의 원형이 되었다.

검색 시 잘 검색되는 문서

최신 문서: 최신 문서일수록 항상 점수가 높다.

품질 좋은 문서: 문서가 길수록, 문서 로딩이 빠를수록, 모바일에서 잘 보일수록 품질 좋은 문서로 간주된다.

검색엔진 최적화와의 싸움

검색엔진 최적화(SEO, Search Engine Optimization)를 시도하는 업체들은 여러 가지 실험을 통해 랭킹을 높이기 위해 끊임없이 도전하고 있다. 반면, 검색엔진 업체들은 쉽게 랭킹을 올릴 수 없도록 알고리즘을 개선하고 진화시킨다.

즉, 완벽한 알고리즘이란 존재하지 않는다. 알고리즘은 끊임없이 진화할 것이다.

기계번역

인공 신경망을 도입한 구글 번역 품질이 하루 만에 획기적으로 개선되었다.

기계번역이라는 용어는 1949년부터 논문에 등장하기 시작했다.

처음에는 규칙 기반 기계번역이 이용되었다. 하지만 규칙으로 처리되지 못하는 예외적인 상황이 많아 한계가 있었다.

1980년대부터 예시 기반 기계번역이라는 방식이 도입되었다. 규칙을 통해 언어를 ‘이해’하기보다, 경험을 통해 ‘모방’하는 형태로 접근했다.

2010년대 들어 딥러닝이 주목받기 시작하면서, 신경망 기반 기계번역이 도입되었다. 신경망 기반은 한발 더 나아가 문장 전체를 마치 하나의 단어처럼 통째로 번역해서 훨씬 더 자연스러운 번역이 가능하게 했다.

오랜 침체기에 빠져있던 기계번역은, 인공 신경망을 만나게 되면서 언어의 장벽을 무너트리고 있다.

챗봇

챗봇의 가슴 아픈 역사

이루다

이루다는 국내 스타트업이 개발한 챗봇으로 자유주제대화시스템을 기반으로 어떤 주제로든 자유롭게 대화할 수 있는 챗봇이었다.

딥러닝을 기반으로 한 이루다가 규칙 기반의 심심이와 가장 달랐던 점은 어떤 말을 할지 예측하기가 어려웠다. 그래서 불특정 다수의 실명이나 성소수자를 향한 혐오를 표현하기도 했다.

또한 자연스러운 대화를 위해 카카오톡 데이터를 두고 학습해 데이터의 출처가 문제가 되었다.

결국 출시 2주 만에 서비스를 중단하게 되었다.

테이

마이크로소프트가 개발한 챗봇.

트위터 사용자들과 대화하면서 스스로 학습하도록 디자인되었다. 학습을 통해 테이의 대화 능력이 더 향상하길 바랐던 마이크로소프트의 바람과는 달리 사람들이 테이에게 차별과 혐오, 욕설 등을 가르쳤다.

이로 인해 테이는 인종차별적 발언을 내뱉고 성소수자를 혐오했다.

결국 출시 16시간 만에 서비스를 중단하게 되었다.

컴파일러

컴파일이란 한 언어를 다른 언어로 바꿔주는 과정으로, 컴파일러는 인간의 언어를 컴퓨터가 이해할 수 있게 바꾸는 소프트웨어를 말한다.

GPT

2015년, 인류 전체에 이익이 되는 범용 인공지능을 목표로 비영리 인공지능연구소 오픈 AI가 발족했다. 2019년 마이크로소프트의 1조 원 투자에 힘입어 오픈 AI에서 언어 생성 모델인 GPT라는 엄청난 결과물을 내놓았다.

엄청난 크기의 모델과 방대한 데이터로 GPT-3 (GPT-3는 매개변수가 1,750억 개)은 인간의 언어를 완전히 이해한듯한 패턴을 보여주었다.

GPT-4는 글자뿐만 아니라 사진 내용을 정확하게 이해한다.

오픈 AI는 GPT-3 관련 기술은 공개했지만 GPT-4와 관련한 기술은 전혀 공개하지 않았다.

기술 비공개의 의미는 다음과 같은 2가지 의미를 지닌다.

- 언어 모델은 연구 단계를 넘어 제품화 단계에 돌입했다고 볼 수 있다. (실제로 유료로 서비스를 하고 있고 본격적으로 플랫폼 비즈니스를 진행할 제품화 단계에 도입함)

- 연구성과로 공개할 내용이 많지 않다고 예상할 수 있다.

기계가 언어를 이해할 수 있을까?

인간의 말을 이해하는 것처럼 보였던 컴퓨터는 사실은 언어를 숫자로 바꿔 확률을 계산할 뿐이다.

인공지능이 인간 같은 지능을 지녔는지 확인해 보는 튜링 테스트

앨런 튜닝은 <계산 기계와 지능>에서 ‘기계는 생각할 수 있는가? Can Machines Think?’라는 담대한 질문을 던지면서 ‘생각’의 정의를 내리는 어려운 과정을 탐구하는 대신에 인간이 생각한다고 여기는 행동을 기계가 흉내 낼 수 있다면 이를 ‘생각한다’로 판정하자고 제안했다.

이 발상을 바탕으로 제안한 테스트가 튜링 테스트, 즉 이미테이션 게임이다. 일종의 사고 실험으로 이를 통과하면, 즉, 기계가 인간을 잘 모방하면 기계가 지능을 지닌 것으로 판단하자고 제안했다.

튜링 테스트 예시

1번 방에는 인공지능, 2번 방에는 사람이 있다.

감독관들은 각각 1번 2번과 대화한다.

대화를 나눈 후, 진짜 사람은 몇 번 방에 있는지 묻는 질문에, 1번(인공지능)을 고른다면 인공지능은 튜링 테스트를 통과한 것으로 본다.

그렇다면 과연 튜링 테스트를 통과했다는 사실만으로 기계가 생각한다고 볼 수 있을까?

튜링 테스트 비판

존 설 교수는 튜링 테스트에 대한 비판으로 중국어 방 사고 실험을 근거로 든다.

중국어 방 사고 실험

방 안에 중국어를 모르는 사람이 들어간다.

방 안에는 중국어로 된 질문과 질문에 대한 대답 목록이 준비되어 있다.

이 방안으로 중국인 심사관이 중국어로 질문을 써서 안으로 넣으면 방 안의 사람(중국어를 모르는 사람)은 준비된 질문과 대답 목록에서 답변을 찾아 중국어로 써서 심사관에게 준다.

이렇게 하면 중국어를 전혀 모르는 사람도 단순히 책에 있는 답변을 찾아내서 튜링 테스트를 통과할 수 있다. 그렇다면 이 사람은 과연 중국어를 이해했다고 볼 수 있을까? 밖에서 보면 마치 방 안에 있는 사람이 중국어를 알고 있는 것처럼 보이지만 실제로는 규칙에 따라 기계적으로 대응하고 있을 뿐이다.

존 설은 이런 방 안에 있는 사람이 중국어 질문을 ‘이해’한다고 볼 수 없으며 마찬가지로 이렇게 행동하는 기계를 ‘생각’한다고 볼 수 없다고 말하며 튜링 테스트를 비판했다.

튜링 테스트 옹호

미래학자 레이 커즈와일은 《마음의 탄생 How to Create a Mind》에서 튜링 테스트만으로도 충분하다고 말한다.

존 설의 중국어 방 주장은 컴퓨터가 기호를 조작하기만 할 뿐 기호의 의미는 이해하지 못한다는 것이지만, 이는 우리 뇌가 신경 간 연결과 시냅스 세기를 조작하기만 할 뿐 그 의미는 이해하지 못한다는 말과 똑같다. 우리 인간의 뇌도 동일한 방식으로 작동하기 때문이다. 결국 존 설의 주장대로라면 인간의 뇌도 진정으로 어떤 것도 이해하지 못한다는 결론을 내려야 한다.

통계적 분석 과정을 거쳐 언어를 비롯한 여러 현상을 이해하는 것을 ‘진정한 이해’가 아니라고 한다면, 우리 인간 또한 같은 방식으로 이해하기 때문에 진정으로 이해하는 것은 감히 아무것도 없다고 할 수 있다.

인공지능에 대한 말말말

스티븐 호킹

인간은 경쟁하기도 전에 인공지능에 추월당하고 만다.

세계 최고의 머신러닝 연구자인 스탠퍼드대학교의 앤드루 응 교수

인공지능이 세상을 접수할 걱정을 하는 것은 화성에 인구가 너무 많아질까 걱정하는 것과 비슷하다

책을 읽고 나서

Chat-GPT가 나오고 나서 부쩍 인공지능에 관심이 생겨 AI, 인공지능 관련 책을 여러 권 읽었다.

여태껏 읽은 책들은 실제 AI 프로그램을 어떻게 써야 하는지, 인공지능을 어떤 식으로 받아들여야 하는지에 관해서였지 근본적인 인공지능 기술에 관한 내용이 아니었다.

이 책을 읽고 조금이나마 인공지능 기술에 대해서 이해하게 되었다.

머지않아 인공지능 시대가 열릴 것이고, 아니 이미 인공지능 시대는 왔고 이제 곧 인공지능 없이는 살아갈 수 없는 시대가 올 것이다.

미디어에서는 인공지능이 우리를, 우리의 직업을 대체할 거라 말하지만, 이 책은 인공지능이 우리를 대체하는 게 아니라, 인공지능을 이해하고 활용하는 사람이 우리를 대체한다고 말한다.

머지않아 인공지능을 잘 다루는 사람이 부의 피라미드 꼭대기에 앉아 있을 것이다.

인공지능 기술과 더불어 이 책은 우리에게 생각할 거리도 많이 던져준다.

자율주행 차가 윤리적인 선택을 내려도 되는지? 어떤 기준으로 윤리적인 선택을 내리게 프로그래밍해야 하는지?

인공지능이 과연 사람처럼 지능을 가졌다고 봐도 되는지?

튜링 테스트 관련해 찾아본 기사에서 최근 인공지능과 사람을 대상으로 실험을 했는데, 인공지능이 튜링 테스트에서 떨어졌다고 한다.

인공지능이 인간처럼 생각 못해서가 아니라 질문에 대한 답을 너무나도 논리적으로 말해서라고 한다.

인공지능시대에 접어들면서 우리는 여태껏 보도 듣지도 못한 문제를 해결해야 할 것이다.

그래도 늘 그렇듯...

인류는 잘 해낼 것이라 믿는다.

책 너머 인사이트