간단하지만 잘 모르는 AI상식
어느 날 저녁, 아이가 스마트폰을 내밀며 말했다. "아빠, AI한테 물어봐요. 뭐든 다 알아요."
나는 어이가 없었다.
내 전공이 AI수학인데, 이걸 말이라고 하는 건가 헐. 다 아는 게 아니라, 왠만큼 아는 거다. AI에 대한 기본 상식, 이걸 좀 체크할 필요가 있어졌다.
AI(Artificial Intelligence), 머신러닝(machine learning), 딥러닝(deep learning)의 차이
먼저 AI와 머신러닝, 딥러닝이라는 말부터 정리해두고 싶다. 세 가지가 다 비슷하게 들리지만, 크기가 다른 그릇이다. AI는 가장 큰 그릇이다. 사람처럼 판단하고 행동하는 기계를 만들겠다는, 큰 목표를 가리킨다. 그 안에 머신러닝이 들어있다. 머신러닝은 기계에게 규칙을 일일이 가르치는 대신, 데이터를 보여주고 스스로 패턴을 찾게 하는 방법이다. 그리고 그 머신러닝 안에 딥러닝이 있다. 딥러닝은 사람의 뇌 신경망을 흉내 낸 구조를 써서, 훨씬 복잡한 것을 배우는 방식이다. 요즘, 우리가 쓰는 AI 대부분은 이 딥러닝을 기반으로 한다.
쉽게 말하면, AI라는 큰 나무에서 머신러닝이 가지이고, 딥러닝이 그 가지에서 자란 굵은 줄기다.
지도학습(supervised learning)과 비지도학습(unsupervised learning), 어떻게 다를까
머신러닝 안에서도 두 가지 방식이 있는데, 지도학습과 비지도학습이다. 어렵게 들리지만, 실은 간단하다.
지도학습은, 선생님이 있는 공부다. 정답이 붙어있는 자료를 잔뜩 보여준다. 이 사진은 고양이, 이 사진은 개, 이런 식으로. 기계는 그걸 반복해서 보며 "이런 특징이 있으면 고양이구나"를 익힌다. 이메일 스팸 걸러내기나 암 진단 보조 프로그램 같은 것이, 이 방식을 쓴다.
반면, 비지도학습은 정답 없이 혼자 하는 공부다. 수천 장의 사진을 주면서, "네가 알아서 비슷한 것끼리 묶어봐"라고 하는 것이다. 기계는 색깔이 비슷한 것, 모양이 비슷한 것을 스스로 분류한다. 쇼핑몰에서 "당신이 좋아할 만한 상품"을 추천해주는 것이, 이 방식과 가깝다.
어느 쪽이 낫다기보다, 용도가 다르다.
AI는 왜 가끔 틀린 말을 할까 — 환각 : 할루시네이션(Hallucination)
AI가 답을 내놓을 때, 사실 그것은 정답을 찾는 것이 아니다. 이게 처음 들으면 좀 의아하다. AI가 틀린 말을 하면 오류가 났나 싶은데, 사실 AI는 처음부터 확률로 답을 고른다.
수많은 글과 자료를 학습한 뒤, 이 다음에 올 말로 가장 그럴듯한 것을 골라 이어붙이는 방식이다. 그래서 대부분의 경우 맞아 보이는 답이 나오지만, 가끔은 전혀 엉뚱한 것을 자신감 있게 내놓기도 한다. 이것을 할루시네이션, 우리말로 AI 환각이라고 한다. 없는 사실을 있는 것처럼, 틀린 연도를 맞는 것처럼 말하는 현상이다.
AI가 유창하게 말한다고 해서, 반드시 맞는 것은 아니라는 점. 이것이 AI 상식 중 가장 먼저 알아야 할 것이다. 신문 기사를 읽을 때 출처를 확인하듯, AI의 답도 중요한 것은 한 번 더 확인하는 습관이 필요하다.
생성형 AI는 어떻게 글과 그림을 만들까
생성형 AI라는 말도 요즘 자주 들린다. Claude, Gemini, ChatGPT처럼 글을 쓰거나, 이미지 생성 AI처럼 그림을 그려주는 것들이다. 이것들은 어떻게 글과 그림을 만들어낼까. 글을 만드는 생성형 AI는, 인터넷에 있는 방대한 텍스트를 학습했다. 책, 뉴스, 대화, 논문 등 셀 수 없이 많은 글을 읽으면서, 이런 맥락에는 이런 말이 어울린다는 패턴을 익혔다. 그래서 질문을 받으면, 그 패턴을 바탕으로 가장 자연스러운 문장을 이어나간다.
그림을 만드는 AI는 조금 다르다. 수백만 장의 이미지와 그 설명을, 함께 학습했다. 석양이 지는 바다라는 말과 실제 그런 사진들을 반복해서 연결 지어 보다가, 나중에는 그 말만 들어도 비슷한 이미지를 합성해낼 수 있게 된 것이다. 처음부터 그림을 그리는 것이 아니라, 배운 패턴들을 조합해 새로운 이미지를 만들어낸다. 창작이라기보다 정교한 재조합에 가깝다.
온디바이스 AI(On-device AI)란 무엇인가
마지막으로, 요즘 슬슬 들리기 시작하는 말이 있다. 온디바이스 AI다. 지금까지의 AI는, 대부분 인터넷을 통해 멀리 있는 서버와 연결되어 작동했다. 내 스마트폰에서 질문을 하면, 그 질문이 미국이나 어딘가에 있는 슈퍼컴퓨터까지 갔다가 답이 돌아오는 식이다.
그런데, 온디바이스 AI는 그 과정을 내 기기 안에서 끝낸다. 인터넷이 없어도, 서버까지 가지 않아도 내 손 안의 기기 스스로 판단한다. 삼성 갤럭시 최신 폰에서 통화 내용을 실시간으로 번역해주는 기능, 사진을 찍으면 자동으로 보정해주는 기능들이 이 온디바이스 AI 방식으로 작동한다. 속도가 빠르고, 개인 정보가 외부 서버로 나가지 않아 보안 면에서도 유리하다.
앞으로는, 이 방식이 더 넓게 퍼질 것이라고들 한다.
AI라는 것이 어느 날 갑자기 나타난 것처럼 느껴지지만, 사실은 수십 년간 조금씩 쌓아온 연구의 결과이다. 지금 우리가 만나고 있는 것은, 그 긴 시간의 결실이다.
AI 머신러닝 딥러닝, 할루시네이션, 생성형 AI, 온디바이스 AI. 낯선 말들이지만, 이렇게 하나씩 풀어보면 그리 어렵지 않다.
이걸, 통달할 필요는 없다. 전기가 어떻게 만들어지는지 몰라도 전등을 켜는 데는 문제없지만, 누전이 났을 때 당황하지 않으려면 기본 정도는 알아두는 것이 낫다.
마찬가지로, 우리는 AI의 기본을 알면 된다. 우리는 AI 개발을 하는 것이 아니라, 단지 이용만하면 된다. 어렵지 않다. 이와 관계된 모든 지식은, 이미 유튜브에 다 있다. 돈을 들여서 배우는 것은, 추천하지 않는다.
함께 보면 좋은 글
1. AI 번역으로 영어책 읽어보기
댓글
댓글 쓰기