Yun Seong Hyeon

[블로그 기사 제출본] 학습 데이터가 필요 없는 인공지능 기술, 제로샷 본문

과학기술정보통신부 8기 블로그기자단 활동

[블로그 기사 제출본] 학습 데이터가 필요 없는 인공지능 기술, 제로샷

Yun Seong Hyeon 2023. 1. 18. 23:04

 

학습 데이터가 필요 없는 인공지능 기술, 제로샷

 

우리 일상 속으로 깊숙하게 자리 잡은 인공지능, 혹시 이러한 인공지능(AI)이 어떻게 만들어지는지 상상하거나 생각해보신 적 있으신가요? 우리 주변에는 알게 모르게 다양한 인공지능이 사용되고 있지만, 대다수의 사람들은 그 인공지능이 만들어지는 과정에 대해서는 잘 알지 못합니다.

현재까진 인공지능을 개발하여 실생활에 사용하기 위해서는 수만 가지의 상황에 AI를 학습(훈련) 시키는 과정이 필요하고, 학습의 과정을 통해 다양한 데이터를 축적해야 하므로 많은 시간과 자료가 필요합니다.

 

하지만, 최근 이러한 학습 과정을 없애거나 현저히 줄이는 방법이 개발 중이라고 합니다. 바로 제로 샷 학습 (zero-shot learning) 입니다. 먼저 제로 샷 학습에 대해 알아보기 전에 간단하게 인공지능이 만들어지는 과정에 대해 살펴보고자 합니다.

 

 인공지능은 어떻게 만들어 질까?

 

▲ 인공지능이 만들어지는 과정  ( 출처 :pixabay)

 

인공지능이란, 간단하게 설명하자면 인간에 의해 만들어진 인간과 유사한 지능을 갖춘 컴퓨터 시스템 중 하나이며, 인공지능은 학습의 과정을 통해 데이터에 포함된 패턴, 규칙 등을 컴퓨터 프로그램 속의 알고리즘으로 분석하여 새롭게 인식되는 행동의 결과를 추론할 수 있습니다.

 

이러한 인공지능을 만드는 과정에는 다양한 방법이 있고, 또 세부적으로 많은 갈래로 나누어 지지만, 가장 대표적으로는 큰 테두리의 기계학습과 기계학습 안에 포함된 딥러닝으로 나눌 수 있습니다. 기계학습은 인간이 일일이 각각의 문제에 대한 규칙과 해답 등의 데이터를 제공하여 학습시킨다는 특징이 있고, 딥러닝은 인간의 뇌와 유사한 인공신경망을 이용하여 학습할 데이터를 직접 입력하지 않아도 기계 스스로 학습한다는 특징이 있는데 우리가 여기서 주목해야 할 부분은 가장 큰 범주인 기계학습(machine learning)입니다.

 

 제로샷 학습이란 무엇인가

 

만약 뱀에 대해 학습한 경험이 없는 인공지능에게 ‘길이가 길고, 다리가 없고, 비늘이 있는 것’이라고 설명을 제공한다면 인공지능은 그것을 뱀이라고 말할까요? 제로 샷 학습을 통해 만들어진 인공지능은 이를 가능하게 합니다. 기계학습에서 제로 샷 학습을 이용하면 학습된 데이터가 분류되어 정리된 각각의 카테고리에 대해 의미적 이해를 바탕으로 카테고리 안에 속하지 않는 예제와 이전에 경험하지 못한 새로운 예제를 이해하고 분석할 수 있습니다.

 

인공지능의 기계학습은 여태껏 많은 세월을 거쳐감에 따라 계속해서 똑똑해지고 있지만, 각각의 카테고리에 잘 정리된 학습 데이터 세트가 없으면 두 개의 유사 한 객체 즉 이전의 학습한 적이 없는 데이터에 대해서는 비슷한 내용일지라도 전혀 새롭게 받아들여 인식하지 못하기 때문에 이를 구분할 수 없습니다.

 

반면에 인간은 뇌 속에서 각각의 카테고리 별로 따로 구분 짓지 않아도 쏘0타, 아0떼 등의 자동차를 보면 자연스럽게 승용차라고 말하듯이 수만 가지의 기본 객체 범주를 자연스럽게 식별할 수 있습니다. 제로 샷 학습은 인간의 이런 평범한 능력에서 영감을 받아 개발되고 있습니다.

 

* 지금 살펴보고 있는 제로 샷 학습은 전이학습(Transfer learning)에서 발전된 기계학습의 한 종류입니다. 전이학습이란, 최근 기계학습에서 각광을 받고 있는 방법들 중 하나인데 만약 문제 A에 대한 정답이 문제 B, C, D 등 다른 비슷한 문제에 존재할 경우 이 들 사이의 관계를 분석해서 공통점을 파악한 후 그 공통점을 이용해서 문제에 정답을 찾아가는 방식입니다.

 

 

 제로샷 학습의 원리

 

제로샷 학습에는 어떠한 원리가 숨어있을까요?

 

▲ 오카피 ,  얼룩말 ,  사슴 사진  ( 출처 :pixabay)

원리에 쉽게 다가가기 위해 오카피를 예로 들어보겠습니다. 오카피를 실제로 본 적이 없는 아이에게 얼룩말과 사슴의 사진을 보여주고 두 동물의 특징을 일부분 닮은 동물을 오카피라고 설명해 준다면 이 아이는 여러 장의 동물 사진과 함께 오카피의 사진을 보여줬을 때 그 속에서 오카피의 사진을 뽑아 그것을 오카피라고 추론하여 말할 것입니다.

 

그 아이는 실제로 오카피를 본 적은 없지만, 얼룩말의 줄무늬와 사슴의 얼굴을 가진 동물이란 특징을 파악하여 오카피라는 결론에 도달할 수 있었습니다. 하지만, 인공지능은 이전에 학습된 데이터와 단순히 보이는 정보에만 의존하기 때문에 오가피에 대해 직접적으로 학습한 경험이 없다면 오가피를 구분하지 못할 것입니다.

 

인공지능은 잘 정리되어 일정한 틀에 맞게 분류된 데이터가 매우 중요합니다. 인공지능은 학습의 과정을 거치며 수집된 데이터(이미지나 텍스트)를 수학적으로 표현하여 분류하고, 알고리즘이 데이터를 분류하기 위해 수집된 데이터에 대한 설명을 남깁니다. 제로 샷의 인공지능 학습(훈련)은 이러한 수학적 표현식을 대상으로 진행하기 때문에 인공지능은 이를 별도의 카테고리에 각각 분류합니다.

 

이후 제로 샷 학습은 특정 문제에 대한 학습을 받은 경험이 없어도 앞서 저장된 데이터를 통해 이를 자유자재로 변형하고 해석하며 학습했던 경우와 학습 경험이 없는 경우 사이의 특징을 분석하여 답을 예측하게 됩니다.

 

 

 우리 주변에 제로샷이 사용된 사례

 

알고보면 제로샷은 우리가 이미 익숙하게 사용하고 있었을지도 모릅니다.

 

최근에 인공지능의 학습법으로 제로 샷이 연구되기 이전부터 제로 샷 프로세스를 실생활에서 이용할 수 있게 개발해낸 곳이 있습니다. 바로 G사의 번역 시스템입니다.

 

▲ 구글 번역 사이트

 

G사는 지난 2015년 9월부터 인공지능 기반 기술 중 하나인 인공신경망을 자사의 번역 시스템에 이식하기 시작했고, 다음 해 11월 구글 인공신경망 기계번역(GNMT)이라는 이름으로 총 16개의 언어쌍을 최초로 지원하기 시작했습니다.

 

G사의 번역 시스템에 사용된 제로 샷 번역 기술은 마찬가지로 전이 학습의 일종으로, 시스템이 한 번도 해보지 않았던 언어 간 번역을 다른 언어 사이의 번역 데이터를 활용해 유추해 내는 기술로 앞서 소개한 제로 샷 기술과 매우 흡사합니다.

 

▲  발전된 인공지능  ( 출처 : 구글이미지 )

 

지금 까진 학습된 데이터의 양으로 AI의 정밀도가 판단되었고, 수많은 데이터 학습에만 의존해왔습니다. 하지만, 앞으로 제로 샷 기술이 더 발전한다면 데이터 학습의 과정이 생략됨에 따라 비용과 시간이 절약될 것이고, 기존에 데이터에만 의존하던 인공지능 트렌드가 점차 변화해 나아갈 것이며, 더 심화된 작업을 수행할 수 있는 인간의 역량을 뛰어넘을 궁극의 AI에 한걸음 더 다가갈 수 있을 것이라 생각합니다.

 


https://blog.naver.com/with_msip/221886769247

 

인공지능의 시대, 데이터가 필요 없는 제로샷 학습!

우리 일상 속으로 깊숙하게 자리 잡은 인공지능, 혹시 이러한 인공지능(AI)이 어떻게 만들어지는지 상상...

blog.naver.com

 

Comments