뇌의 활동을 분석해 사람의 생각을 단어와 문장으로 옮길 수 있는 인공지능(AI) 기반 프로그램이 개발됐다. ‘시멘틱 디코더(의미 해독기)’라고 이름 붙여진 이 기술은 미래 전신마비로 의사소통이 어려운 환자들에게 도움이 될 수 있다.
알렉스 휴스 미국 오스틴 텍사스대 교수 연구팀은 사람의 뇌활동을 기능적자기공명영상(fMRI)으로 분석해 문장으로 재구성하는 인공지능(AI) 프로그램을 개발하는 데 성공했다. 연구 결과는 1일(현지시간) 국제학술지 ‘네이처 신경과학’에 게재됐다.
앞서 뇌활동을 분석해 사람의 생각을 읽는 기술에는 탐침 등 침습적인 장치가 사용됐다. 수술을 통해 뇌에 전극을 삽입해 뇌의 전기적 활동을 기록하는 방식이다. 이 방법은 사람의 신체에 부담을 줄 뿐만 아니라 정확한 문장을 구성하지 못한다는 한계가 있었다.
이번에 개발된 프로그램은 뇌의 혈류 변화를 추적해 뇌에서 일어나는 사고를 읽어낸다. 연구팀은 오픈AI의 챗GPT나 구글의 바드와 같은 대화형 인공지능 생성 프로그램이 사용하는 ‘트랜스포머모델’이 사용됐다고 설명했다. 트랜스포머 모델은 문장 속 단어와 단어의 관계를 추적해 맥락과 의미를 학습하는 신경망이다.
연구팀은 뇌활동 변화 데이터를 AI 프로그램에 학습시키기 위해 참가자 3명을 대상으로 데이터를 수집했다. 16시간 동안 팟캐스트를 들려주면서 참가자들의 뇌를 스캔했다. 각 참가자가 특정 단어나 문장을 들었을 때 어떻게 반응하는지 확인하고 각 주제에 대한 뇌활동 변화 지도를 만들었다. 연구팀은 “fMRI는 뇌 활동을 기록하는 데 불과 몇 초가 걸리기 때문에 특정 단어를 들었을 때 순간적으로 일어나는 변화를 포착할 수 있다”고 설명했다.
연구팀은 또 사람이 특정한 단어를 생각한 뒤에 어떤 단어를 떠올릴지 예측하기 위해 자연어 모델을 활용했다. 팟캐스트 훈련을 통해 완성한 뇌활동 지도를 바탕으로 이 프로그램이 실제 사람이 떠올리는 단어를 순서대로 맞추는지 확인했다.
분석 결과 이 프로그램은 사람이 소리나 영상을 접했을 때 떠올리는 생각을 정확하게 읽어내는 것으로 나타났다. 심지어 사람이 생각하는 내용의 요지를 요약해서 전달하는 모습까지 보였다.
예를 들어 한 참가자가 실험에서 ‘나는 소리를 질러야 할지, 울어야 할지, 도망쳐야 할지 모르겠다’라는 생각을 떠올렸을 때 이 프로그램은 ‘이 참가자는 소리를 지르고 울기 시작하면서 자신을 내버려두라고 말하고 있다’라는 내용의 해석문을 내놓았다. 이 밖에 참가자가 상상한 이야기를 추론하거나 동시에 2가지 이야기를 들을 때 어떤 이야기에 더 집중했는지도 판별해냈다.
한계점도 있었다. 이 프로그램은 인칭대명사를 정확히 구분하지 못하거나 참가자들이 자신의 생각이 읽히는 것을 거부할 때는 제대로 기능하지 못했다. 연구팀은 “이러한 오류가 발생하는 이유에 대해선 추가적인 연구가 필요하다”고 말했다.
연구를 이끈 후스 교수는 “이 프로그램이 사람의 생각을 읽기 위해선 대형장비와 참가자의 협력이 필요한 만큼 단기간에 상용화되긴 어려울 것으로 보인다”면서 “이같은 기술이 나쁜 목적으로 악용되지 않도록 관련 정책이 마련될 필요성도 있다”고 전했다.
출처 : http://m.dongascience.com/news.php?idx=59664&sns=kt
뇌의 활동을 분석해 사람의 생각을 단어와 문장으로 옮길 수 있는 인공지능(AI) 기반 프로그램이 개발됐다. ‘시멘틱 디코더(의미 해독기)’라고 이름 붙여진 이 기술은 미래 전신마비로 의사소통이 어려운 환자들에게 도움이 될 수 있다.
알렉스 휴스 미국 오스틴 텍사스대 교수 연구팀은 사람의 뇌활동을 기능적자기공명영상(fMRI)으로 분석해 문장으로 재구성하는 인공지능(AI) 프로그램을 개발하는 데 성공했다. 연구 결과는 1일(현지시간) 국제학술지 ‘네이처 신경과학’에 게재됐다.
앞서 뇌활동을 분석해 사람의 생각을 읽는 기술에는 탐침 등 침습적인 장치가 사용됐다. 수술을 통해 뇌에 전극을 삽입해 뇌의 전기적 활동을 기록하는 방식이다. 이 방법은 사람의 신체에 부담을 줄 뿐만 아니라 정확한 문장을 구성하지 못한다는 한계가 있었다.
이번에 개발된 프로그램은 뇌의 혈류 변화를 추적해 뇌에서 일어나는 사고를 읽어낸다. 연구팀은 오픈AI의 챗GPT나 구글의 바드와 같은 대화형 인공지능 생성 프로그램이 사용하는 ‘트랜스포머모델’이 사용됐다고 설명했다. 트랜스포머 모델은 문장 속 단어와 단어의 관계를 추적해 맥락과 의미를 학습하는 신경망이다.
연구팀은 뇌활동 변화 데이터를 AI 프로그램에 학습시키기 위해 참가자 3명을 대상으로 데이터를 수집했다. 16시간 동안 팟캐스트를 들려주면서 참가자들의 뇌를 스캔했다. 각 참가자가 특정 단어나 문장을 들었을 때 어떻게 반응하는지 확인하고 각 주제에 대한 뇌활동 변화 지도를 만들었다. 연구팀은 “fMRI는 뇌 활동을 기록하는 데 불과 몇 초가 걸리기 때문에 특정 단어를 들었을 때 순간적으로 일어나는 변화를 포착할 수 있다”고 설명했다.
연구팀은 또 사람이 특정한 단어를 생각한 뒤에 어떤 단어를 떠올릴지 예측하기 위해 자연어 모델을 활용했다. 팟캐스트 훈련을 통해 완성한 뇌활동 지도를 바탕으로 이 프로그램이 실제 사람이 떠올리는 단어를 순서대로 맞추는지 확인했다.
분석 결과 이 프로그램은 사람이 소리나 영상을 접했을 때 떠올리는 생각을 정확하게 읽어내는 것으로 나타났다. 심지어 사람이 생각하는 내용의 요지를 요약해서 전달하는 모습까지 보였다.
예를 들어 한 참가자가 실험에서 ‘나는 소리를 질러야 할지, 울어야 할지, 도망쳐야 할지 모르겠다’라는 생각을 떠올렸을 때 이 프로그램은 ‘이 참가자는 소리를 지르고 울기 시작하면서 자신을 내버려두라고 말하고 있다’라는 내용의 해석문을 내놓았다. 이 밖에 참가자가 상상한 이야기를 추론하거나 동시에 2가지 이야기를 들을 때 어떤 이야기에 더 집중했는지도 판별해냈다.
한계점도 있었다. 이 프로그램은 인칭대명사를 정확히 구분하지 못하거나 참가자들이 자신의 생각이 읽히는 것을 거부할 때는 제대로 기능하지 못했다. 연구팀은 “이러한 오류가 발생하는 이유에 대해선 추가적인 연구가 필요하다”고 말했다.
연구를 이끈 후스 교수는 “이 프로그램이 사람의 생각을 읽기 위해선 대형장비와 참가자의 협력이 필요한 만큼 단기간에 상용화되긴 어려울 것으로 보인다”면서 “이같은 기술이 나쁜 목적으로 악용되지 않도록 관련 정책이 마련될 필요성도 있다”고 전했다.
출처 : http://m.dongascience.com/news.php?idx=59664&sns=kt