배너
닫기

테크노트

배너

인지 기능에 데이터 구동형 모델로 다가간다

URL복사
[선착순 마감 임박] AI분야 특급 전문가들과 함께 AI로 우리 기업의 미래 경쟁력을 확보하는 방법을 공유합니다. AI 비즈니스 개발 융합 컨퍼런스에서 확인하세요 (5/3, 코엑스3층 E홀)

신경과학 분야에서는 계측 기술의 급속한 발전으로 신경 활동의 측정 방법과 그에 의해 얻어지는 데이터가 급속하게 진화하고 있다. 전극을 직접 대상 영역에 꽂아 신경세포의 활동을 전기적으로 측정하는 전기생리학적인 측정에서는 동시에 100개 오더(최신 Neuropixels에서는 1,000개 오더)의 세포를, 대상 동물이 과제를 수행하는 동안에 실시간으로 몇 시간 이상 측정할 수 있다. 또한 칼슘 이미징 등의 신경 활동을 광학적인 활동으로 변환해 측정하는 방법이라면, 시간 정도가 떨어지지만 1000개 오더(100000개를 취할 수 있다는 이야기도 있다)의 세포 활동을 며칠에 걸쳐(!) 측정할 수 있게 됐다. 즉, 신경과학 분야에서 연구자는 매우 큰 데이터에서 신경계 정보 처리의 바탕에 있는 원리·기구를 추출해야 하는 과제에 직면해 있다.

 

이 글에서는 이 대자유도 데이터와 씨름하고 있는 신경과학에서 급속히 발전하고 있는 역학계적 견해·해석 방법을 소개한다. 여기서는 데이터 해석뿐만 아니라 순환 신경망(RNN)을 이용한 데이터 구동형 모델의 접근법이 많이 이용되고 있으며, 이 접근법을 중심으로 설명하고자 한다.

 

대자유도 데이터로서의 신경 활동

 

일찍이 2000년대 초반까지는 신경세포의 활동을 측정하기 위해서는 전극을 삽입하고, (동시에는) 고작 몇 개 정도의 신경세포 활동을 측정하는 연구가 많았다. 예를 들어 Kim과 Shadlen은 시각 자극의 작업 기억 과제를 수행할 때의 원숭이 외측 전두전야(dlPFC)로부터 몇 개의 신경세포 활동을 측정, 의사 결정과 상관되는 타이밍에 선택적으로 발화하는 세포가 검출되어 있다. 이와 같이 특정의 인지적 이벤트(의사 결정이나 과제와 관련된 자극 등)에 상관해 선택적으로 발화하는 세포를 동정(同定)하고, 그러한 각 처리와 대응하는 세포를 조합함으로써 대상 영역에서 이루어지고 있는 정보 처리를 이해하는 것이 주류로, 큰 성과를 거두어 왔다.

 

그러나 한 세포 레벨의 측정에서는 시행할 때마다 편차가 매우 큰 점, 반드시 1개의 인지 이벤트에 대응하는 세포만이 아니라는 점 등으로 인해 한 세포 레벨의 해석에는 한계도 있었다. 이러한 때 마침 기술 발전이 대규모의 다신경 계측을 가능하게 함으로써 대자유도 데이터의 신경세포 활동으로부터 신경계의 정보 처리를 밝히는 접근법이 현재 활발하게 이루어지고 있다.

 

그러면 대자유도의 신경 활동 데이터로부터 어떻게 신경계의 정보 처리를 이해할 수 있을까? 기본적인 방법은 ‘어떠한 방법으로 차원 축약을 해서 눈으로 본다’이다. 여기서 차원 축약의 방법은 고전적인 주성분 분석(PCA)에서부터 비선형의 압축 방법(ISOMAP, tSNE) 등 다양하며, 현재에도 여러 가지 방법이 시도되고 있다.

 

N개의 신경세포로부터 측정한 시계열 데이터 x(t)는 N차원 상의 궤도가 된다. 이것에 대해 앞에서 말한 방법으로 차원 압축을 실시함으로써 저차원화되고 가시화된 신경 활동의 궤도(군)를 얻을 수 있다. 예를 들어 운동야의 신경 활동을 팔의 리칭 과제로 예를 들어본다(이미지도 그림 1). 우선 각 시행이 동일한 궤도를 그리고 있다는 것을 알 수 있다. 또한 각 인지적 이벤트에 대응한 상태군이 어느 정도 굳어져 있는 것 등도 알 수 있다. 이와 같이 신경계의 정보 처리는 다차원 패턴이 저차원 공간으로 압축된 형태로, 시시각각 시간이 변화함으로써 이루어지고 있다는 것을 알 수 있게 됐다. 그리고 측정된 궤도를 따라 신경 활동이 변화하는 역학계가 배후에 있다고 생각되므로 (단 데이터만으로는 그것이 무엇인지는 알 수 없다) 이 역학계의 특징을 이해하는 것이 신경계의 정보 처리를 이해하는 데 중요하다.

 

 

신경 활동의 배후에 있는 역학계적 구조

 

신경 활동의 배후에 있는 역학계를 이해하기 위해 갑자기 데이터에 집중하는 것이 아니라, 이론적인 틀로서 어떠한 것이 제안되고 있는지를 우선 살펴보기로 한다.

 

지금까지 신경 정보 처리를 담당하는 역학계적인 구조로서 다양한 프레임이 제안되어 왔다. 그 중에서 가장 널리 인지되고 있는 것이 고정점 어트랙터이다(그림 2 (a)). 문헌 ‘Neural networks and physical systems with emergent collective computational abilities’이 제안한 이래 많은 모델뿐만 아니라 실험에서도 그 존재를 근거로 논의되는 경우가 많다. 오리지널 모델이나 그 관련 모델은 연상기억 모델로, 리아푸노프 함수(Lyapunov function)로서 에너지를 정의할 수 있고 기억한 패턴=고정점 어트랙터로 수렴하는 것이 보증되어 있는 모델인데 신경계 실험으로서 자주 가정되는 것은 Wang(그림2 (a))과 같은 의사 결정의 틀로 이용되는 경우가 많다. 즉 선택(행동)이란 대응하는 뉴런(클러스터)의 활동이 선택적으로 상승하는 것으로, 상승한 상태가 어트랙터로 되어 있다고 하자. 그러면 신경 활동 패턴은 그 어트랙터(=선택)를 향해 수렴한다. 이 어트랙터에 수렴하는 궤도가 해당 선택이 선택되는 행동의 배후에 있다고 생각하는 것이다. 어트랙터 등은 측정으로는 알 수 없으므로 실제로 동물 실험에서는 궤도가 정체되어 있는 점으로 관측되는 경우가 많다.

 

 

고정점 어트랙터는 한번 신경 활동이 수렴한 후에는 변화가 없는 정적인 모델이지만, 실제 신경 활동 다이내믹스는 좀 더 동적이고 그 모델화도 필요하다. 최근 많이 연구되고 있는 것이 metastable attractor 모델(그림 2 (b))로, 이것은 고정점 어트랙터 사이를 노이즈로 전이시키는 모델이나 불안정화시켜 전이시키는 모델이다. 또한 이것과 유사한 모델인데, 어트랙터가 아닌 새들을 가지고 있고, 이 새들을 헤테로클리닉 사이클(Heteroclinic Cycle)로 연결하는 모델도 제안되어 있다. 이러한 metastable state를 변천하는 신경 활동은 실제로 관찰되고 있다. 예를 들어 미각계의 신경 활동을 측정하면, 주어진 물질에 의존해 다른 상태 변천을 볼 수 있다. 또한 동일한 물질에 대해서는 동일한 순서로 패턴 전이하지만, 그 전이 시간은 시행할 때마다 다른 것을 나타내고 있다. 즉, 시행할 때마다의 편차가 궤도 차이가 아니라 같은 궤도 상의 시간 발전 속도의 차이로 표현되어 있어 흥미롭다.

 

여기까지는 저차원의 구조였는데, 좀 더 고차원의 구조가 신경계 정보 처리의 배후에 존재하는 것은 아닌가 하는 모델도 제안되어 있다. 그것이 Kaneko 등에 의한 카오스적 편력이다. 저차원의 구조가 metastable state와 같이 되어 있는데, 그 사이를 카오스적으로 변천하는 모델이다. 앞에서 소개한 metastable state와 같이 정해진 전이를 하는 것이 아니라, 전이가 카오스적으로 되어 있어 전체적으로 고차원의 역학계적 구조를 이루는 모델이다.

 

다음으로는 앞으로 발전할 것으로 기대되는 (하고 있는) 관점을 소개하려고 한다. 이것은 입력에 따른 변화를 어떻게 정보 처리의 이해에 도입할 것인가 하는 관점이다. 신경계가 통상적으로 실시하는 정보 처리에서 신경 활동의 변화는 외부 입력으로 완전히 결정되는 (피드포워드 네트워크 등에 의한 정보 처리가 해당된다) 것도 아니고, 반대로 완전히 입력으로부터 분리되어 자려적으로 시간 발전하고 있는 것도 아니다. 즉 내적으로 자율적으로 변화하는 자려적 역학계가 있고, 거기에 시간 변화하는 입력이 그 다이내믹스를 변화시키는 비자력계이다. 이러한 (시간적으로 변화하는) 입력이 어떻게 신경 활동 다이내믹스를 변화시키고 결과적으로 어떠한 정보 처리를 하고 있는지에 대한 관점은 그 중요성에도 불구하고 지금까지의 연구로는 부족하다고 느껴진다. 위에서 소개한 모델도 입력은 초기 조건으로 주어지는 경우가 대부분이며, 그 후에는 자려계로서 상태의 시간 발전이 이루어진다. 나중에 설명할 예정인 데이터 구동형 모델에서는 입력이 파라미터로서 들어가 있는 경우도 있지만, 이들이 어떻게 변화를 시키는지에 대해서는 그다지 잘 조사되어 있지 않다. 저자 등의 그룹에서는 이 점을 자세히 조사하고 있으며, 연상기억 등의 정보 처리가 입력 강도에 의한 분기 구조를 형성함으로써 이루어진다고 하는 모델을 제안하고 있다.

 

이상과 같이 역학계로서 신경 활동을 생각함으로써 고정점 등의 역학계적 구조에 따라 신경 활동 패턴이 변화해 가고, 그것에 의해 정보가 처리되어 가는 신경계의 정보 처리 모습이 떠오른다. 여기서 다룬 모델은 각각 배타적으로 되어 있는 것이 아니라, 실제 신경의 정보 처리에서는 부분적으로 각각 다른 모델에 가까운 프로세스가 이루어지고 있는 것으로 생각된다.

 

데이터 구동형 모델이란

 

앞에서는 고차원 데이터의 신경 활동을 어떻게 해석할 것인가를 개략적으로 설명했다. 그렇다면 이것으로 신경 활동이 어떠한 정보 처리를 하고 있는지 충분히 이해했을까? 여기서는 앞에서 소개한 모델을 참조로 그 현상론적 특징을 논의하고 있을 뿐으로, 왜 그것이 생기는지에 대한 기구에는 대답이 되어 있지 않으며 원리적으로 대답할 수 없다. 따라서 어떠한 모델을 가정하고, 그 모델의 데이터 설명력을 조사함으로써 배후에 어떠한 기구가 있는지 알아내야 한다.

 

이를 위해 최근 신경과학 분야에서 리버스 엔지니어링이라고도 불리는 데이터 구동형 모델이 많이 이용되고 있다. 이들은 간단히 말하면, 어떤 실험에서 얻은 데이터를 해석하기 위해 해당 실험 프로토콜과 ‘동일한’ 프로토콜을 이용해 컴퓨터상에서 RNN을 학습하고 대상 동물의 신경계를 모방한 모델을 만들려고 하는 것이다. 한번 이러한 모델이 가능하면 리아푸노프 지수나 시냅스 결합 분포의 고유값 분포 등 실제 실험으로는 측정할 수 없는 다양한 양을 계산․해석할 수 있어 신경계의 정보 처리 기구를 해명할 수 있을 것으로 생각하는 접근법이다(그림 3).

 

 

실제로 어떠한 결과를 얻을 수 있는지는 나중에 구체적인 예를 들어 설명하기로 하고, 여기서는 필자 등의 연구(그림 4)를 예로 들어 어떻게 모델을 만드는지를 설명한다. 이 연구에서는 청각 자극의 연합 과제(high-low frequency의 청각 자극과 레버의 좌우 핥기)를 이용하고 있다. 이를 위해 처음에 fixation cue가 주어지고, 그 다음에 sensory cue가 주어진다. 쥐는 그 주파수에 따라 레버의 좌우를 핥고, 정답일 경우에는 보상으로 물이 주어진다(그림 4 (a)).

 

 

이러한 신경계의 실험 과제에 대해 어떻게 모델을 구축할 것인가? ‘동일’한 프로토콜에 기초해 RNN를 학습한다는 것은 구체적으로 어떻게 하는 것인가? 우선 대상 영역에 대응하는 RNN를 준비한다(그림 4 (b))고 해도 어느 영역의 실험에서도 동일한 RNN를 준비하는 경우가 많다. 다음으로 RNN에 대한 입력으로는 실험에서 이용되는 큐(context cue, fixation cue, sensory cue, go cue 등)가 채용되는 경우가 많다. 이 예에서는 처음에 주는 청각 자극을 모방한 입력을 일정 시점에서 RNN에 제공한다. 여기서 입력 패턴은 청각야의 주파수에 대한 토노토피(Tonotopy)를 고려해 가우시안 패턴으로 제공하고 있다. 청각 자극의 주파수 차이는 가우시안 패턴의 중심값 차이로 주어진다. 청각 자극 제시 후 실험에서 쥐는 좌우 스파우트를 핥고 정답 여부에 따라 보상이 주어진다. 모델에서도 동일한 ‘행동’에 따라 보상이 주어지고 강화학습의 틀에서 네트워크의 결합이 변경된다. ‘행동’이란 2개의 출력 뉴런이 각각 좌우 핥기의 행동에 대응하는 것으로 되어 있으며, 그 어느 쪽의 활동이 우위에 있는가에 따라 모델이 오른쪽 핥기, 왼쪽 핥기를 했는지가 결정된다(여기서는 좌우의 출력에 따라 보상을 주는 강화학습을 이용하고 있지만, 일반적으로는 출력 뉴런의 시계열 전체에 대해 이래야 한다는 교사 신호를 준비하고 Hessian free법 등을 이용해 RNN의 교사학습을 한다). 이와 같이 모델에 대해 실험의 cue에 대응하는 입력, 행동에 대응하는 출력을 설정함으로써 실험을 모방한 RNN를 구축할 수 있다.

 

이러한 방법으로 RNN을 학습하고, 이것이 성공하면 정의상 RNN의 ‘행동’은 실제 실험 동물의 행동과 같아질 것이다. 또한 신경 활동의 레벨에서도 ‘동일’하다면, 여기서 학습한 RNN는 행동과 그것을 만들어내는 신경 활동을 모방할 수 있는 의사적인 실험동물이 된다고 볼 수 있을 것이다. 그리고 이 의사적인 실험동물을 이용해 다양한 해석을 할 수 있다.

 

이와 같이 측정 데이터의 해석보다 더 깊은 해석을 할 수 있는 접근법이지만, 앞에서 말한 설명의 끝부분에 ‘동일’하다는 그다지 well-defined 되지 않은 어구가 나와 있는 점에 이 접근법의 문제점이 있다. 즉, 실험과 ‘동일’한 프로토콜로 학습하고, ‘동일’한 신경 활동을 생성하는 구조이지만, 이 유사성은 상당히 애매한 것이다. 프로토콜로 말하면 반드시 모든 cue가 채용되는 것도 아니고, 그 타이밍이나 지속 시간도 실험과 같지 않다. 연구에 의해 흥미 있는 신경 활동의 역학계적 구조가 실험·모델에서 모두 나오면 된다는 것이 현 상태이다. 또한 학습 방법도 교사학습과 같은 생물학적 타당성에 의문이 있는 방법을 이용하는 경우가 많아 모델의 정당성은 앞으로 더 깊이 논의돼야 할 점이라고 생각한다.

 

구체 예

 

그렇다면 구체적으로 어떠한 것을 알 수 있는가? 여기서는 네 가지 예를 들어보기로 한다.

 

1. 종 상태로서 고정점 어트랙터의 존재

앞에서 설명한 바와 같이 신경 활동 다이내믹스를 역학계로 볼 때, 기본적인 오브젝트로는 어트랙터, 특히 고정점 어트랙터를 들 수 있다. 그러나 이 고정점 어트랙터의 존재를 제대로 보여주기는 의외로 어렵다. 최근의 광유전학적 기법 등에 의해 섭동을 주어 그 존재를 보다 높은 정확도로 보여줄 수 있게 됐다. Svoboda 등(그림 5 (a))에서는 광유전학을 이용한 시각야에 대한 자극의 작업 기억 과제를 쥐에 학습시키면, 좌우 선택과 대응해 신경 활동이 수렴하는 상태가 존재하는 것을 볼 수 있었다. 더 흥미로운 것은 섭동을 주어 궤도를 교란하더라도 빠르게 그 상태로 수렴하는 것도 보여주고 있다. 이것은 종 상태가 행동 선택과 대응하는 어트랙터로 되어 있다는 것을 시사한다. 이것과 동시에 자극을 주는 타이밍에 따라 수렴의 용이성이 달라지며, 어트랙터의 안정성 강도도 변화한다는 것을 시사하고 있다. 이것을 보여주기 위해 데이터 구동 모델을 구축하고 어트랙터가 실제로 생기는지, 그것이 어떻게 변화하는지를 살펴볼 수 있다. 실제로 좌우 선택에 대응하는 어트랙터가 생성되고, 그 안정성이 변화하고 있는 것이 모델의 해석으로부터 밝혀졌다.

 

 

2. 문맥 의존의 라인 어트랙터

복잡한 과제를 수행할 때는 선택 행동에 따른 어트랙터가 있는 것만으로는 충분하지 않다. 그렇다면 문맥에 따라 동일한 자극이라도 다르게 반응해야 하는 문맥 의존의 과제에서는 어떠한 구조가 있어야 과제를 수행할 수 있을까? Mante 등은 시각 자극의 문맥 의존 작업 기억 과제를 이용해 그 점을 해석하고 있다. 처음에 문맥을 지정하는 cue가, 다음으로 sensory cue가 주어진다. 문맥 cue에 따라 sensory cue의 다른 속성(색상이나 움직임)에 주목해 응답하는 과제이다. 즉, 동일한 sensory cue의 다른 속성에 문맥 의존으로 주목하고 반응해야 한다. 전두전야에서 측정한 신경 활동을 차원 축약해 표시하면, 문맥에 의존해 완전히 다른 흐름의 구조를 볼 수 있었다. 그렇다면 그 배후에 어떠한 구조가 있는 것일까? 데이터 구동형 모델을 구축하면, 그 배후에는 각각의 문맥에서 다른 라인 어트랙터가 구성된다는 것이 밝혀졌다. 이것에 의해 문맥별 라인 어트랙터에 따라 신경 활동이 변화함으로써 문맥 의존의 의사 결정이 내려진다는 가설을 생각할 수 있다.

 

3. (의사) 고정점과 그것을 연결하는 궤도 구조

Mante 등에서는 처음 cue의 의미는 항상 일정했다. 그러면 처음 cue도 두 번째 cue도 동적으로 의미가 바뀌는 경우에는 어떻게 될까? Wang 등은 시각 자극의 각도 분류 과제를 이용해 이 점을 해석했다. 여기서는 각도가 있는 막대의 시각 자극이 두 번 주어지고, 그들이 동일한 각도인지 어떤지에 따라 응답을 바꾸는 과제를 이용하고 있다. 즉, 처음에 주어지는 cue가 단독으로 그 후의 행동을 규정하고 있는 것이 아니라, 두 번째 cue와 쌍으로 비로소 의미를 이루는 과제이다. 여기서는 그림 5 (b)와 같이 처음 자극에 따른 어트랙터(Blue와 Red)가 형성되고, 다음 자극이 주어졌을 때 앞뒤의 두 자극이 동일한지(match) 아닌지(mismatch)에 따라 전이 궤도가 다른 어트랙터와 궤도 구조가 형성된다는 가설이 데이터 구동형 모델로부터 제안되어 실험 데이터와 비교되어 있다.

 

4. 자발적 신경 활동의 안정성

마지막으로 저자 등의 연구를 소개하려고 한다. 대부분의 실험에서는 여러 개체의 데이터를 평균화해 해석을 한다. 그러나 일상생활을 생각할 것까지도 없이 행동에는 큰 개체 차이가 종종 존재한다. 이 연구에서는 이 개체 차이(자극에 대해 응답하기 쉬운가, 어려운가)의 배후에 있는 기구는 무엇인지에 초점을 맞췄다. 앞에서 예로 들은 청각 연합 과제를 이용하고 있으므로 과제의 설명이나 모델에 관해서는 그것을 다시 확인해 보기 바란다.

 

데이터 구동형 모델에 의해 행동의 개체 차이와 신경 활동을 재현하는 모델 네트워크 집단을 구축했다. 이 모델 네트워크를 이용해 개체 차이가 생기는 기구를 해석했는데, 종 상태에 대응하는 어트랙터의 안정성 등으로는 개체 차이를 설명할 수 없었다. 여러 가지 해석을 했지만, 결과적으로 과제 수행 시의 신경 활동으로부터는 개체 차이를 재현하기 어렵다는 것이 밝혀졌다. 그렇다면 무엇이 차이를 만드는가 하면, 흥미롭게도 자발적 신경 활동(=과제를 위한 입력 자극이 들어와 있지 않은 상태)의 성질이 중요하다는 것을 알았다. 모델에 있어 자발적인 활동에 외부로부터 섭동을 가해 그 응답을 측정하는 방법으로 자발적 신경 활동의 안정성을 계산하면, 그 안정성이 행동의 개체 차이를 잘 설명할 수 있다는 것이 밝혀진 것이다(그림 5 (c)). 이와 같이 모델을 한번 구축할 수 있다면, 실험 조건으로는 알 수 없는 특징을 조사하는 것도 가능해진다. 여기서 주목하고 있는 개체 차이는 모델에서만 알 수 있는 특징으로 비로소 설명된다는 것으로, 데이터 구동형 모델의 강점을 잘 활용한 연구라고 할 수 있다.

 

맺음말

 

지금까지 대자유 데이터의 신경 활동 데이터로부터 어떻게 신경계의 정보 처리 작동 원리에 다가갈 수 있는지에 대해 데이터 구동형 모델이라는 단면으로부터 설명해 왔다. 이 접근법은 신경 활동의 시간 변화에 대해 현상론적이 아니라 원리로서의 설명을 제공해 준다. 그러나 이들은 어디까지나 가설의 제기일 뿐이라는 점을 염두에 둘 필요가 있다고 생각된다. 왜냐하면 앞에서 설명했듯이 모델이 실제 신경계를 원리적으로 모방할 수 있는지는 알 수 없으며, 그 정당성도 마찬가지이다. 따라서 여기서 소개한 가설을 여러 가지 실험을 통해 확인하는 것이 중요하다.

 

여기서는 신경과학 분야에 대해서만 설명을 했지만, 관측 기술이나 정보 기술의 발전으로 많은 분야에서 측정 데이터의 크기가 극적으로 증가하고 있다. 따라서 분야 간의 과제에는 공통성이 있으며 서로의 교류가 중요해지므로 앞으로는 다른 분야의 동향에 주의를 기울이는 것이 더욱 중요해질 것으로 생각한다.

 

쿠리가와 토모키, 하코다테미래대학 복잡지능학과










배너









주요파트너/추천기업