머신러닝

애매모호한 이미지에 대한 인간 시지각의 XOR 논리처리 특성과 뉴럴 네트워크

coding art 2021. 7. 10. 16:15
728x90

같은 대상을 보고 서로 다른 이미지로 인식하게 되는 흥미로운 사례를 살펴보자. 당신은 위 그림에서 검은 색 두 대머리가 마주 보고 있다는 것을 인식할 수 있는가? 아니면 가운데 백색의 와인 잔을 인식할 수 있나요? 어느 것으로 인식이 되더라도 당신의 시지각 기능은 정상이다.

 

만약 두 종류의 대상이 동시에 인식되나요? 녜 안 된다면? 그래도 당신은 정상이다.

녜 된다면? 굉장히 이상스러운(weird, awesome) 결과로 보인다. 혹 외계인이 피가 섞인 것은 아닐까?

 

재미있는 점은 시지각 능력이 백색 잔인지 두 대머리인지 동시에 인식하기가 어렵다는 점이다. 모 아니면 도방식으로 인식된다는 점이다. 그러한 측면에서 보면 사람의 시지각 기능은 아날로그성이라기 보다는 디지털한 경향이 강한 듯하다.

위 그림에서처럼 하나의 이미지에 2개의 오브젝트가 들어 있는 문제를 논리 문제로 풀어 보도록 하자. 입력 x를 오브젝트 와인잔, 입력 y를 오브젝트 대머리로 설정하자. 그 다음 우리의 시지각 NN 에 입력해 보자 출력 결과는 x y 둘 중의 하나가 참으로 인식이 된다. 우리의 시지각 NN 의 출력이 와인잔도 아니고 대머리도 아닌 경우는 거짓으로 볼 수밖에 없다. 아울러 이 이미지가 동시에 와인잔과 대머리가 될 수는 없으므로 이는 결국 거짓을 뜻하게 된다.

 

즉 인간의 시지각에서는 배타논리(XOR) 처리가 이루어진다고 보아도 될 것 같다. 만약 이 문제에서 이 이미지가 와인 잔이면서도 두 대머리라고도 지각할 수도 있으면 그것은 OR 논리가 될 것이며 반면에 와인 잔이면서도 두 대머리라고만 지각할 수 있으면 AND 논리가 되는 것이다.

 

꼭 이미지뿐만 아니라 상당히 애매해 보이는 일반적인 논리 문제를 판단함에 있어서도 흑백 양비론 또는 양자 택일로 의견이 갈리는 경우가 많은데 인간의 인식과정에 배타논리(XOR)적인 면이 포함되어 있다는 의미이다.

 

고려말 정권 교체기의 이 방원이 정몽주를 회유하는 과정에서 읊은 시조에 의하면 이런들 어떠하리 저런들 어떠하리...”에 대응하여 정몽주의 일편단심 변함 없다라는 논리를 주장하다가 피살되었는데 잘 살펴보면 둘 다 XOR 논리를 피력했음을 알 수 있다.

 

참고로 이미지 인식 문제는 이미 오래 전 1957Rosenblatt 시절부터 머신러닝 분야의 주제로 너무나 잘 알려져 왔다. 하지만 1969년에 Rosenblatt 이 시연했던 퍼셉트론이 AND OR 논리 문제를 다룰 수 있으나 XOR 논리를 다루지 못한다는 점이 지적되었고 그로부터 사람의 뉴론 구조를 흉내낸 Neural Network NN를 풀기 위한 노력을 경주해 왔으며 지금의 Deep Learning 시대에서 판단해 보면 어느 정도 성과를 거두고 있다고 할 것이다.