어제 방송 모임 때, 개훈련에 대한 이야기가 잠깐 스치듯이 지나갔는데,
동렬님께서 기존의 보상 기반 훈련이 바뀌어야 할 수도 있다고 말씀하신 것에 대하여
최근 동렬님이 다른 글에서 말씀하신, 이른바 개주인이 먹이 들고 가만히 서있는 훈련법과 연관하여 설명해 보겠습니다.
유튜브에서 쉽게 찾아볼 수 있는 강형욱 훈련사의 훈련방법은
기존의 보상시스템이나 알파독 훈련법과는 상당히 다른
훈련법이 반복되는데, 그게 바로 "가만히 서있기"입니다.
먼저 인지에 대해 설명하자면,
인지는 불변 및 변화로 규정할 수 있는데
불변(축)은 (전체적인) 연결의 1로
변화(대칭)는 (부분적인) 불변의 2로 구성되어 ㅅ(시옷)의 형태를 만듭니다.
개나 인간은 인지나 훈련을 할 때, 불변과 변화를 동시에 성립시켜야만
자신의 일부와 대상을 대칭-인식할 수 있고,
또한 이것이 결과적으로 두뇌상에 정보의 인지세트가 된다고 볼 수 있으며
이때 1) 불변은 곧 개에 의한 관계의 인지인, 곧 개의 인식 그 자체이며,
2) 변화의 한쪽에 해당하는 것이 주인이나 개장수 혹은 방문자의 부동(不動)이나 반복적인 먹이 보상, 클리커 소리이고
3) 다른 한쪽 변화는 개 자신의 신체나 움직임이 되는게 아닌가 합니다.
보통 개가 훈련이 잘 되지 않는 것은 변화의 한쪽이 고정되지 않아
개의 인지주체인 두뇌가 대상과 자신의 행위를 대칭시키지 못하기 때문이라고 보는데,
이는 개 주인이 훈련을 할 때, 주인의 대응(피드백)이 일관성을 보이지 않을 때 나타나는 현상입니다.
그래서 강형욱의 많은 훈련 방법은 사건에서 부분적인 피드백의 일관성을 만들어
개의 인지를 돕는, 이러한 원리에 기초하고 있다고 볼 수 있겠습니다.
인간의 경우에도 인디언 그룹에서 추장이 가만히 앉아서 기다린다거나
많은 커뮤니케이션 과정에서 상대를 제압하고자 사용되는, 암말없이 가만히 응시하는 테크닉이 상당히 강력한 것은
이러한 개훈련 과정과 같은 맥락을 가지기 때문이 아닌가 합니다.
이는 비율로 규정되는 수학의 1차 함수(선형 관계)의 원리와도 같은 것인데,
함수가 원래 일대일 대응이기 때문입니다.
이때의 대칭은 입력과 출력이며, 중간의 비율이 둘 사이를 정의하는 연결이 됩니다.
물론 수학의 함수는 이 부분이 슬쩍 모호하기는 하죠. y = ax + b가 있을 때,
독립변수(x)나 종속변수(y)와 달리 계수(a)라고만 하여 마치 존재가 없는 것처럼 표현하기 때문입니다.
물론 통계학에서는 계수를 파라미터(모수)라 하여 선형 관계의 중심으로,
머신러닝에서는 이 계수를 가중치라고 하여 분류의 규정으로 삼기는 합니다.
어쨌건 이러한 개념의 일반화는
기존의 '보상' 개념이 마치 그것을 설계하는 인간이
개가 원래 '좋아하는 것'이라는 모호한 개념으로 접근하던 것을
변화에 대한 불변, 구조론 용어로 보자면 대칭에 대한 축으로 설명할 수 있게 되어
좀 더 보편성을 가진 해석이 가능하게 합니다.
즉 주인이 개에게 먹이만 흔든다고 하여 개를 훈련시킬 수 있는 것은 아니라는 말입니다.
인식의 대칭과 축을 형성시켜야 개는 훈련하고 인지하는 것입니다.
참고로 알파고가 보상시스템을 기반하는 강화학습으로 만들어졌습니다.
개는 그냥 집단적으로 흥분하거나 이완하거나입니다.
인간이 목적과 의도를 가지고 계산된 행동을 한다는 사실을 모릅니다.
개가 짖으면 주인이 말리는데 그 과정이 개 입장에서는
집단적 흥분상태로 보여서 개는 더욱 흥분해서 짖어대는 거지요.
주인이 꼼짝도 않고 특히 말을 하지 않고 가만이 있으면
개는 다들 침착한데 나만 흥분했네. 개망신이로구나 하고 침착해집니다.
개는 주변의 분위기를 열심히 파악하고 있는 것입니다.
머리 좋은 개 중에서 어떤 계기로 인간이 목적과 의도에 따라
계산된 행동을 한다는 사실을 간파해 버린 개가 천재개가 됩니다.
천재개 주인들의 공통점은 개를 무릎 사이에 끼고 눈을 맞추며 집요하게 가르친다는 거.