자연수에서
5 = 4 + x
"여기서 x는?"이라고 물어보고 답하는게 학습이다. 이걸 좀 더 일반화 해보자. 입력 4와 출력 5를 만족시키는 x를 찾는 것이 방정식의 핵심이다. 자연수에서 방정식은 이항이 가능하므로 x = 5 - 4라고 바꿀 수 있다.
이를 언어로 바꿔보자. 음수라는 전제에서 '5라는 주어'와 '4라는 목적어'를 만족하는 '동사는 x'이다.
이제 응용해보자. 연인이라는 전제에서 '나'는 '너'를 > '동사는?' 이라면, 동사항에 들어갈 수 있는 동사는 사랑해. 싫어해.. 등등이 될 수 있다.
자연수에서 방정식은 답이 하나인데, 왜 언어에서는 여러가지가 나오지? 중간에 상황이라는 변수가 또 들어가 있기 때문이다. 사실 방정식도 답이 여러가지가 나올 수 있지만 전제를 (고정)생략하여 답이 하나만 나오도록 강제한 것이다. 연인이라는 관계에서 발생할 수 있는 중간 변수는 많다. 가령 다음과 같이 5단계로 표현해보자.(물론 이는 구조론의 5단계와는 다른 것이다.)
커플 > 나/너 > 좋은/나쁜 상황 > 선물/질투 > 사랑해/싫어해..
중간에 "/"로 표현한 것은 트리가 분기되는 것을 표현한다.
각 계층에서 하나씩만 취하면 다음과 같다.
커플 > 나/너 > 좋은 상황 > 선물 > 사랑해
이렇게 표현되는 것은 일대일함수다. 입력 하나에 답이 하나이다.
이때 각각의 단계(중간 변수) 중 하나를 생략하면 다음 단계에서 답이 확률적으로 변한다.
커플 > 나/너 > 어떤 상황??? > 선물 > 사랑해?/싫어해?/질투해?/환장해?..
즉 이렇게 된다. 보는 것처럼 중간에 상황이 뭔지를 모르기 때문에 결과항의 답이 하나가 아닌 둘 이상이 될 수 있는 것이다.
대부분 남자는 여자의 변덕을 알기 어려운 이유로 중간 변수를 못 찾았기 때문이라고 생각한다. 근데 사실은 남자들이 변수를 못 찾는 게 아니라 여자가 일부러 그 변수를 못 찾게 하고자 거짓 정보를 흘리는 것이 진실이다. 여자는 남자가 전전긍긍하도록(변수를 못 찾도록) 만들어 권력적 우위에 서려는 것이다. 즉 남자가 문제를 풀게 한다. 여기서 여자는 보스로, 남자는 직원으로 바꿔도 말이 된다. 커플에 따라서 여자와 남자를 바꿀 수도 있다.
여자가 거짓 정보를 흘려 남자를 정신 못 차리게 만드는 이유는 여자의 사회적으로 실질적 지위가 낮기 때문이다. 사회적으로 실질적 권력을 갖지 못하기 때문에 커플관계에서 권력 우위에 서려고 한다. 그런데 남자가 변수를 못 찾는 이유는 뭘까? 그는 그 변수가 자신의 행위 자체에 있다고 보기 때문이다. 즉 사건의 상위계층에서 답을 찾아야 하는데 하위계층에서 답을 찾으므로 답이 절대로 나오지 않는 것이다. 우물에서 숭늉을 찾으므로 해결책이 나오질 않는다.
어떤 사회(환경)??? > 커플> 나/너 > 선물 > 사랑해?/싫어해?/질투해?/환장해?..
그럼 그 남자는 어떻게 해야 하나? 가령 여행을 가면 된다. 관계가 성립하는 환경 자체를 바꾸는 것이다. 물론 이 해결책은 일시적이다. 어차피 결혼하면 관계의 양상은 바뀌고 애 낳으면 또 바뀐다. 너무 걱정하지 말라.
여기서 같은 "연인"이라고 하더라도 그 맥락에 따라 나/너의 의미(수학적으로는 비율)가 달라진다는 것을 보아야 한다. 우리는 연인이나 커플이라고 이름을 대충 퉁치지만 모든 커플이 다 같은 것은 아니다. 커플이라도 상부의 권력구조에 따라서 그 양상은 모두 다르다. 가령 페미니즘이 우세한 사회에서의 커플과 마초이즘이 우세한 사회에서의 커플은 권력구조가 다르다. 한국 사회에서 부모님의 관계와 요즘 커플의 권력구조가 다른 이유는 한국 사회가 변화했기 때문이다.
#
이제 머신러닝을 보자.
(앞으로는 특징과 feature(피쳐)를 혼용하겠다.)
이름이 있고, (출력)
이미지가 있고, (입력)
둘을 연결하는 피쳐가 있다. (연결)
하부 ----- "이미지 > 피쳐? > 이름 > (전제) > (전제의 전제)" ----- 상부
우리가 맞춰야 할 대상은 중간의 피쳐이다. 전제와 전제의 전제에 괄호를 친 이유는 그것이 숨은 전제이기 때문이다. 보통의 과학실험에서 숨은 전제는 변수 통제로 표현된다. 숨은 전제의 작용으로 실험 결과가 확률적으로 나오면 과학자는 변수 통제를 못한 것이다. 이러면 논문 못 쓴다. 논문을 받아주는 사람들은 결과가 결정론이길 바라기 때문이다. 과학계가 결정론이라는 말이다. 그러므로 상부에 있는 전제를 고정!시킨다. 그것은 없어지거나 생략할 수 있는 것이 아니라, 어느 하나로 고정된 것이다.
그런데 실제 세계에서 이미지는 어떤 결과이지 원인이 아니다. 맞다. 사실 저 과정 자체가 귀납적이다. 우리는 '결과인 이미지'를 보고 '원인인 이름'을 맞추는 머신러닝을 보고 있다. 이는 어떤 결과에 대한 원인을 추론하는 것이다.
결과로 원인을 추론할 수 있냐고? 거꾸로 묻자 원인에서 결과는 추론할 수 있는가? 증거로 범인을 추론할 수 있고, 거꾸로 범인을 보고 증거를 찾아볼 수 있다. 즉 둘 다 가능하다. 연역이나 귀납이나 추론한다는 근본 원리는 같다.
귀납을 하건 연역을 하건 입력 2에 출력 1을 추론하는 것이다. 그래서 저 위에 방정식을 써두었다. 다만 귀납을 할 때는 결과 2에 원인 1을 추론하고, 연역할 때는 원인 2에 결과 1을 추론한다. 이게 가능한 이유는 사건이 트리 구조로 진행하기 때문이다.
이 그림에서 B와 G를 보고 A를 추론하면 연역이고,
A와 D를 보고 B를 추론하면 귀납이다.
물론 연역을 하건 귀납을 하건 상부의 F를 전제해야 가능하다.
그러므로 구조론은 인간의 추론이 본질적으로 연역이라고 하는 것이다.
그리고 우리가 머신러닝을 근본적으로 혁신하려면
상부의 숨은 전제, 즉 고정된 변수를 학습의 대상으로 삼아야 한다.
그리고 그 전제를 인간과 연결시켜야 한다.
그래야 인공지능과 인간이 소통할 수 있게 된다.
물론 뒷감당은 알아서.