http://cpuu.postype.com/post/166917/
사람도 대화를 하다보면 "니가 말하는게 이게 맞아?"라는 표현을 하곤 합니다. 사람도 애매한 언어는 잘 헷갈리는거죠. 아버지가방에들어가신다의 경우에도 마찬가지고요. 그래서 인간은 헷갈리즘을 피하기 위해 두가지 요소를 검토합니다.
1. 맥락적요소
2. 문법적요소
해당링크에는 구글이 잘하는 것과 못하는 것이 분명한데요.
그런데도 말하지 않은 것이 있습니다. 이른바 "의도"죠. 저걸 왜 공짜로 풀어놓는가인데,
1. 시장영향력확대
2. 모자람 보충
정도로 보면 될것 같네요.
근데 그 모자람 보충을 잘 들여다보면 지들도 뭐가 모자란지를 잘 모르고 있네요.
그래서 조금만 보충하면..
그들이 말하는 "자신들의 모델은 잘 정제된 구문을 잘 해석한다"라는 것에 답이 있습니다.
보통 사람들은 언어의 형식이 문법의 형식이라고 생각하나 그 이전에 관계의 형식이 더 본질적인데, 이들은 그걸 하지 않고 하부구조인 문법의 형식만을 통계학적 컴퓨팅파워인 하부구조로 상부구조를 돌파해버렸습니다. 물론 제대로 해결할 수는 없죠. 꼬리로 머리를 흔들려는 격이니.
사건은 귀납으로 접근할 수도 있긴한데, 그렇게 하면 처리해야할 데이터가 어마무시합니다. 게다가 굉장히 소모적이죠. 굳이 필요하지 않은 정보를 너무 많이 검토해야 합니다. 스스로도 은연중에 이를 드러내고 있고요.
그리고 이들이 스스로 지적하는 데이터 량의 폭발적 증가의 원인인 "실생활의 지식이 요구되는 경우"는 그 자체로 인공지능에게는 하나의 상부구조 학습과정입니다.
이들은 실생활의 지식이라고 표현했으나 이를 올바른 언어로 번역하면 "자신이 살고 있는 세계관과 환경설정"이라고 할 수 있겠습니다. 이때 세계관은 기본모델 생성을 기록하는 차원에서, 환경설정은 모델에 필요한 정보를 받아들이는 과정에서 설명할 수 있습니다.
1) 세계관 : 인간이 열라게 책을 읽고 생활 속에서 지식을 습득한다고 하여 그것이 다 활용되는 것은 아닙니다. 자신의 세계관으로 해석 가능한 것만 지식이 됩니다. 그게 아닌 건 그냥 무시되고 버려집니다.
근데 그 세계관이란 무엇인가하면, 그건 이른바 완전성의 모델입니다. 사람들은 저마다의 추상화를 거친 완전성의 모델을 가지고 있습니다. 가령 어떤 사람이 새로 접한 정보라도 이해를 잘한다면 그의 두뇌는 완전성으로 이르는 추상화를 많이, 다양하게 거쳤다고 할 수 있습니다. 다양한 정보에 많이 노출되고 그것을 이해하고 해결하려는 과정을 많이 거친거죠.
더 많은 정보에 의해 더 다양한 추상화를 거친 완전성의 모델을 가지고 있다는 것은 컴퓨터 안에서도 같은 과정을 거쳐야 정보처리 속도와 연산 속도도 더 빨라질 수 있다는 것을 의미합니다. 또한 같은 결과값 대비 처리해야할 데이터 량도 적어지고요.
2) 환경설정은 곧 맥락의 판단입니다. 사람은 어떤 문장을 이해한다고 하더라도 그 이전에 맥락부터 판단해야 합니다. 근데 대개 이 과정은 무의식적으로 진행되기 때문에 사람들은 잘 인지하지 못하죠. 하지만 두뇌는 반드시 그것을 판단하고 반영하고 있습니다.
그래서 꽤 우수한 인간은 대화중이라도 상황을 판단하고 모델링하는데 집중합니다. 상대의 말에 표현된 개개의 단어는 크게 신경쓰질 않죠. 말하는 상대의 포지션이 어디에 있는지, 그걸 듣는 나의 포지션은 사건과 관계가 있는지 등을 봅니다. 그리고 찰떡같이 답변을 하죠.
###
그러므로 상황을 판단하는 알고리즘을 만들면 이를 간단하게 해결할 수 있다는 거죠. 구문분석기와 비슷한데, 구문이 아니라 상황(맥락)을 먼저 분석하는거죠. 그래서 얻는 잇점은
1. 더 다양한 환경(인터넷, 대화 등)에의 적용성
2. 가벼운 컴퓨팅 환경에서 구동 가능성(더 중요한 곳에 컴퓨팅 자원을 집중)
3. 더 똘똘한 답변
4. 다음 세대 인공지능에의 도약 가능성 등이 있겠네요.
###
기존 학자들은 보이는 부분에 집중하므로 새로운 인공지능은 보이지 않는 부분에 집중해야 합니다. 그게 기존의 AI업계의 자연어처리 메커니즘의 본질을 돌파하는 방법입니다.
(상기 글은 백공팔님과의 대화에서 상당부분을 인용하였습니다.)