토론실
프로필 이미지
[레벨:22]이금재.
read 3140 vote 0 2020.05.09 (18:48:27)

http://math4ucanada.com/%EB%B2%A0%EC%9D%B4%EC%A6%88-%EC%A0%95%EB%A6%AC/


방증과 반증의 논리, 베이즈추론과 머신러닝

 

현대 머신러닝의 근간이 되는 논리는 베이즈추론법이다. 21세기의 엘리트라면 베이즈추론이 뭔지 정도는 알아야 하지 않겠나. 그런데 기 베이즈추론은 사실에 대한 맥락적 해석법에 대한 것이다. 맥락이라고 하면 구조론과 닿는 점이 있다

 

우리는 인셉션과 같은 영화의 결말을 열린결말이라고 한다. 그런데 사실 인셉션의 결말을 하나뿐이다. 그럼에도 불구하고 우리는 이를 두고 열린 결말이라고 하는 것일까? 사실 열린 결말이라는 표현은 어색한 것이다. 열린 전제라는 표현이 정확하다.

 

우리가 결과를 해석함에 있어 의미를 다양하게 있는 것은 사실 전제를 여러 가지로 있기 때문이다. 우리는 어떤 사실이 자체로 고유하다고 생각하지만, 모든 사실은 전제와 진술의 형식으로 이루어져 있다. 전제가 다르면 결과가 같아 보이더라도 결과에 대한 의미는 완전히 달라진다.

 

당신에게 베이즈확률이 어렵게 느껴진다면, 그것은 당신이 확률을 전제-진술 쌍으로 생각하지 않고 단순히 진술만으로 생각하기 때문이다. 결국 확률도 전제-진술 쌍으로 이루어질 있다. 아니 오히려 전제-진술 쌍으로 이루어져야 확률을 바르게 표현할 있다.

 

가령 기침을 한다고 해서 감기에 걸렸다고 할 수 있는가? 그렇지는 않다. 왜냐하면 미세먼지(반증)에도 기침을 있기 때문이다. 하지만 기침을 했다면 미세먼지를 마셨을 때보단 감기에 걸렸을 확률이 높을 같다. 이런 사고과정은 누구나 경험으로 납득하는 것이지만, 논리를 말하기는 쉽지 않다.

 

1) 감기O > 기침

2) 감기X > 기침

 

우리는 그냥 사실이 있다고 생각하지만, 모든 사실은 맥락적이다. 기침을 하더라도 다양한 원인에 의할 있다 원인을 추론하려고 하는게 베이즈추론이다. 단순 사실이 아니라 전제-진술로 사실을 판단하는 과정을 확률적으로 논리화/수식화한 것이다. 베이즈추론은 기침과 같은 증거를 획득하고 이를 확률에 반영하여, 사전가정을 사후가정으로 갱신한다. 기침의 원인이 감기인지 다른 (ex 미세먼지)인지를 판단하려는 것이다.

 

사전확률 + 증거(시행확률) > 사후확률(갱신확률)

 

길에서 무작위로 어떤 사람을 붙잡았을 때 그 사람이 감기에 걸렸을 확률은 얼마일까? 이때는 전인구집단에서 감기발병비율을 활용할 있다. 4 한국에서 발병비율은 20%라고 한다면, 이는 길거리에 있는 사람을 무작위로 골랐을 사람이 감기에 걸릴 확률도 20%라고 생각하는 것이다.(사전확률)

 

그런데 그 사람이 갑자기 기침을 한다면? 기침은 감기에 걸렸을 확률을 강화시키는 하나의 증거가 된다. 물론 감기에 걸리지 않은 사람도 기침은 한다. 하지만 비율은 낮을 것이다. 보통 감기에 걸린 사람이 기침을 확률이 90%이고 걸리지 않은 사람이 없는 원인에 의해 기침할 확률이 30%라고 하자.(시행확률)

 

그러면 우리가 발견한 사람이 기침을 했을 때 그가 감기에 걸렸을 확률은 얼마나 될까? 20% 확률을 퍼센트로 갱신해야 할까?(사후확률)

 


베이즈 그림.jpg

(모집단의 크기를 100으로 정한 후에 각 경우의 수를 이에 맞추어 양적으로 정규화normalize 하면 그림에서 원 안의 사람 수가 된다)

 

우리는 가정을 비교하려는 것이다. '감기>기침'인지 '미세먼지>기침' 최종 비율을 계산하여 어느 것의 확률이 높은지를 보려고 한다.

 

여기에 있는 곱셈은 단계의 확률 '실현된 확률'만을 단계에 '가중치' 산입하여 줄기의 최종값을 구하고자 사용된 것이다. 쉽게 이해하려면 단계의 확률을 가중치라고 생각해야 한다.


 dfdf.jpg


이 과정은 다음의 베이즈정리와 정확히 같다.

 

EMB000062b02c66.jpg



EMB000062b02c67.jpg


근데 왜 방증의 논리라고 할까? 증거 부분에 다양한 증거를 추가하면 사전확률을 더 갱신할 수 있기 때문이다. 감기의 경우라면 발열, 오한, 콧물 등이 추가 증거가 될 수 있으며, 이는 환자가 감기에 걸렸는 지를 확신할 수 있는 방증으로 사용될 수 있는 것이다. 다만 위의 그림은 단순하게 설명하고자 증거를 기침으로만 제시한 것이다.


내가 베이즈추론을 맥락적 해석법이라 말하는 이유는 일반적인 확률이 수평적인 비교, 가령 "감기o : 감기x = 10 : 90"과 같은 단선적인 것임에 비해 베이즈추론은 "감기0-기침 : 감기x-기침 = 10 : 90"과 같은 것이기 때문이다. 즉 비교 대상의 원소를 일자가 아니라 쌍자로 두는 것이다. 


이는 구조론에서 사건의 기본 요소를 쌍자로 두는 것과 같은 맥락이다. 

Drop here!

프로필 이미지 [레벨:7]현강

2020.05.10 (12:40:42)

마지막 단락

***  내가 베이즈추론을 맥락적 해석법이라 말하는 이유는 일반적인 확률이 수평적인 비교, 가령 "감기o : 감기x = 10 : 90"과 같은 단선적인 것임에 비해 베이즈추론은 "감기0-기침 : 감기x-기침 = 10 : 90"과 같은 것이기 때문이다. 즉 비교 대상의 원소를 일자가 아니라 쌍자로 두는 것이다. 


이는 구조론에서 사건의 기본 요소를 쌍자로 두는 것과 같은 맥락이다.   ***




에 대하여 부연, 질문을 드립니다. 구조론에서는 자연과 관측자와의 양자적 만남의 층위에 따라 관측값이 달라진다고 하고 있지요(읽는 분들께, 틀렸다면 지적 부탁합니다).

 



***  http://gujoron.com/xe/gangron/1197980

문제는 순간적인 성립이다. 반드시 5로 존재하지만 그중의 일부가 외부에서 순간적으로 조달될 수 있다. 충돌할 때다. 둘이 충돌할 때 이쪽의 3과 저쪽의 2가 순간적으로 5를 이루어 새로운 존재를 탄생시킨다. 이때 4 대 1이나 3 대 2의 결합이 있다. 그런데 인간의 관측 역시 그러한 결합을 한다는 점이 중요하다.


    0에 서서 5를 보면 에너지가 되고, 1에 서서 4를 보면 물질, 2에 서서 3을 보면 공간의 3차원, 공간의 3에 서서 에너지의 입출력 2를 보면 시간이고, 물질 4에 서서 변화 1을 보면 정보다. 에너지, 물질, 공간, 시간, 정보는 인간이 단위 사건에 어느 정도로 개입하는지가 결정한다. 자신의 개입사실을 망각하는게 문제다.***




구조론의 말을 빌리자면 위 문구를 떠올릴 수 있겠습니다.

그렇다면 사전확률과 시행확률이라는 곧, '감기 유무-기침 유무'라는 양자적인 조건(혹은 만남)을 하나의 전제로 보아야 한다는 것으로 해석가능할지요? 


즉 과거로부터 이제껏 누적된 데이터를 바탕으로 세운 전제(사람들이 100명 중 감기에 걸려왔던 데이터)인 사전확률이라는 조건과, 


역시나 이제껏 누적된 데이터를 바탕으로 세운 전제(위에선 기침이겠지만 정확히는 '검사' 혹은 '단서'가 누적적으로 보여왔던 데이터. 이금재 님께서 글 초반에 걸어둔 링크에 의하면 유방암 검사의 정확도가 되겠군요)라는 조건을


수평적이며 양자적으로 동시에 생각할 수 있겠습니다. 이금재님께서 작성한 글의 도식에서 사전확률 다음에 시행확률로 화살표를 그려 순서를 나눠진 것은, 자연(사전확률)과 인간의 관측(시행확률)의 관계를 나타낸다는 점에서 구조론과 닿는 점이 있다고 할 수 있을런지요?


결국 '사전확률+시행확률' 혹은 '자연과 관측자'와 같이 양자적으로 성립하는 전제로부터 사후확률이라는 하나의 진술이 나온다고 할 수 있겠네요. 처음 글을 읽었을 땐 막연히 '전제-진술'을 양자적으로 말씀하시는 줄 알았지만 역시나 글을 끝까지 읽고나서 몇 번 더 읽어보니 글의 맥락이 조금 달리 보였습니다.


구조론에서는 질대칭 혹은 입자대칭과 같은 양자적 전제에서부터 질대칭(전제)의 진술인 입자(진술)로, 입자대칭(전제)의 진술인 힘(진술)로 사건이 방향성을 타며 진행하듯이, 상부구조의 수평적 만남(대칭)으로부터 하부구조로의 수직적(비대칭) 진행이 낳아진다고 하죠(읽는 분들께, 틀렸다면 지적 부탁합니다).


위 표현엔 혼동의 여지가 있을 수 있겠네요. 사실 '상부'구조 대칭으로부터 '하부'구조 대칭으로의 진행을 비대칭이라 표현한 것입니다. 사건 한 사이클로 크게 보자면 당연히 사건은 전체'비대칭'의 촉발로부터 부분'일시적인 대칭'으로 진행한다는 점은 숙지하고 있습니다.


글이 어수선해져서 이만 정리하자면 동어반복이긴 한데 제가 하려는 말은 '자연-관측자'라는 대칭으로부터 진행되는 사건의 경로는 필연적으로 하부구조를 향하듯이, '사전확률+시행확률'라는 대칭으로부터 사후확률(갱신확률)은 필연적으로(비대칭적으로) 낳아진다고(결정된다고) 볼 수 있겠다는 것입니다.


예컨대 관측값이 단순 '기침' 뿐이냐 혹은 '기침에 오한에 발열'이냐 또는 '기침에 누런 하늘'이냐에 따라 자연과 맞물린 정도가 다른 것이고, 그러므로 사후확률 역시 달라질 것이며, 역으로 '관측자+자연'이라는 조건이 감기이거나 미세먼지일 확률이 달라지겠지요.

프로필 이미지 [레벨:22]이금재.

2020.05.10 (18:14:45)

먼저 구조론과 베이즈추론을 일대일로 매칭시키지 말길 바랍니다. 제가 베이즈추론을 인용하고 설명하는 이유는 그것이 구조론에 비할 것이라서 그런게 아니라 그것이 구조론의 일면을 이해하는데 도움을 줄 수 있다고 생각하기 때문입니다. 게다가 현대 머신러닝의 근간이면서도 많은 연구자들이 제대로 이해하고 있지 못하기 때문이기도 합니다. 몬티홀 문제 앞에서 이른바 천재 수학자자들이 당황하는 게 이유가 있는 겁니다. 

#

문제는 순간적인 성립이다. 반드시 5로 존재하지만 그중의 일부가 외부에서 순간적으로 조달될 수 있다. 
충돌할 때다. 둘이 충돌할 때 이쪽의 3과 저쪽의 2가 순간적으로 5를 이루어 새로운 존재를 탄생시킨다. 
이때 4 대 1이나 3 대 2의 결합이 있다. 그런데 인간의 관측 역시 그러한 결합을 한다는 점이 중요하다.
0에 서서 5를 보면 에너지가 되고, 1에 서서 4를 보면 물질, 2에 서서 3을 보면 공간의 3차원, 
공간의 3에 서서 에너지의 입출력 2를 보면 시간이고, 물질 4에 서서 변화 1을 보면 정보다. 
에너지, 물질, 공간, 시간, 정보는 인간이 단위 사건에 어느 정도로 개입하는지가 결정한다. 
자신의 개입사실을 망각하는게 문제다.

#

이 인용은 관측에 대한 학계의 정의를 동렬님이 재정의하고자 하신 말씀입니다. 이는 관측 과정 또한 하나의 사건임을 말하는 겁니다. 즉 사건이 있고, 여기서 완전한 객관으로 관측이 이루어지는게 아니라, 관측이나 해석이라는 행위도 사건의 일부가 될 수밖에 없다는 것을 말하는 겁니다. 

한편 베이즈확률 이전의 통계를 표준통계(빈도주의)라고 하는데, 학자들은 베이즈확률을 주관적 확률로, 표준통계를 객관적 확률로 비교하는게 보통입니다. 이러한 주관과 객관의 차이는 관측자의 정의에 따라 구분된 것이며, 대개 현대 과학이 그러하듯이, 이런 구분조차 상당히 비과학적입니다. 그래서 양자역학이 슈뢰딩거 고양이 어쩌고 하며 여기서 헤매고 있는 겁니다. 

제가 베이즈추론을 통해 하고자 하는 말은 표준통계가 객관적이라고 하는 것도 사실은 주관적인 것이며, 주관적인 것도 사실은 주체적(구조론의)인 것이라는 겁니다. 베이즈추론에서의 "주관적"이라는 말은 베이즈추론이 관측자의 경험을 적극 반영하는 확률과정이기 때문에 나온 것이며, 이는 귀납적이라고도 하는 것입니다. 

재밌는 포인트는 표준통계가 연역적이라고 말하는 것인데, 이는 현대 수학이 근간은 연역에 근간하고 있으나 합리적이지 못한 것과 같이 표준통계도 연역에 근간하지만 전혀 합리적/과학적이지 않습니다. 이는 일반인이 말하는 연역과 구조론의 연역이 정확히 일치하지 않는 것처럼 표준통계의 잘못된 주장은 현대 학문의 한계에서 기원한 것이라고 생각할 수도 있습니다. 

제가 본문에서 말하고자 하는 것은 "우리는 감기에 걸렸는지 아닌지를 확인하려는게 아니라, 감기에 걸린 사람이 기침을 했는지 감기에 걸리지 않은 사람이 기침을 했는지를 확인하려고 하는 것이다."입니다.

우리는 일상에서 이런 추론을 하루에도 수십번씩 합니다. 너무 흔한 것이라서 베이즈확률을 이론이라고 말하기도 거시기할 정도입니다. 누구나 하는 것이니깐. 그런데 사실 구조론도 누구나 사용하는 것입니다. 그게 모든 사고의 원형이기 때문입니다. 

베이즈추론이 현대 수학자에 충격을 주었던 것과 같이 구조론도 현대인에게는 큰 충격입니다. 우리는 이미 인셉션이 "어려운" 영화란 것을 알고 있지 않습니까? https://namu.wiki/w/%EC%9D%B8%EC%85%89%EC%85%98/%EC%9D%98%EB%AC%B8%EC%A0%90%EA%B3%BC%20%ED%95%B4%EC%84%9D

저렇게 길게 써놓은 이유는 "어렵기" 때문입니다. 

다음의 설명은 3Blue1Brown이라는 유튜버가 한 베이즈추론에 대한 설명 영상입니다. https://www.youtube.com/watch?v=HZGCoVF3YvM&t=29s 저자가 스탠퍼드를 졸업한 천재인데, 괜히 천재가 베이즈추론을 설명하는게 아닙니다. 친절하게 그림까지 그려가며 설명하고 있습니다. 왜? 어렵거든요. 이해가 안 되거든요.

제가 쉽게 설명했다고 하여 쉬운게 아닙니다. https://namu.wiki/w/%EB%B2%A0%EC%9D%B4%EC%A6%88%20%EC%A0%95%EB%A6%AC 베이즈정리 나무위키 항목. 

머신러닝으로 인해 핫하지만 누구도 제대로 이해하고 있지는 않은게 베이즈확률이며, 그래서 제가 설명하는 것입니다. 전세계의 천재들이 다 달라붙었다니깐요? 맨해튼 계획에서 시뮬레이션의 핵심 이론인 MCMC가 베이즈확률을 기반합니다. https://namu.wiki/w/%EB%AA%AC%ED%85%8C%20%EC%B9%B4%EB%A5%BC%EB%A1%9C%20%EB%B0%A9%EB%B2%95 당시 인류 어벤저스가 모여서 연구하던게 맨해튼 계획이죠. 대강 보고 구조론과 매칭시키시면 곤란합니다. 

이 모든 것에도 불구하고 제가 베이즈확률을 연구하는 이유는 그것이 불완전하지만 어쨌든 작동하는 것이기 때문입니다. 인간의 뉴런에 숫자가 있을리 없음에도 작동하는 것은 뉴런도 구조론적이기 때문입니다. 근데 머신러닝이 잘 작동하는 것에서 볼 수 있듯이 어설프게 숫자를 사용하는 베이즈추론도 일정하게 작동하는 알고리즘입니다. 

모든 작동하는 것은 구조론적이라는 것을 생각해보면 베이즈확률도 잘 쪼물딱 거리면 좋은 결과를 만들 수 있을 겁니다. 그래서 제가 이러고 있는 거고. 
Drop here!
List of Articles
No. 제목 글쓴이 날짜 조회
공지 구조론 매월 1만원 정기 후원 회원 모집 image 29 오리 2020-06-05 132414
1720 라인은 어떻게 변화하는가? 현강 2020-07-26 2444
1719 진리에 대한 주저리 1 다음 2020-07-26 2456
1718 다 같은 라인이 아니다 현강 2020-07-25 2243
1717 그림 공부 image 현강 2020-07-24 2327
1716 과거, 미래, 우리들의 사정 5 현강 2020-07-23 2387
1715 구조론 목요모임(서울역) image 오리 2020-07-23 2272
1714 타자성에 관하여 현강 2020-07-23 2286
1713 그린벨트해제관련 1 약속 2020-07-19 2420
1712 가장 큰 피해자는 세입자 3 약속 2020-07-17 2390
1711 원인과 결과 약속 2020-07-17 2247
1710 구조론 목요모임(서울역) image 2 오리 2020-07-15 2303
1709 중앙일보 이순신을 들먹이다. 한국은 친일에 뿌리가 깊다. 1 아나키(÷) 2020-07-13 2442
1708 인상주의 시대 음악가에 대한 구조론적 해석 3 오민규 2020-07-09 2496
1707 구조론 목요모임(홍대입구역 ,강남역 아님) image 오리 2020-07-09 2265
1706 사유의 방법과 철학 오민규 2020-07-08 2330
1705 박인환상 공모전(7월31일까지) 1 수피아 2020-07-08 2363
1704 일본의 에너지 고립. image 아나키(÷) 2020-07-08 2331
1703 내일 7월 9일 목요모임 장소 변경 안내 image 3 오리 2020-07-08 2262
1702 이해찬과 김병준 3 수원나그네 2020-07-06 2550
1701 허영만 '주식 만화' 25% 손실! 아나키(÷) 2020-07-05 2637