http://dongascience.donga.com/news/view/33988
*시간차 학습
도파민이 보상을 받는 것보다 보상과 기대의 차이에 따라 반응한다는 것을 발견했다. 예상보다 큰 보상을 받으면 도파민이 활발히 생성돼 뇌 전체에 퍼지고, 적은 보상에는 도파민이 줄어드는 것이다. 이를 토대로 뇌 또한 짧은 시간의 보상을 토대로 끊임없이 학습해가며 배운다는 ‘보상예측오류’ 이론을 발견했다.
---> 가난 그 자체보다 불평등에 더 민감한...
*분포강화 학습
다양한 집합이 모여서 결론을 내리면 외부의 환경변화에 큰 영향을 받지 않고 학습을 할 수 있다는 장점이 있다.이런 상황을 고려해 제각기 다른 예상을 하는 알고리즘이 보상을 토대로 학습하게 하고 이후 이를 평균해 AI의 학습 방향을 정한다.
---> 효율지상주의 시스템보다 다양성에 기반한 시스템이 위기에 더...
이금재.
인공지능 관련한 요즘 트렌드는 관찰을 바탕으로 뇌를 이해하고, 그리고 그 이해를 바탕으로 기술을 만드는게 아니라, "에라 모르겠다. 일단 실행해보자"입니다. "소위 닥치고 코딩"이죠. 왜냐하면 그들은 인간의 모든 것을 이해할 수 없다고 생각하기 때문입니다. 실제로 과거에 뇌를 절편으로 쪼개고 정밀 관찰해서 만든 알고리즘은 모두 실패했습니다.
인공신경망이라는 것도 사실은 인간신경망과는 별로 상관이 없고, 형태적으로 조금 유사한 것일뿐입니다. 링크의 글은 이러한 과학계의 흐름에서 딥러닝 연구자들과 대치하는, 소위 뇌과학자 그룹에서 연구하는 방식을 써둔 것인데, 대상을 관찰하는 방법은 본질적으로 귀납이며, 귀납은 그 자체로 이미 한계를 가지고 있으므로, 그 결과도 일정하게 한계가 있습니다.
이런 한계를 정확하게 인식하고, 귀납을 뒤집어 이를 다시 연역적으로 이해하려고 들면 좋겠지만, 모든 뇌과학자가 그런 것은 아니고, 라마찬드란 박사와 같은 일부 비주류 과학자들이 이렇게 하고 있는 형편입니다. 결국 관찰로 모든 것을 이해하겠다고 덤비는 것은 어리석은 것이라는 거죠.
닥치고 코딩하여 나온 딥러닝이 작동은 하지만 궁극적인 해답은 아니며, 그렇다고 관찰해서 이해하겠다고 덤비는 뇌과학도 답은 아니고, 관찰하면서도 작동할 수 있는 두 마리 토끼를 다 잡을 수 있는 구조론적 해석만이 정답입니다. 물론 실제로는 에디슨식으로 이것저것 다 해볼 수 있는 환경을 만드는게 해답이지만.