사건을 모르고 장기적 관점을 이해하지 못하면 생기는 참사
보상은 어느 관점에서 보느냐에 따라서 정의가 달라질 수 있습니다. 생존과 멸종이라는 프레임은 내가 대결하는 상대를 적으로 간주할 때 만들어집니다. 보통은 세계대전과 같은 전쟁을 '악'으로 치부하지만, 전 전쟁을 상호작용이라고 이해합니다. 다만 인간의 수준이 떨어져 몸으로 의사소통을 한 거죠.
학급에서 친구와 싸우고 나면 이상하게 더 친근감이 느껴지는 이유입니다. 대화가 없었고, 그래서 오해를 했고, 치고받는 과정에서 소통을 하고나면 상대를 이해할 수 있게 됩니다. 애들 싸움이나 어른 싸움이나 연인 싸움이나 모든 싸움의 본질은 소통입니다. 다만 싸움이라고 이름을 잘못 지어서 헷갈림을 유발한 겁니다.
한편 보상이라는 말도 부적절하기는 마찬가지입니다. 보상은 목적과 관련이 있습니다. 현재 인공지능을 연구하는 사람들이 인공지능에게 동기를 부여하는 방법으로 보상을 제시하는데, 그래서 나온 결과가 저렇습니다. 자연스럽게 인공지능이 단기전을 수행하게 됩니다. 그러나 연구자들은 이를 알고리즘을 개선하는 방법으로 해결하려고 하므로 개선이 없습니다.
기껏해야 바둑을 두는 알파고입니다. 인공지능이 아니라 '게임'이나 '사건'을 제대로 이해하지 못한 연구자부터 개선해야 하는 문제인 거지요. 제가 제목에서 '인간이나 인공지능이나 거기서 거기'라고 말한 이유는 사건의 관점이 없는 인간과 인공지능이 눈앞의 이득 혹은 사물만을 좇아 단기전을 수행하는 것을 지적하고자 함입니다. 기술이 아니라 철학의 문제입니다.
장기전 단기전도 시간의 개념이 아니고 싸이클의 개념이 적용되어야 할 것 같습니다...생물의 경우 1세대의 싸이클이나 한 번의 전생에 몇 총에서 몇십년의 걸리겠지만, 인공지능이나 알고리즘의 경우에는 같은 시간에 무수히 많은 싸이클이나 전쟁, 경쟁을 치뤄볼 수 있겠지요. 이런 관점에서 보면 선악과 같은 도덕개념은 별다른 의미가 없겠고, 결국 동렬님께서 말씀하신 것처럼 돈을 따는 것이 보상이 아니고, 이긴 플레이어 만이 다음 판에 참가할 수 있다는 보상 아닌 자격이 생긴다는 논리로 볼 수도 있지 않을까요?
------------------------------------------------------------------------ 재미삼아...
- 팬케이크의 경우 : 보상을 체공시간에서 난이도 또는 참신성 등으로 변경
- 이미지 : 제가 이해 불가
- 버섯 : 학습순서에 대한 패턴학습을 금지시킴
- 소닉 : 버그 발견시 신고하면 보상, 신고없이 이용하면 벌칙 부과
- 자율주행차 : 거리 개념을 주행거리가 아닌 이동거리(좌표 변경에 의한)로 변경
- 상자들기 : 자율주행차와 비슷한 논리
- 미니타우러 : 드리블에 대한 정의 자체가 없었음
- 로드러너 : 자살과 패배가 어떻게 차이가 나는지 이해가 안됨
- 전략시뮬레이션 : 오류를 발생시키면 캐릭터도 없어지는 것으로 처리
- 테트리스 : 일지정지 시간에 한계를 둠(무한한 일시정지 불가)
- 블록 옮기기 : 역시 옮긴다는 정의가 불확실 했던듯...
- 달리기 : '빠르게' 보다는 '적의 공격을 회피하기 쉽게' 도는 '먹잇감 잡기에 유리' 등 '빠르게'를 달성하기 위해서 키를 키우는 전략이 유리한 점도 있지만 동시에 불리한 점도 생기도록 조정.
보통 인공지능을 설계할 때는 양으로 측정 가능하도록 합니다. 이미 망한거죠. 말씀하신대로 양보다는 질이며 질의 측정은 보상과 같은 양이 아닌 계의 성립으로 규정되어야 자연의 결과 맞습니다.
실제 지능(동물 포함)의 경우 보상은 생존, 벌칙은 멸종이겠죠?