영상만 보면 성능이 좋아 보이긴 한데, 실제론 영상 편집의 힘이 좀 많이 들어갔다고.
사람들이 실험해보니 GPT4와 크게 다르지 않다고.
모임에서 말한대로 벤치마크(성능 테스트)가 좀더 잘 나온 정도로 보는 게 맞을듯.
물론 이 영상만 가지고 구글의 모든 기술력을 판단하는 건 무리수죠.
다만 기대한 건 영상인식인데 좀 아쉽네요.
사진을 주고선 영상인식인 척 편집.
그리고 자세히 보시면 사람이 요청한 것 이상으로 수행하는 걸 알 수 있습니다.
아는 사람이라면, 여기서 문제점을 보아야 합니다.
판단할 수 있는 정보를 주지 않았는데, 판단한다는 것은 이상한 겁니다.
제미니는 내가 누군지도 모르는데.
인공지능이 제대로 만들어지려면 먼저 소속의 개념이 있어야 합니다.
인간의 지능은 상당 부분 집단에서 연역됩니다.
일베충이 일베충 짓을 하는 것은 일베충 집단에 들어있기 때문입니다.
그런데 제미니는 어디에 소속되어 있나요?
없습니다. 인간은 집단에 의해 의식이나 목표의 개념이 들어있는데
제미니는 그딴 거 없습니다.
그런데도 불구하고 질문에 답을 한다?
이상한 겁니다.
인간은 상대방이 누구인지부터 파악합니다.
길을 걷다가 누군가가 나에게 말을 걸면
정체부터 밝혀야 합니다.
근데 제미니는 묻지 않습니다.
이는 단순히 이상한 걸 떠나서
그게 지능이 맞는지를 의심해야 하는 겁니다.
제가 제미니가 단순히 생각을 안 한다고 하는 게 아니라
인간이 하는 “생각”이라는 게 포지션 파악부터 시작하는 것이기 때문에 그러는 거.
시작을 안 했는데 왜 진행이 있나요?
다시 말하지만, 제미니는 생각을 한 흔적이 없습니다.
다만 생각하는 것처럼 흉내내도록 학습되었습니다.
가장 중요한 게 빠졌기 때문에
절대로 지능이 아닙니다.
그리고 생각도 하지 않습니다.
생각을 하려면 이중 구조 이상이어야 합니다.
생각에 관한 생각 혹은 chain of thought가 되려면
제3의 생각 주체도 또한 있어야 합니다.
그런데 OpenAI고 구글이고 죄다 관심이
멀티모달에 꽂혀있습니다.
그건 꽤 그럴듯해보이지만, 아직 갈 길이 멀었습니다.
제가 큐스타를 꽤 그럴듯하다고 언급하는 이유는
그게 2중 구조이기 때문입니다. 개와 개 주인으로 되어 있죠.
아직은 아쉽지만, 단일 구조와 2중구조는 큰 차이가 있습니다.
하나의 가능성을 보는 겁니다.
그리고 생각을 하면 사이즈가 작아집니다.
인간은 기억력이 무한한 게 아니라
생각해서 지식을 무한대로 생성할 수 있는 겁니다.
물론 설계하기에 따라서 제미니도 꽤 생각을 하게 할 수는 있지만
이 정도 생각을 할 수 있다면
큰 모델이 아니라 작은 모델을 발표하겠죠.
사시합격자는 영감님으로 불리고, 의사들은 선생님으로 불립니다. 용어에서 오는 앙시앙레짐이 존재하는 거죠. 이건, 서로 모두 좋지 않습니다.