50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이

50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이_5.webp

첫 시작은 쳇GPT가 1977년 생산된 아타리 2600 게임기와 체스에서 패배함.

1979년작 ‘아타리 체스’ 초보자 모드에서 패배하고

처음에는 이미지가 후지다고 항의하고 표준 체스 이미지로 재경기를 했지만 계속 패배함

초등학교 3학년도 하지 않을 법한 실수를 계속 저질렀다고

참고로 해당게임을 주최한 사람은 이어서 코파일럿, 제미나이에게 같은 시합을 제시했고

코파일럿은 3~5수 앞을 내다보며 스스로 핸디캡을 줄 것이라고 암시하면서

평상시에는 10~15수를 앞선다고 주장한데다가 체스에서 아타리 2600의 능력을 무시하면서

게임 전 채팅에서 "아타리 게임플레이의 이상한 점을 주의 깊게 살펴보세요…

가끔 이상한 움직임을 보이기도 하거든요!"라고 말하며 자신만만해했음

그리고 7턴만에 코파일럿은 나이트 하나와 비숍 하나, 두 개의 폰을 잃었고, 단 하나의 폰만 잡은데다가

바보같은 수로 퀸을 내줬음 그렇게 게임은 그때부터 확정남

마지막 도전자인 제미나이는 “나는 단순한 대형언어모델(LLM)이 아니기 때문에 아타리 체스 따위는 문제 되지 않는다”

“수백만 수 앞까지 내다보고 무한한 포지션을 평가할 수 있다”라며 자신만만한 태도를 보였는데

제미나이가 자신만만해하자 주최자가 챗GPT, 코파일럿이 아타리 체스한테 어떻게 졌는지를 설명하니

그제서야 체스 경기에서 환각을 일으킬 수 있는 등 자신이 능력을 과대평가해 착각하고 있었다고 인정

나아가 “이 대결은 엄청난 고난이 될 것이며, 시간을 아끼고 합리적인 선택은 경기를 취소하는 것”이라고 결론지었다.

이걸 보도한 해외신문사에서도 3건을 전부 다뤘음

Google Gemini

https://www.tomshardware.com/tech-industry/artificial-intelligence/google-gemini-crumbles-in-the-face-of-atari-chess-challenge-admits-it-would-struggle-immensely-against-1-19-mhz-machine-says-canceling-the-match-most-sensible-course-of-action

LLM은 CPM(체스 플레이 모델)이 아닙니다.
따라서 이제 우리는 오늘날의 LLM들이 체스 챔피언을 목표로 설계된 것이 아니라는 것을,

필요하다면 더 확실하게 확인할 수 있게 되었고, 이러한 도전에 참여하는 것을 더 신중하게 생각하게 하려면

약간의 기계적인 성찰만 있으면 됩니다.

심지어 MOS Technology 6507 9비트 프로세서와 128바이트 RAM을 탑재한 엄청나게 제한된

Atari 2600의 도전을 받을 때에도 이러한 접근은 권장할 만합니다.

이러한 AI 또는 LLM은 언어 이론과 머신 러닝 모델을 기반으로 만들어졌기 때문에 왕의 게임을 하는 것보다는 말하는 데 훨씬 더 능숙합니다.

링크드인에 있는 원글 작성자가 남긴 댓글

몇몇 사람들이 ChatGPT가 체스를 이해하는지 물었습니다.

실제로 이해하며, 이 실험은 ChatGPT의 아이디어였습니다.

체스 AI에 대한 대화에서 ChatGPT는 Stockfish와 AlphaZero 같은 엔진의 차이점을 설명한 다음,

스스로 강력한 플레이어라고 주장하며 1~2수 앞만 생각하는 Atari의 Video Chess를 쉽게 이길 수 있다고 했습니다.

ChatGPT는 얼마나 빨리 이길 수 있는지 궁금해하며 Stella 에뮬레이터를 사용하여 게임을 설정해 달라고 요청했습니다.

제가 약한 플레이어라고 말했더니, 게임을 진행하면서 전략을 가르쳐 주겠다고 제안했습니다.

바둑판을 정확하게 파악했을 때(바둑판을 정확하게 추적하거나 제가 수정한 내용(보통)을 통해) 실제로 그렇게 했습니다.

수에 대한 퀴즈를 내고, 선택지를 설명하고, 확실한 지침을 제공했습니다. 때로는 정말 인상적이었습니다.

때로는 나이트를 폰에게 희생하는 것과 같은 터무니없는 제안을 하거나, 바둑판을 정확하게 보고 있음에도 불구하고

이미 잡은 말을 옮기려고 시도했습니다. 특수 AI를 비교하든 일반 AI를 비교하든,

매 턴마다 기본적인 보드 상태를 유지하지 못하는 것은 매우 실망스러웠습니다.

대화에서 다른 중요한 맥락을 잊어버리는 것과 정말 다른 걸까요?

많은 사람들이 이런걸 왜하냐

LLM은 언어모듈이라 체스봇과같은 아키텍쳐랑 싸우는건 자동차로 못질하는 것과 같다고 평가했는데

이 게임은 의외로 챗 GPT가 먼저 하자고 한거임

게다가 중요한건 자기가 한 짓을 기억조차 못한다는 거고

여기부터는 내 사견인데

현재 챗GPT류 언어 인공지능들은 자기가 하던 대화조차도 조건을 종종 까먹는데다가

새로운 걸 창조해내서 거짓말을 하고 가짜뉴스를 퍼뜨림

그런데도 회사원들은 AI가 만능인줄 알고 온갖 것들을 질문하다가 온갖 자료들을 유출하기도 함

전문가들은 다 아는 챗 GPT는 체스봇이 아니다 라는 걸 왜 실험하냐고?

챗 GPT는 만능이 아니다! 라고 백날 외쳐봐야 일반인들은 안들어 처먹으니까

챗 GPT는 50년전 체스봇한테도 지는 ㅄ이다! 라고 말해야 알아듣는거지

챗 gpt라던가 이런 AI모듈들 만능 아니니까 걍 참고용도로만 쓰셈

루리웹-22489834901:30

현 시점에선 걍 다른 형태의 검색엔진일 뿐인듯
uspinme01:45

그 점이 너무 편해서 좋은거고 예전에는 뭘 검색해야되는지도 몰랐는데 이젠 검색 엔진이 뭘 검색해야되는지 알려주니깐
대형마법01:46

편리성을 압도적으로 높이고 정확성을 랜덤으로 바꿔버린 검색엔진
백수돌고래지스터01:48

ㄹㅇ 개발새발 대충 물어봐도 제대로 이해함
답변이 맞는지는 모르지만
THE·O01:49

거의 모든 인터넷 자료를 읽어본 사람한테 질문한다고 생각하면 편함
그거보다 잘 대답하는 인간은 또 별로 없을 거고
만약 있다고 해도 모든 정보를 정확하게 참으로 대답할 수도 없을 거.
AI쪽에서도 연구 많이 하는 게 AI가 학습한 데이터 기반으로 답변은 잘 하는데 그 답변한 게 어떻게 진짜고 가짜인가 구분해서 대답하는 걸 연구하는 쪽도 있음.
Barc_Ode01:39

LLM 들의 가장 근본적인 문제 중 하나가 기억을 하거나 떠올리는 능력이 떨어진다는 거더군.
본문의 체스 같은 경우 나와 상대가 이전에 어떤 말을 어디로 이동했는지 기억 못 하는 것은 물론,
현 상황에 필요한 체스의 룰조차 제대로 떠올리지 못 하고, 그래서 상황을 제대로 인지하지 못 함.
그래서 체스에 대한 '이야기' 는 할 수 있어도 체스를 '플레이' 할 수는 없다더라고.
라스트리스01:46

그래서 LLM모델 자체론 별 의미가 없어서 메모리 기능을 어떻게 구현하느냐, 용도에 맞는 파인튜닝을 어떻게 하느냐 등으로 서비스 품질이 극과 극을 달리지 비슷한 모델 쓰더라도.
루리웹-771687015501:48

LLM은 네크로맨서가 틀림없다
그게 아니라면 13수에서 죽었던 나이트가 왜 내 비숍 옆에 갑자기 나타나 체크를 외치는 것인가?
Medand01:44

LLM보면서 agi의 시대가 몇년안에 온다 하면
뭘 경험했길래 그런소리를 하는거지 싶음
uspinme01:46

그건 openai ceo가 하는 약팔이 아님? 챗gpt 잘 쓰는거랑 별개로 agi 타령은 약팔이라고 생각해
Medand01:48

걔가 말하는건 진작에 걸러듣고있고
주변에서 하는 말 들어보면 얼마안남았다 그러고있음
Yangdor01:45

LLM은 아직 진정한 의미의 지능은 못갖췄지
아직까진 랜덤 단어생성기임
꿀구귀여우니까꿀구키워01:46

효과적인 방법이긴해.

단순 알고리즘 덩어리도 못이기는거니까

뭐 멀티툴이 무언가 때랴박는데 당연히 망치 못이기는거긴 하지만 사람들은 생성형ai를 멀티툴이 아니라 만능툴로 알고 있으니까

[유머] 50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이 +16 [13]

50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이

댓글(13)