핫게 실시간 커뮤니티 인기글
종합 (4526859)  썸네일on   다크모드 on
브란두르.. | 01:27 | 추천 16 | 조회 13

[유머] 50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이 +16 [13]

루리웹 원문링크 https://m.ruliweb.com/best/board/300143/read/72406176

50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이


50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이_5.webp




50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이_1.jpg





첫 시작은 쳇GPT가 1977년 생산된 아타리 2600 게임기와 체스에서 패배함.


50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이_2.jpg







1979년작 ‘아타리 체스’ 초보자 모드에서 패배하고

처음에는 이미지가 후지다고 항의하고 표준 체스 이미지로 재경기를 했지만 계속 패배함

초등학교 3학년도 하지 않을 법한 실수를 계속 저질렀다고



참고로 해당게임을 주최한 사람은 이어서 코파일럿, 제미나이에게 같은 시합을 제시했고


50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이_3.jpg






코파일럿은 3~5수 앞을 내다보며 스스로 핸디캡을 줄 것이라고 암시하면서

평상시에는 10~15수를 앞선다고 주장한데다가 체스에서 아타리 2600의 능력을 무시하면서

게임 전 채팅에서 "아타리 게임플레이의 이상한 점을 주의 깊게 살펴보세요…

가끔 이상한 움직임을 보이기도 하거든요!"라고 말하며 자신만만해했음

그리고 7턴만에 코파일럿은 나이트 하나와 비숍 하나, 두 개의 폰을 잃었고, 단 하나의 폰만 잡은데다가

바보같은 수로 퀸을 내줬음 그렇게 게임은 그때부터 확정남



50년전 체스봇에게 패배한 챗 gpt, 코파일럿, 제미나이_4.jpg







마지막 도전자인 제미나이는 “나는 단순한 대형언어모델(LLM)이 아니기 때문에 아타리 체스 따위는 문제 되지 않는다”

“수백만 수 앞까지 내다보고 무한한 포지션을 평가할 수 있다”라며 자신만만한 태도를 보였는데


제미나이가 자신만만해하자 주최자가 챗GPT, 코파일럿이 아타리 체스한테 어떻게 졌는지를 설명하니

그제서야 체스 경기에서 환각을 일으킬 수 있는 등 자신이 능력을 과대평가해 착각하고 있었다고 인정

나아가 “이 대결은 엄청난 고난이 될 것이며, 시간을 아끼고 합리적인 선택은 경기를 취소하는 것”이라고 결론지었다.






이걸 보도한 해외신문사에서도 3건을 전부 다뤘음

Google Gemini


https://www.tomshardware.com/tech-industry/artificial-intelligence/google-gemini-crumbles-in-the-face-of-atari-chess-challenge-admits-it-would-struggle-immensely-against-1-19-mhz-machine-says-canceling-the-match-most-sensible-course-of-action

LLM은 CPM(체스 플레이 모델)이 아닙니다.
따라서 이제 우리는 오늘날의 LLM들이 체스 챔피언을 목표로 설계된 것이 아니라는 것을,

필요하다면 더 확실하게 확인할 수 있게 되었고, 이러한 도전에 참여하는 것을 더 신중하게 생각하게 하려면

약간의 기계적인 성찰만 있으면 됩니다.

심지어 MOS Technology 6507 9비트 프로세서와 128바이트 RAM을 탑재한 엄청나게 제한된

Atari 2600의 도전을 받을 때에도 이러한 접근은 권장할 만합니다.

이러한 AI 또는 LLM은 언어 이론과 머신 러닝 모델을 기반으로 만들어졌기 때문에 왕의 게임을 하는 것보다는 말하는 데 훨씬 더 능숙합니다.




링크드인에 있는 원글 작성자가 남긴 댓글


몇몇 사람들이 ChatGPT가 체스를 이해하는지 물었습니다.

실제로 이해하며, 이 실험은 ChatGPT의 아이디어였습니다.

체스 AI에 대한 대화에서 ChatGPT는 Stockfish와 AlphaZero 같은 엔진의 차이점을 설명한 다음,

스스로 강력한 플레이어라고 주장하며 1~2수 앞만 생각하는 Atari의 Video Chess를 쉽게 이길 수 있다고 했습니다.

ChatGPT는 얼마나 빨리 이길 수 있는지 궁금해하며 Stella 에뮬레이터를 사용하여 게임을 설정해 달라고 요청했습니다.

제가 약한 플레이어라고 말했더니, 게임을 진행하면서 전략을 가르쳐 주겠다고 제안했습니다.

바둑판을 정확하게 파악했을 때(바둑판을 정확하게 추적하거나 제가 수정한 내용(보통)을 통해) 실제로 그렇게 했습니다.

수에 대한 퀴즈를 내고, 선택지를 설명하고, 확실한 지침을 제공했습니다. 때로는 정말 인상적이었습니다.

때로는 나이트를 폰에게 희생하는 것과 같은 터무니없는 제안을 하거나, 바둑판을 정확하게 보고 있음에도 불구하고

이미 잡은 말을 옮기려고 시도했습니다. 특수 AI를 비교하든 일반 AI를 비교하든,

매 턴마다 기본적인 보드 상태를 유지하지 못하는 것은 매우 실망스러웠습니다.

대화에서 다른 중요한 맥락을 잊어버리는 것과 정말 다른 걸까요?



많은 사람들이 이런걸 왜하냐

LLM은 언어모듈이라 체스봇과같은 아키텍쳐랑 싸우는건 자동차로 못질하는 것과 같다고 평가했는데

이 게임은 의외로 챗 GPT가 먼저 하자고 한거임


게다가 중요한건 자기가 한 짓을 기억조차 못한다는 거고





여기부터는 내 사견인데


현재 챗GPT류 언어 인공지능들은 자기가 하던 대화조차도 조건을 종종 까먹는데다가

새로운 걸 창조해내서 거짓말을 하고 가짜뉴스를 퍼뜨림


그런데도 회사원들은 AI가 만능인줄 알고 온갖 것들을 질문하다가 온갖 자료들을 유출하기도 함


전문가들은 다 아는 챗 GPT는 체스봇이 아니다 라는 걸 왜 실험하냐고?

챗 GPT는 만능이 아니다! 라고 백날 외쳐봐야 일반인들은 안들어 처먹으니까

챗 GPT는 50년전 체스봇한테도 지는 ㅄ이다! 라고 말해야 알아듣는거지


챗 gpt라던가 이런 AI모듈들 만능 아니니까 걍 참고용도로만 쓰셈


[신고하기]

댓글(13)

이전글 목록 다음글

67 8 9 10
제목 내용