본문 바로가기
이슈/IT & 스마트폰

<메타 AI 시세로 Cicero> 보드게임 하는 ai 개발 (디플로머시)

by 딩도 2022. 12. 10.
반응형


메타 ai 시세로

보드게임 하는 ai

_

7명의 플레이어 간의 협력과 경쟁이 포함된 전략 보드게임인 디플로머시(Diplomacy)에서 인간 수준의 성능을 달성한 최초의 AI 에이전트 ‘시세로(Cicero)’를 개발했다고 메타ai 홈페이지를 통해서 발표했습니다.

 

*디플로머시(Diplomacy)
Diplomacy은 보드 게임 Risk, 카드 게임 포커 및 TV 쇼 Survivor의 조합으로 설명될 수 있는 7인용 보드 게임 입니다.

이 게임은 1901년에 유럽의 강대국 중 하나를 통제하는 일곱 명의 선수 각각으로 시작됬으며 그들의 목표는 게임 보드의 적어도 절반을 통제하는 것 입니다.

 

이 도전에 성공하려면, 선수들은 가능한 한 많은 영토를 놓고 경쟁하면서 서로 협력하고, 협상하고, 신뢰하고, 지원해야 합니다.

 

_

지금까지 디플로머시는 AI시스템이 플레이하기에는 너무 어렵다고 여겨졌는데 2명에서 7명의 플레이어가 승리하기 위해 서로 동맹하고 협상해야 하는 게임이고 또 각 플레이어는 다른 플레이어가 어떤 움직임을 보일지 예측해야 하기때문 입니다

무엇보다 결정적으로 플레이어는 다른 플레이어를 속이려고 시도할 수도 있으며 디플로머시는 누구도 믿을 수 없는 환경에서 다른 플레이어들과 신뢰를 구축해야하기 때문에 특히 어렵다고 했으며 AI가 디플로머시에서 승리하려면 게임의 규칙을 효율적으로 이해해야 할 뿐만 아니라 인간의 상호 작용, 속임수 및 협력을 근본적으로 이해하고 전략적인 대화까지 할줄 알아야 했습니다.

_

[메타 ai 시세로의 디플로머시 공략]
• 목표는 게임 보드의 대부분의 지도를 제어하는 것

• 플레이어는 동맹을 협상하고 사적인 일대일 대화를 통해 서로를 지원

• 구속력 있는 계약이 없기 때문에, 플레이어는 그들의 계획과 이중 거래를 잘못 표현할 수 있습니다.

• 협상 후, 플레이어는 동시에 실행되는 움직임을 기록

• 이기는 유일한 방법은 신뢰를 쌓고, 협상하고, 다른 선수들과 협력하는 것

CICERO의 인내심, 집중력, 공감이 어떻게 뛰어난 선수로 만드는지 논의하였으며 앤드류와 아담은 CICERO가 동맹을 어떻게 선택하고 협상하는지 논의하고 CICERO는 아담에게 더 똑똑한 움직임을 제안하며 CICERO는 다른 선수들과의 관계를 사용하여 동맹국인 Adam을 억제하는 방안을 연구 했습니다

메타 시세로는 사람이 플레이하는 40,000개의 디플로머시 게임 데이터 세트에서 시세로를 훈련했는데 그 결과 시세로는 40개의 온라인 디플로머시 게임에서 인간 플레이어의 평균 점수의 2배를 기록했으며 한 개 이상의 게임을 플레이한 플레이어 중 상위 10%에 들었습니다.

_

전문가들의 말에 따르면 앞으로 모든 사진이나 영상 뿐만 아니라 인공지능 ai가 게임에서도 큰 전략적인 역할을 할 것이다 들여다 보고 있습니다.

읽어주셔서 감사합니다.

반응형

댓글