기계적 인조 인간

덴디를 이길 수있는 오픈 아이 봇의 힘

CHINESE LEGENDS vs OPENAI FIVE - HUMANS vs BOTS - #TI8 Showmatch Dota 2 - GLADOS WTF?

CHINESE LEGENDS vs OPENAI FIVE - HUMANS vs BOTS - #TI8 Showmatch Dota 2 - GLADOS WTF?

차례:

Anonim

지난 주 Dota 2와 AI의 영역에서 역사가 만들어졌습니다. 인터내셔널에서 게임의 최고의 선수 중 하나 인 Dendi 는 1v1에서 로봇에 의해 무차별 두 번 연속 패했습니다. 문제의 로봇은 Elon Musk의 창업자 인 OpenAI 가 만들었습니다.

이제 몇 가지 질문을 할 수 있습니다. Dota 란 무엇입니까? OpenAI 란 무엇입니까? 왜 이것이 중요한가요? 우선, Dota는 무료로 플레이 할 수있는 MOBA 게임으로, Heroes 를 제어하고 상대방 인 Ancient 을 파괴하는 것이 목표입니다. 많은 Dota 팬들이 Dota에게 마지막 문장을 어 기고 나서 내가 요약합니다.

이 게임은 매우 복잡하며 매우 가파른 학습 곡선을 가지고 있습니다. 나는 얼마 전 Dota를 배워라는 임무에 착수했고 기본적인 How To Video를 통해 게임의 전략, 무기, 주문, 영웅, 할 수있는 것들을 설명하는 데 일주일이 걸렸습니다. AI와 ML이 어떻게 발전했는지를 보여주기 때문에 전체 AI 대 Dendi 전투가 중요합니다. 보봇 (Boe-Bot)이 봇에 전력을 공급하는지 보자. 우리는 AI 반란에 대해 두려워 할 필요가있다.

인공 지능의 행성의 상승

AI가 Skynet이되는 것은 논쟁의 여지가있는 문제입니다. Elon Musk은 점검하지 않으면 Skynet 과 같은 시나리오가 발생할 가능성이 있다고 생각합니다. 반면에 마크 주커 버그 는 AI는 무해하며 최후의 심판을 초래하지 않을 것이라고 말합니다. Elon Musk는 OpenAI를이 목표로 시작했습니다.

인공 지능의 오용과 인공 지능에 대한 연구는 우리를 이기지 못하게합니다. 나는 그의 편에 서있다.

그러나 그것은 우리가 토론 할 곳이 아닙니다. 주요 주제는 OpenAI가 만든 봇에 어떤 영향을 주는지 알아 보는 것입니다. 그것을 이해하기 위해 주제에 관한 연구 논문과 블로그를 읽고 AI & ML 연구원 인 Anmol Sharma 에게 연락했습니다.

강화 학습

이것은 OpenAI의 Dota 봇 뒤에있는 기술의 이름입니다. 그러나 우리가 그것에 대해 탐구하기 전에, 우리는 일반적인 AI 또는 비디오 게임에서의 AI가 어떻게 작동 하는지를 이해할 필요가 있습니다. AI는 매우 보드 용어이며 Machine Learning, Deep Learning 및 Neural Networks와 같은 많은 주제를 포함합니다. AI를 엄숙하게 정의하기 위해 컴퓨터에서 정보를 통해 학습하고 학습을 기반으로 의사 결정을 내리는 능력이 있다고 말할 수 있습니다. 배울수록 결정의 정확성이 높아집니다.

일반 Bot과 어떻게 다른가요?

일반적인 비디오 게임의 봇은 지능형 것처럼 보이지만 사실은 AI 형식이 아닙니다. 거의 모든 게임에서 이러한 봇은 If … This..Then..That 문을 기반으로 프로그래밍됩니다. 그들은 진술을 따르고 진술서에 쓰여진 조건에 따라 행동을 취합니다.

위에서 나는 아주 간단한 예를 보여 주었다. 실제 게임의 문장은 조건 내 조건과 훨씬 더 복잡합니다. 이 문장이 더 잘 정의되고 상세화 될수록 봇은 지능적인 것처럼 보일 것입니다.

보상 및 처벌

AI 용어에서 우리가 로봇이라고 부르는 것을 에이전트라고합니다. 목표는 에이전트가 우리가 배우고 자하는 것을 배우게하는 것입니다. 에이전트는 보상과 처벌을 통해 개가 배운 것과 동일한 방법으로 학습합니다. 에이전트가 실수를 할 때마다 불이익을 당하고 올바른 추측을하거나 정확한 대답을 할 때마다 보상을받습니다. 이 시스템을 통해 상담원은 벌칙을 피하고 보상을 제공하는 조치 (또는 이와 유사한 조치)를 수행하기 위해해서는 안되는 조치를 연관시키는 방법을 학습합니다.

당신이 그것을 철저히 생각한다면 그것은 알고리즘과 마찬가지로 특정 조건을 기반으로 의사 결정을 내리는 것과 같습니다. 위에서 보았 듯이 폭발적인 배럴을 타고 오는 게임 봇은 알고리즘에 따라 행동을 취합니다. 인공 지능의 알고리즘은 이것보다 훨씬 복잡하기 때문에 시스템 전체를 지능적으로 만듭니다.

개발자들에 따르면 OpenAI 봇에 와서 2 주 만에 전체 게임을 배웠습니다. 2 주간의 전체 시간 동안 온라인 24x7이었고 자신의 사본을 상대로 놀았습니다. 이것은 게임의 복잡성과 Dendi를 이길 수 있다는 사실을 고려할 때 놀라운 이정표입니다.

왜 운전자가없는 자동차는 아직 여기 있지 않습니까?

이것은이 모든 사건에 대해 들었을 때 가장 먼저 떠오르는 질문이었습니다. 봇이 그런 게임을 배우고 최고의 선수를 때리는 지점까지 스스로 훈련 할 수 있다면, 왜 우리는 여전히 바퀴 달린 사람을 만납니다. 그리고 이것은 내 친구 인 Anmol Sharma 와 같은 질문이었습니다. Anmol Sharma 는 운전없는 자동차에 대해서도 연구했습니다. 이것이 그가 말한 것입니다.

인간이 개발 한 게임에서는 변수의 수가 적습니다. 또한 에이전트 (봇)가 실수를하면 최악의 페널티는 라운드 손실입니다. 현실 세계에서 하나의 실수는 죽음입니다.

Dota는 복잡한 게임이지만 이동, 주문 및 전술의 가능한 조합은 여전히 ​​터무니없이 크지 만 여전히 제한적입니다. 실제 벌칙없이 실수는 허용됩니다. 그러나 운전자가없는 자동차 요원의 경우 실수는 위험한 사고로 이어질 수 있으며 심지어 죽음까지 초래할 수 있습니다.

현실 세계에서 에이전트가 모니터링해야하는 변수의 수는 무한하며 이러한 변수로 인해 상황이 바뀌고 다른 차가 갑자기 차선을 변경하고 보행자가 차 앞에서 점프하는 것과 같이 끝이 없습니다. 또한 Jeremy Clarkson이 말했듯이, 즉각적인 사고 직전에 도덕적이고 윤리적 인 결정을 내려야합니다 (이론은 유효하지 않지만).

미래

우리는 이미 본질적인 수술을 수행하는 인간 통제 로봇에 대해 알고 있습니다. 다음으로 도약은 로봇이 AI를 제어하는 ​​로봇입니다. 그리고 이것은 의학 분야에 있습니다. AI는 앞으로 10 년 동안 많은 분야에서 확실한 새로운 기술이 될 것입니다. 그러나 AI는 또한 DDoS 공격, Ransomware Bots, 다른 PC 또는 기업 시스템 해킹과 같은 사악한 목적으로 오용 될 수 있습니다.

Dota 및 다른 게임과 관련하여, 우리는 그러한 지능적인 봇이 다른 게임을 위해 만들어지는 것을 볼 수 있습니다.이 봇은 플레이어가 더 잘 수행하도록 훈련 할 수 있습니다. 그리고 OpenAI가 내년에 International에서 5v5를 할 것이라고 언급 했습니까? 그래서 나는 내장 된 멍청한 봇을 최소한 물리 치기 위해 나의 Dota 기술을 닦으 려합니다. 신성한 레이피어 여기와!