Jan 16, 2020

【熱點(diǎn)資訊】人工智能再下一城！碾壓Dota2準(zhǔn)職業(yè)玩家的OpenAI Five究竟是何方神圣？

如果你是一位游戲玩家那么對(duì)DOTA2這款游戲你一定不會(huì)陌生，今年的Ti8已經(jīng)在溫哥華華麗麗的開幕了，小組賽激戰(zhàn)正酣。Ti8正值2018偶數(shù)年，不知道西恩刀塔的魔咒能不能再次上演呢？

人機(jī)對(duì)抗一番戰(zhàn)

DOTA AI在去年的TI7首度亮相賽場(chǎng)，就技驚四座。在TI7正賽的期間，V社舉辦了一場(chǎng)別開生面solo表演賽——人機(jī)SOLO大戰(zhàn)。

人類方是TI活化石，世界頂尖的中單選手dendi，而他的對(duì)手是一個(gè)U 盤，里面裝著由OpenAI 開發(fā)的Dota AI。

OpenAI 是由特斯拉CEO埃隆·馬斯克成立的一家非營(yíng)利公司，旨在開發(fā)更安全的AI技術(shù)，預(yù)防人工智能帶來(lái)的危害。目前，OpenAI 的全職員工已經(jīng)超過(guò)50 人。

在賽前的宣傳片里，OpenAI 開發(fā)的Dota AI已經(jīng)打敗了現(xiàn)役的Arteezy、SumaiL等世界冠軍。

而讓人大跌眼鏡的是，比賽開始沒(méi)10分鐘，曾經(jīng)的世界最頂尖的solo選手dendi就打出了GG（goodgame，投降），敗下陣來(lái)，而且是被AI打的毫無(wú)還手之力。

最令人窒息的是AI的進(jìn)攻性非常強(qiáng)，打法侵略性十足，一旦有了一點(diǎn)點(diǎn)優(yōu)勢(shì)就會(huì)開始?jí)褐啤?/span>

根據(jù)OpenAI官方給出的數(shù)據(jù)，AI每分鐘的操作次數(shù)（APM）僅僅是人類的平均水準(zhǔn)，換言之，AI的每次出手收益都比Dendi更高，無(wú)效操作更少。

也就是說(shuō)，AI不會(huì)有任何無(wú)效操作，這樣在對(duì)陣過(guò)程中，AI英雄消耗和被消耗也會(huì)大大減少，然后AI將有更多的經(jīng)濟(jì)轉(zhuǎn)化為屬性裝，而玩家將消耗大量經(jīng)濟(jì)在補(bǔ)給和回復(fù)上。

這樣可怕AI，人類沒(méi)有任何機(jī)會(huì)，完全碾壓！

而讓人無(wú)法想象的是，AI不需要任何訓(xùn)練數(shù)據(jù)，完完全全從零開始，整個(gè)學(xué)習(xí)過(guò)程隨機(jī)開始，并且通過(guò)和自己對(duì)抗進(jìn)行學(xué)習(xí)。從工作人員的口中得知，AI一開始也是出現(xiàn)許多游戲里的“愚蠢”行為，但很快就通過(guò)“自主”學(xué)習(xí)，學(xué)會(huì)了人類玩家們的操作和技巧，到現(xiàn)在擊敗世界冠軍一共也就花了僅僅兩周的時(shí)間，成長(zhǎng)速度快的嚇人。

OpenAI的團(tuán)隊(duì)在賽后表示，這一次人機(jī)solo只是一個(gè)初步的嘗試，將在DOTA2 TI8上上演5V5的人機(jī)對(duì)戰(zhàn)。

這不，就在一周前的8月6號(hào)，OpenAI Five開始了與人類正式的二番戰(zhàn)，5v5人機(jī)對(duì)戰(zhàn)，由前職業(yè)選手組成的戰(zhàn)隊(duì)對(duì)戰(zhàn)OpenAI Five。

二番戰(zhàn)罷，人類果然一敗涂地

北京時(shí)間8月6日早上5點(diǎn)58分，人類半職業(yè)Dota高手隊(duì)對(duì)戰(zhàn)OpenAI Five第二局接近尾聲，被稱為“大老師”的DotaPlus大數(shù)據(jù)對(duì)人類戰(zhàn)隊(duì)宣判了死刑。

它說(shuō)，AI戰(zhàn)隊(duì)的勝率是100%。

6點(diǎn)整，人類第二次打出GG，AI宣告勝利。

這是OpenAI Five首次在5v5戰(zhàn)局中，對(duì)上職業(yè)選手。今天的人類代表隊(duì)由職業(yè)和半職業(yè)選手組成，在舊金山和AI展開三局兩勝的廝殺。

結(jié)果似乎并不出人預(yù)料，三局兩勝的賽制，OpenAI Five“榮耀2:1”戰(zhàn)勝了人類戰(zhàn)隊(duì)。

AI究竟是通過(guò)什么樣的方式讓人類玩家一敗涂地的呢？

目前可以得知的情況是這樣：OpenAI訓(xùn)練Dota的方式，是讓AI從隨機(jī)狀態(tài)開始，依靠自我對(duì)局來(lái)優(yōu)化。

（以下信息來(lái)自O(shè)penAI Five官網(wǎng)）

通過(guò)自我對(duì)抗學(xué)習(xí)，OpenAI Five 每天相當(dāng)于玩180年的游戲。訓(xùn)練上，它使用256 塊GPU、12萬(wàn)8000 個(gè)CPU核心使用近端策略優(yōu)化（ProximalPolicy Optimization）方法進(jìn)行訓(xùn)練，這是在去年建立的solo Dota2系統(tǒng)上的擴(kuò)增。OpenAI為每個(gè)英雄使用單獨(dú)的一個(gè)LSTM，模型就可以在沒(méi)有人類數(shù)據(jù)的情況下學(xué)到可識(shí)別的策略。這表明強(qiáng)化學(xué)習(xí)即使沒(méi)有根本性的進(jìn)步，也能夠產(chǎn)生大規(guī)模但也可接受的長(zhǎng)期規(guī)劃。

Dota2是一個(gè)實(shí)時(shí)的5 v 5策略游戲，每個(gè)玩家控制一個(gè)英雄。而玩Dota 的 AI 需要掌握以下技能：

長(zhǎng)線策略。Dota 游戲平均每秒 30 幀，一場(chǎng)時(shí)常 45 分鐘，大概 8 萬(wàn) tick。大部分操作（例如操縱英雄移動(dòng)）都有單獨(dú)的小影響，但一些個(gè)體行為可能會(huì)影響到游戲戰(zhàn)略，例如 TP 回家。此外，還有一些策略可能會(huì)終結(jié)整場(chǎng)游戲。OpenAI Five 每 4 幀觀察一次，產(chǎn)生了 2 萬(wàn)個(gè)決策。相比之下，國(guó)際象棋一般在 40 步之前就結(jié)束了，圍棋大概 150 步，但這些游戲每一步都很有策略性。
局部可觀測(cè)狀態(tài)。己方單位和建筑的視野都有限。地圖的其他部分是沒(méi)有視野的，可能藏有敵人和敵方策略。高玩通常需要基于不完整數(shù)據(jù)做推理，以及建模敵方意圖。而國(guó)際象棋和圍棋都是完全信息博弈。
高維、持續(xù)的行為空間。在 Dota 中，每個(gè)英雄能采取數(shù)十種行為，而且許多行為要么面向敵方單位，要么點(diǎn)地移動(dòng)位置。我們把這個(gè)空間離散到每個(gè)英雄 17 萬(wàn)種可能的操作（不是每 tick 都有效，例如在技能冷卻時(shí)放技能就是無(wú)效操作）；不計(jì)算連續(xù)部分，每 tick 平均 1000 個(gè)可能有效行為。國(guó)際象棋的行為數(shù)量大概是 35，圍棋 250。
高維、連續(xù)的觀察空間。Dota 是在一張包含 10 個(gè)英雄、20 幾個(gè)塔、數(shù)十個(gè) NPC 單位的地圖上操作的游戲，此外還有神符、樹、眼衛(wèi)等。通過(guò) Valve（Dota 2 的運(yùn)營(yíng)公司）的 Bot API，我們的模型把 Dota 游戲視為 2 萬(wàn)個(gè)狀態(tài)，也就代表人類在游戲中可獲取到的所有信息。國(guó)際象棋代表大概 70 個(gè)枚舉值（8x8 的棋盤，6 類棋子和較小的歷史信息）。圍棋大概有 400 個(gè)枚舉值（19x19 的棋盤，黑白 2 子，加上 Ko）。

Dota規(guī)則也非常復(fù)雜，這類游戲開發(fā)了十幾年，成百上千的代碼行實(shí)現(xiàn)游戲邏輯。而且游戲每?jī)芍芨乱淮?，環(huán)境語(yǔ)義一直在變。

所以OpenAI Five有著一套自己的學(xué)習(xí)算法。

OpenAI Five的系統(tǒng)使用一個(gè)高度擴(kuò)展版本的近端策略優(yōu)化（ProximalPolicy Optimization）算法進(jìn)行學(xué)習(xí)。OpenAI Five 和之前的1v1機(jī)器人都是通過(guò)自我對(duì)抗進(jìn)行學(xué)習(xí)的。他們從隨機(jī)參數(shù)開始，并不從人類玩家的方法中進(jìn)行搜索或者自舉。

前后兩個(gè)系統(tǒng)在效率上的提升是巨大的

AI選手們?cè)谟?xùn)練中飯量驚人，承載它們需要256塊P100GPU和12.8萬(wàn)個(gè)CPU核心。

DOTA職業(yè)選手每天的訓(xùn)練強(qiáng)度是12個(gè)小時(shí)，而DOTA AI的訓(xùn)練強(qiáng)度則是每天相當(dāng)于180年，如此快速學(xué)習(xí)和龐大訓(xùn)練強(qiáng)度，能夠擊敗半職業(yè)戰(zhàn)隊(duì)確實(shí)不難想象。

三番戰(zhàn)或?qū)⒃赥I8上演

TI7上，OpenAI閃亮登場(chǎng)，贏下了solo賽，引起了不小的關(guān)注，不少隊(duì)伍和選手都想要和這些聰明的機(jī)器bot過(guò)招。

就在兩周前，OpenAI Five在5v5的比賽中以2-1擊敗了前職業(yè)選手組成的臨時(shí)戰(zhàn)隊(duì)?？雌饋?lái)這支隊(duì)伍已經(jīng)有了參加TI的能力，V社想要OpenAI來(lái)溫哥華參加本屆TI。目前他們正在調(diào)整日程表，爭(zhēng)取給OpenAI一個(gè)和頂尖職業(yè)選手過(guò)招的機(jī)會(huì)。

在經(jīng)過(guò)一年的開發(fā)后，相信今年的OpenAI歸來(lái)后肯定會(huì)變得更強(qiáng)，究竟職業(yè)戰(zhàn)隊(duì)能否打得過(guò)人工智能呢，也是讓人拭目以待。

寬泛科技專注為人工智能、影視后期、VR/AR/MR、視覺(jué)計(jì)算、虛擬化云計(jì)算、商務(wù)應(yīng)用等行業(yè)客戶提供基于深度學(xué)習(xí)、人臉識(shí)別、圖像識(shí)別、視頻分析、無(wú)人駕駛、醫(yī)療影像識(shí)別等硬件解決方案。

如有需求歡迎郵件至 hezuo@cloudhin.com

返回列表

精品久久久久久中文字幕,狠狠干夜夜操,高h纯肉无码视频在线观看,日韩欧美成人一区二区三区,日本三级电影精品五区

【熱點(diǎn)資訊】人工智能再下一城！碾壓Dota2準(zhǔn)職業(yè)玩家的OpenAI Five究竟是何方神圣？

核心業(yè)務(wù)

合作伙伴

客戶案例

新聞資訊

行研報(bào)告

關(guān)于我們

加入我們

會(huì)員中心

精品久久久久久中文字幕,狠狠干夜夜操,高h纯肉无码视频在线观看,日韩欧美成人一区二区三区,日本三级电影精品五区

【熱點(diǎn)資訊】人工智能再下一城！碾壓Dota2準(zhǔn)職業(yè)玩家的OpenAI Five究竟是何方神圣？

推薦新聞

標(biāo)準(zhǔn)體系覆蓋多地老舊小區(qū)改造，智慧點(diǎn)亮人民美好生活

智能預(yù)警、可視指揮，AI賦能工廠安防走向智慧時(shí)代

核心業(yè)務(wù)

合作伙伴

客戶案例

新聞資訊

行研報(bào)告

關(guān)于我們

加入我們

會(huì)員中心

【熱點(diǎn)資訊】人工智能再下一城！碾壓Dota2準(zhǔn)職業(yè)玩家的OpenAI Five究竟是何方神圣？

標(biāo)準(zhǔn)體系覆蓋多地老舊小區(qū)改造，智慧點(diǎn)亮人民美好生活

智能預(yù)警、可視指揮，AI賦能工廠安防走向智慧時(shí)代