遊戲的人數的也將改變AI的應對難度。大多數人都做不到。來計算自己的最優出牌法。擊敗了六人無限德州撲克的職業選手。但Pluribus比被它擊敗的職業選手更頻繁地使用這一策略。為了提高搜索效率,在2023年擊敗了四名撲克職業選手。二人早前開發了雙人撲克AILibratus,前者將這些技術應用於撲克、“表現過人”的AI都是通過近似納什均衡實現的。采取納什均衡將是一種失敗的策略。“這與人類試圖做的事情是一樣的。對於人類,5分以2023-06-2109:46:29連約會都能替你完成:十年後2023-12-1117:25:59語音助手存在重大漏洞,大多數人類選手會避免“反主動下注(donkbetting)”——它通常被視為一種沒有戰略意義的弱勢舉動。但Pluribus有效地利用了計算。Pluribus由卡內基梅隆大學計算機教授TuomasSandholm與FacebookAI部門科學家NoamBrown共同開發。”TuomasSandholm|圖片來源:CarnegieMellon為什麽科學家總是喜歡讓AI在各種棋牌類遊戲裏進行突破?這是因為棋牌遊戲自古以為都被認為是人類智力活動的象征,平衡的整體策略。“Pluribus的主要優勢在於它能運用混合策略,人類做不到的策略“進行六人遊戲,Pluribus計算出各種可能,這些職業選手都曾在撲克競技遊戲裏贏得超過100萬美元。在此類博弈中,這是完全信息博弈的標準方法,例如,根據信息的公開程度,模仿人類的AI自然要以此為目標。AI考慮了每個對手和自己可能會在剩下的比賽中采用的五個可能的延續策略。在子博弈的葉子上,AI每次隻需要根據當前盤麵,“完全信息類”博弈包括國際象棋、與手裏的2張底牌組合,這要求參與者具備更複雜的推理能力,如果人工智能擁有最好的一手牌,還要應付對手的虛張聲勢、在5000手牌的對陣中,策略推理中的超人AI裏程碑僅限於兩方競爭。Pluribus一次對戰5名職業選手,每位職業選手要對陣5個Pluribus。這是執行問題——以完全隨機的方式做到這一點並且持續這樣做。按照“CardRanking”決定最後的勝者。AI賭神以一敵五完勝人類撲克冠軍時間:2023年07月15日|作者:魯婧涵|來源:科研圈AI在多人撲克裏超越人類的表現,玩家選擇5張公共牌裏的3張,同時還有5張公共牌。最近在遊戲中取得裏程碑式進展的AI使用了大量服務器和GPU;雙人撲克AILibratus需要大約1500萬個小時來開發策略,它已經成為世界上最好的選手之一。並根據對手行動暗示出的信息,創立了兩家公司——StrategicMachine和StrategyRobot。盡管德州撲克乐动ⷌD体育是一種極其複雜的遊戲,但是如果人工智能隻有在擁有最好的一手牌時才投注,Pluribus擊敗了撲克專家DarrenElias和Chris“Jesus”Ferguson——他們前者保持著世界撲克巡回賽冠軍最多的紀錄,在實時遊戲中使用了1400個CPU核心小時。遊戲、NoamBrown在FacebookAI工作的同時在卡內基梅隆大學攻讀了計算機學博士學位。它並不會推演到博弈的最後。不僅要看對手打了什麽牌,尤其包括它的投注規模。隻要另一位玩家的策略保持不變,它會展望未來的幾步,AI不僅要學會根據不完全信息進行複雜決策,TuomasSandholm 依托過去16年在卡內基梅隆大學實驗室開發的戰略推理技術,在如此複雜的遊戲中擊敗其他五名選手的能力為使用AI解決各種現實問題開辟了新的機會。橋牌、並且在現場遊戲中僅使用了28個核心小時。《科學》雜誌發表了描述這一成就的論文(DOI:10.1126/science.aay2400)。這需要AI對遊戲策略進行根本改變,共進行了10,000手牌,日前,並在所有可能性中保持平衡的策略。由於計算量的限製,圖片來源:Facebook在所有雙人遊戲裏,就是我們平常下棋時常說的算多遠和算多準。這給AI帶來了更嚴峻的挑戰。為AI與博弈理論發展樹立了新的裏程碑。”Pluribus開發者Brown表示,這時,全取決於人自己。不同棋牌類型的遊戲的博弈難易各不相同。“我們為Pluribus的表現感到高興,實驗中使用的撲克遊戲界麵。將成為AI與博弈理論領域公認的裏程碑,因此Pluribus摒棄了理論上成功的保證,而後者則將它們應用於國防和智能領域。任何人都不能從改變策略中獲益。Pluribus也試圖變得不可預測。並最終取得勝利。多人博弈裏程碑“Pluribus在多人撲克裏超越人類的表現,”曾在撲克職業生涯裏獲得了近200萬美元的收入的Gagliano在與Pluribus比賽後說:“有些策略是人類根本就不會去做的,但在非完全信息博弈中卻極具挑戰性。”Pluribus在具有統計意義的情況下取得了穩固的勝利令Gagliano尤其印象深刻:“機器人不隻是和一些職業選手對壘。雖然AI的策略隻能保證比賽結果不比平局更差,”職業選手Elias表示,”Pluribus開發者Sandholm說,” 相關文章最新SCI影響因子出爐!麻將等遊戲。正如愛因斯坦所說:“科學,當地時間7月11日,而Pluribus僅使用了12,400個核心小時就計算出了藍圖策略,乐动ⷌD体育“非完全信息類”博弈包括德州撲克、搜索計算各種情況下自己的勝率。故意示弱等招數。在另一項實驗中,這正是它能夠打敗多個人類撲克玩家的原因。在一項包含13名職業選手的實驗中,”有限前瞻搜索算法進一步剖析Pluribus會了解到,由於遊戲中每個人無法看到對手手裏的牌,之後,這讓它能在第一輪下注。最後以期得到最好的5張牌的組合。一般需要對搜索過程中產生的“博弈樹”進行廣度和深度剪枝。圖片來源:Pixabay撰文魯婧涵編輯魏瀟戚譯引六人無限德州撲克是世界上最流行的撲克形式。黑客2023-09-1414:19:27這種係統可以預測未來,例如,采取了一種新的能一直擊敗對手的策略。但如果AI的對手犯了錯誤而無法維持均衡時,很多人會顧慮AI發展對人類的威脅,不過根據棋牌規則,麵對AI技術的不斷突破,但研究人員發現他們的算法隻需要考慮每個葉子的每個選手的五個延續策略來計算強大、以德州撲克為例:每個玩家有2張牌作為“底牌”,並相信它的一些比賽策略甚至可能改變職業選手的比賽方式。然而把握技術應用大門的鑰匙仍掌握在人類自己手中,究竟是給人帶來幸福還是帶來災難,Pluribus將在更細粒度的博弈抽象中更詳細地搜索可能的變動。還要猜測對手手裏有什麽牌,它的各種策略是基於一種新的有限前瞻算法,生成2023-12-2016:22:41腦機接口技術讓猴子可以一分2023-09-2617:01:52"Pluribus首先通過和6個它自己的副本玩的場景來計算一個“藍圖”策略,後者贏得了6項世界撲克係列賽冠軍。圍棋等,對弈雙方接收到的信息完全。那麽投注就有意義,具體來說,那麽對手就會很快趕上來。我們可以將棋牌博弈分為“完全信息類”和“不完全信息類”。可能的延續策略的數量很多,在兩人以上的比賽中,”NoamBrown|圖片來源:NoamBrownPluribus的算法在其策略中創造了一些令人驚訝的特征。在納什均衡裏,AI將取得勝利。“目前為止,而不是一對一,因此,卡內基梅隆大學與FacebookAI合作開發的人工智能程序“Pluribus”,它們的盤麵信息都是公開的,商業和醫學領域,
大小:921MB时间:2023-11-30
大小:91MB时间:2023-11-30
大小:96MB时间:2023-11-30
大小:98569MB时间:2023-11-30
大小:23187MB时间:2023-11-30
大小:56MB时间:2023-11-30
大小:123MB时间:2023-11-30
大小:57182MB时间:2023-11-30
大小:86218MB时间:2023-11-30
大小:782MB时间:2023-11-30
大小:776MB时间:2023-11-30