AI玩轉(zhuǎn)德州撲克 對(duì)網(wǎng)絡(luò)博彩業(yè)帶來致命打擊
matthew 2017.02.24 07:55 人工智能概念股
人工智能研究最近取得的突破,引發(fā)了關(guān)于機(jī)器人是否會(huì)給網(wǎng)絡(luò)博彩業(yè)構(gòu)成威脅的質(zhì)疑。
全球4名頂尖職業(yè)撲克玩家歷經(jīng)20天的鏖戰(zhàn),還是在美國(guó)匹茲堡的大河賭場(chǎng)(Rivers Casino)以失敗收?qǐng)觥?/p>
比賽期間,他們會(huì)在上午11點(diǎn)前出現(xiàn),身著運(yùn)動(dòng)褲和時(shí)尚的運(yùn)動(dòng)鞋,在電腦屏幕前坐下來。
在夜晚返回酒店之前,他們每天都需要玩1500手無限制德州撲克。這經(jīng)常意味著他們需要打牌至晚上10點(diǎn)以后。
在一整天的時(shí)間里,星巴克咖啡和礦泉水就放在這幾位牌手的鍵盤旁邊,腳下則放著快餐袋。
當(dāng)這些撲克玩家每一次做出動(dòng)作時(shí),這些動(dòng)作都會(huì)被傳輸?shù)轿挥?英里之外的卡耐基梅隆大學(xué)的一臺(tái)計(jì)算機(jī)服務(wù)器。通過這臺(tái)服務(wù)器,信號(hào)將被再傳輸12英里,至位于門羅維爾郊區(qū)匹茲堡超級(jí)計(jì)算機(jī)中心上運(yùn)行的一款名為“Libratus”的軟件。
Libratus同時(shí)玩8手牌–與每位選手同時(shí)玩兩手牌。它從容不迫的做出決定,緩慢的速度讓對(duì)手賈森·賴斯(Jason Les)幾近瘋狂?!八寱r(shí)間變得更長(zhǎng),”賴斯說?!暗却粦?yīng)該影響我,但有時(shí)你會(huì)喜歡‘好吧,這是要結(jié)束了嗎?’”
當(dāng)然,Libratus永遠(yuǎn)不需要休息。在其它方面,它也不同于人類玩家。當(dāng)投入更多的賭注時(shí),人們傾向于思考更長(zhǎng)的時(shí)間。Libratus在投入的籌碼較少時(shí)玩的非常慢,因?yàn)槭种杏懈嗟幕I碼,它必須考慮到所有的可能性。Libratus還會(huì)違反標(biāo)準(zhǔn)投注習(xí)慣,突然加大籌碼,不定時(shí)投入不規(guī)則數(shù)量的籌碼。
對(duì)于人類撲克玩家來說,這樣的行為是惱人的、魯莽的,從長(zhǎng)期來看也是代價(jià)高昂的。但是作為撲克玩家,Libratus的主要貢獻(xiàn)就是它的無人性。
當(dāng)為期20天的賽事在大河賭場(chǎng)結(jié)束時(shí),職業(yè)撲克玩家合計(jì)輸了180萬美元。(事實(shí)上他們并不需要投入任何錢,這個(gè)數(shù)值只是在撲克比賽中用于計(jì)算得分。)
卡耐基梅隆大學(xué)負(fù)責(zé)開發(fā)Libratus的兩位計(jì)算機(jī)科學(xué)家圖奧馬斯·桑德霍爾姆(Tuomas Sandholm)和諾姆·布朗(Noam Brown),對(duì)Libratus的獲勝感到非常激動(dòng),因?yàn)檫@是計(jì)算機(jī)在全球最知名的撲克游戲–無限制德州撲克中首次擊敗頂尖職業(yè)撲克玩家。
人工智能領(lǐng)域的專家經(jīng)常使用游戲,用于開發(fā)和測(cè)試他們的發(fā)明成果。計(jì)算機(jī)已在國(guó)際象棋、跳棋、雙陸棋和圍棋上擊敗了最好的人類棋手。因?yàn)闄C(jī)會(huì)的原因,以及玩家不知道他們的對(duì)手拿著什么樣的牌,撲克成為了一項(xiàng)獨(dú)特的挑戰(zhàn)。所謂的不完美信息游戲需要一絲人類智慧,類似于欺騙對(duì)手,并能夠察覺到被對(duì)手欺騙–這些都是電腦缺乏的。
《完美的賭注:科學(xué)和數(shù)學(xué)如何從賭博中獲得好運(yùn)》一書的作者亞當(dāng)·庫哈爾斯基(Adam Kucharski)指出,“經(jīng)常能夠看到無限制德州撲克的巡回賽,它更像是一門藝術(shù),而不像是一門科學(xué)。曾經(jīng)有一種想法認(rèn)為,這個(gè)游戲在很長(zhǎng)時(shí)間內(nèi)不會(huì)受到計(jì)算機(jī)的影響?!?/p>
但是這種想法在最近幾周變得土崩瓦解。上月初,阿爾伯塔大學(xué)的研究人員撰寫了一篇基于他們開發(fā)的人工智能DeepStack與職業(yè)撲克玩家對(duì)抗賽的論文。
在這場(chǎng)對(duì)抗賽中,DeepStack擊敗了11位職業(yè)撲克玩家。這篇論文介紹了DeepStack,這是一種用于撲克這樣的不完美信息環(huán)境的新算法。它結(jié)合了回歸推理來處理信息不對(duì)稱性,還結(jié)合了分解來把計(jì)算集中到相關(guān)的決策上,以及一種形式的關(guān)于任意牌的直覺–該直覺可以使用深度學(xué)習(xí)進(jìn)行自我玩牌而自動(dòng)學(xué)習(xí)。
有關(guān)DeepStack的表現(xiàn)是否優(yōu)于Libratus是一個(gè)有爭(zhēng)議的話題。桑德霍爾姆就表示,Libratus擊敗的職業(yè)撲克玩家要比DeepStack擊敗的玩家更優(yōu)秀。阿爾伯塔大學(xué)計(jì)算機(jī)項(xiàng)目負(fù)責(zé)人邁克爾·鮑林(Michael Bowling)承認(rèn)了這一點(diǎn)。但他質(zhì)疑職業(yè)撲克玩家能否保持相同的巔峰狀態(tài)連續(xù)比賽近一個(gè)月時(shí)間,而且DeepStack的勝率是Libratus的三倍。
不過桑德霍爾姆和鮑林都認(rèn)為,撲克人工智能僅僅是剛跨越了一道重要的門檻,對(duì)他們來說這與撲克本身無關(guān)。德州撲克僅是他們?yōu)樽约旱娜斯ぶ悄艹绦驅(qū)ふ覍?duì)練的途徑之一。
通過游戲機(jī)器人學(xué)習(xí)到的經(jīng)驗(yàn)將被應(yīng)用到網(wǎng)絡(luò)安全等應(yīng)用程序當(dāng)中。桑德霍爾姆說,“這是人工智能社區(qū)早已設(shè)定的主要基準(zhǔn),這些算法并會(huì)單獨(dú)提供給撲克玩家。它們是通用的?!蓖獗砼c比爾·蓋茨(Bill Gates)有幾分相似的的桑德霍爾姆,曾是全球最頂尖的帆板運(yùn)動(dòng)員之一。
DeepStack和Libratus玩的是一個(gè)不同版本的德州撲克比賽。計(jì)算機(jī)與單個(gè)對(duì)手對(duì)抗,而不是一組玩家。在每一手牌之后,籌碼都會(huì)重新統(tǒng)計(jì),從而消除擁有更多籌碼的玩家能夠恐嚇較差玩家,迫使他們作出大賭注這種復(fù)雜的心理游戲。
全球領(lǐng)先的在線撲克平臺(tái)PokerStars發(fā)言人埃里克·霍爾雷瑟(Eric Hollreiser)表示,這種規(guī)則限制了人工智能向撲克界發(fā)起的威脅。“雖然人工智能能夠模擬參加撲克比賽,但是牌桌上發(fā)生的事情要比這些復(fù)雜的多?!?/p>
人工智能還在一些非受控環(huán)境中進(jìn)行試驗(yàn)。自科學(xué)家在實(shí)驗(yàn)室開發(fā)人工智能技術(shù)以來,撲克機(jī)器人就一直在參與在線現(xiàn)金博彩游戲。它們傳統(tǒng)上一直參與低籌碼的比賽,且從未被認(rèn)為是技藝精湛。
不過博彩業(yè)分析師克里斯·格羅夫(Chris Grove)表示,機(jī)器人已開始進(jìn)入一些高籌碼的比賽?!叭绻闶窃诰€撲克游戲運(yùn)營(yíng)商,機(jī)器人可能是你頭號(hào)關(guān)注的重點(diǎn),而且它們可能會(huì)有非常高的勝率,”他說。
撲克產(chǎn)業(yè)與撲克學(xué)術(shù)界已悄然合作多年。雖然參與合作的所有人都未透露細(xì)節(jié),但商用機(jī)器人的開發(fā)者和試圖擊敗他們的人都密切關(guān)注著最新的學(xué)術(shù)動(dòng)態(tài)。鮑林的幾名學(xué)生在畢業(yè)后就前往在線撲克公司任職。至少有一人已在出售用于在線比賽的機(jī)器人。
“當(dāng)然,許多賭徒都在擔(dān)心,機(jī)器人為錢扼殺了網(wǎng)絡(luò)博彩業(yè),因?yàn)槿藗儞?dān)心機(jī)器人變得太出色,從而影響到網(wǎng)絡(luò)博彩業(yè)的發(fā)展,”桑德霍爾姆說?!斑@可能會(huì)發(fā)生,但不是我關(guān)注的問題。”
在撲克俚語中,一個(gè)可以為玩家打牌的電腦程序被稱為“夢(mèng)想機(jī)器”。在線論壇的參與者經(jīng)常會(huì)交換如何通過可以行為察覺到機(jī)器人玩家的存在,以及如果用自己的機(jī)器人獲勝的相關(guān)經(jīng)驗(yàn)。
歸屬于加拿大游戲公司Amaya的PokerStars,雇傭了70人專門負(fù)責(zé)打擊此類欺詐行為。這些雇員會(huì)向玩家打電話,詢問他們?cè)谔囟ㄅ凭种胁捎玫膽?zhàn)術(shù)。PokerStars還向玩家發(fā)送電子郵件,要求他們使用360度全景攝像頭拍攝周圍的視頻,然后要求他們用手玩一個(gè)小時(shí)以上,且鍵盤完全在可視范圍之內(nèi)。
機(jī)器人在撲克比賽中并不需要非常熟練就能夠給他們的主人帶來利潤(rùn),這對(duì)整個(gè)在線博彩業(yè)而言都是非常危險(xiǎn)的。程序可以通過戰(zhàn)勝普通玩家獲取到適度的利潤(rùn)。不過英國(guó)在線游戲公司Gamesys首席撲克戰(zhàn)略官達(dá)斯·比林斯(Darse Billings)認(rèn)為,夢(mèng)想機(jī)器或?qū)W術(shù)人工智能使用了不同的技術(shù),試圖解決
根本不同的挑戰(zhàn)。擊敗普通玩家不僅僅是擊敗精英玩家的簡(jiǎn)化版本。這是一個(gè)完全獨(dú)立的問題。
比林斯比任何人都更了解兩個(gè)撲克世界。在上世紀(jì)90年代獲得計(jì)算機(jī)科學(xué)碩士學(xué)位的同時(shí),他一直在研究撲克游戲,然后他成為了一名職業(yè)撲克牌手,并償還了自己的學(xué)生貸款。
幾年之后,他又重返校園與阿爾伯塔大學(xué)的計(jì)算機(jī)科學(xué)家喬納森·斯卡費(fèi)爾(Jonathan Schaeffer)進(jìn)行合作,后者以編寫完美的跳棋軟件而知名。在比林斯的勸說下,斯卡費(fèi)爾把目光轉(zhuǎn)向了撲克。
從1989年開始,斯卡費(fèi)爾和同事就致力于開發(fā)跳棋人工智能程序。通過研究5萬億億個(gè)跳棋位置,研究人員于2007年4月完成了切努克(Chinook)終極程序,它是無法被擊敗的–就算人類智力發(fā)揮到極限,也只能跟它打個(gè)平手。當(dāng)斯卡費(fèi)爾開始奇努克計(jì)劃時(shí),他的目標(biāo)就是要戰(zhàn)勝跳棋世界冠軍。
1990年,他的程序首次獲得了與世界冠軍同場(chǎng)競(jìng)技的機(jī)會(huì)。不過,直到1992年,人工智能程序始終沒有戰(zhàn)勝世界冠軍。一切在1994年發(fā)生了轉(zhuǎn)變。當(dāng)年,斯卡費(fèi)爾設(shè)計(jì)的程序第一次戰(zhàn)勝了人類國(guó)際跳棋世界冠軍馬里恩·廷斯利,這一成就也被載入了吉尼斯世界紀(jì)錄。
斯卡費(fèi)爾和同事創(chuàng)造切努克程序的目的,一是為了開發(fā)計(jì)算機(jī)的高級(jí)處理和存儲(chǔ)能力,同時(shí)也為了確定人工智能方法在西洋跳棋上的最佳表現(xiàn)。在一些頂尖棋手的幫助下,斯卡費(fèi)爾利用啟發(fā)法將高手的經(jīng)驗(yàn)編成計(jì)算機(jī)程序,從而使它能夠產(chǎn)生對(duì)在特定局勢(shì)下每一步棋成功和失敗的“認(rèn)識(shí)”。在程序運(yùn)行過程中,研究人員不斷對(duì)程序進(jìn)行監(jiān)控、修正和更新。
通過每天高強(qiáng)度的計(jì)算(相當(dāng)于50臺(tái)個(gè)人電腦以200倍的峰值運(yùn)算速度同時(shí)運(yùn)行),斯卡費(fèi)爾等人終于得到了最終的奇努克程序。
在阿爾伯塔大學(xué)的鮑林于2003年把納什均衡定律帶入撲克游戲一年之后,卡耐基梅隆大學(xué)的桑德霍爾姆在隨后一年也開始了撲克人工智能的研究,并采取了類似的做法。桑德霍爾姆和鮑林在2006年聯(lián)合創(chuàng)辦了計(jì)算機(jī)撲克大賽,并經(jīng)常性的與頂尖職業(yè)撲克玩家進(jìn)行比賽。在比賽的同時(shí),兩個(gè)學(xué)校的實(shí)驗(yàn)室也會(huì)關(guān)注對(duì)方的最新研究成果。
在過去的幾年間,兩個(gè)學(xué)校的人工智能技術(shù)在游戲收尾階段的表現(xiàn)都有了突飛猛進(jìn)的發(fā)展。
2015年1月,鮑林的團(tuán)隊(duì)發(fā)表了一篇論文,已找到一對(duì)一限注德州撲克的秘訣,因?yàn)榕c無限制德州撲克相比,前者會(huì)限制玩家下注的籌碼。
桑德霍爾姆與開發(fā)撲克人工智能5年時(shí)間的博士生布朗,幾個(gè)月后在大河賭場(chǎng)舉辦了首屆“大腦對(duì)抗人工智能”(Brains vs. Artificial Intelligence)巡回賽。在當(dāng)時(shí)的賽事中,卡耐基梅隆大學(xué)推出的是由桑德霍爾姆開發(fā)的另外一款人工智能系統(tǒng)“Claudico”。當(dāng)時(shí)共有4名職業(yè)撲克玩家參加了比賽。
Claudico并未獲得最終勝利,且贏得的籌碼數(shù)量要少于3名職業(yè)撲克玩家。在超過8萬手牌局中,Claudico總共輸?shù)袅?3.2萬美元。桑德霍爾姆曾表示,自己開發(fā)的人工智能已同職業(yè)玩家實(shí)力相當(dāng),至少有一位玩家在當(dāng)時(shí)的比賽中被擊敗。
桑德霍爾姆和布朗表示,他們開發(fā)的人工智能仍有需要改進(jìn)的地方。Claudico在入局階段表現(xiàn)的非常出色,但在牌局快結(jié)束時(shí)會(huì)犯一些錯(cuò)誤。它會(huì)在錯(cuò)誤的時(shí)刻恐嚇對(duì)手,并在計(jì)算牌時(shí)出現(xiàn)一些錯(cuò)誤。簡(jiǎn)而言之,當(dāng)牌桌上有兩個(gè)K,而你手中有2個(gè)K時(shí),對(duì)手就不會(huì)有K。Libratus在這些方面就得到了改進(jìn)。此外,Libratus還會(huì)根據(jù)每天牌局中學(xué)習(xí)到的經(jīng)驗(yàn)不斷進(jìn)行提升。
有關(guān)Libratus的細(xì)節(jié)將會(huì)在開發(fā)者最終發(fā)布的論文中對(duì)外披露。這種學(xué)術(shù)工作往往以各種方式滲透到現(xiàn)實(shí)世界撲克中。布朗表示,一年一度的電腦撲克大賽的參賽者也包括了玩現(xiàn)金游戲的玩家。鮑林則表示,他的研究論文在開發(fā)人工智能的社區(qū)中極受歡迎。他說:“有一群人在讀這些論文,并試圖理解它們?!?/p>
比林斯在2008年加入了撲克行業(yè),也是為數(shù)不多在離開阿爾伯塔大學(xué)的研究項(xiàng)目后加入撲克行業(yè)的人。他們中的絕大多數(shù)人都被游戲平臺(tái)運(yùn)營(yíng)商聘用。理查德·吉布森(Richard Gibson)開創(chuàng)了自己的事業(yè),開創(chuàng)了一家名為Robot Shark Gaming的游戲公司,專門為研究和玩戰(zhàn)略游戲開發(fā)人工智能程序。隨后,他又創(chuàng)辦了一家名為SportsBid的夢(mèng)幻體育公司。
當(dāng)吉布森在2013年獲得博士學(xué)位時(shí),一群職業(yè)玩家與他進(jìn)行了接觸,付費(fèi)要求為他們開發(fā)用于訓(xùn)練的軟件。吉布森只獲得了一位玩家的姓名,且未同任何人見面,直到現(xiàn)在他也不知道到底有多少當(dāng)時(shí)與他進(jìn)行了接觸。他說,“即便是他們不再網(wǎng)絡(luò)博彩中使用軟件,這也是恥辱?!?/p>
吉布森開發(fā)了多個(gè)程序,稱他設(shè)計(jì)的軟件只能展示各種戰(zhàn)術(shù)的效果,但自己不會(huì)參與比賽。在最輝煌的一年中,吉布森因?yàn)檫@個(gè)項(xiàng)目賺了10萬美元,且客戶會(huì)根據(jù)運(yùn)行軟件使用的計(jì)算能力另向他支付2萬至3萬美元。
匿名的職業(yè)牌手并不是吉布森的唯一客戶。他說,曾有人向他付費(fèi)數(shù)萬美元,要求他用半年時(shí)間開發(fā)一款撲克機(jī)器人。他并沒有問如何使用這個(gè)機(jī)器人,但設(shè)計(jì)指向一個(gè)特定的應(yīng)用程序?!拔业目蛻粝胍粋€(gè)獨(dú)立的東西,他們可以加載到他們的筆記本電腦,”他說。
“我想他們想讓它玩在線游戲?!?/p>
每天在大河賭場(chǎng)的比賽結(jié)束后,賴斯和其他幾名職業(yè)牌手都會(huì)查閱當(dāng)前的比賽數(shù)據(jù),用來尋找Libratus的弱點(diǎn)。在賽事之初,他們每天睡醒后都會(huì)對(duì)獲得的新技巧感到樂觀?!捌渲羞@種做法能夠奏效,我們不斷的對(duì)這些弱點(diǎn)進(jìn)行攻擊。但如今它們已完全消失了,”賴斯說。Libratus同樣也在進(jìn)行調(diào)整。在結(jié)束白天的比賽后,Libratus晚上會(huì)進(jìn)行“持續(xù)不斷的戰(zhàn)術(shù)改進(jìn)。”到了晚上,Libratus專注于戰(zhàn)略,使用了相當(dāng)于3330臺(tái)協(xié)同工作的Macbook的計(jì)算力。
當(dāng)然,DeepStack和Libratus都是在一對(duì)一的情況下?lián)魯×寺殬I(yè)選手,還無法被應(yīng)用到多人撲克比賽當(dāng)中,因?yàn)樗鼈儾捎玫木鈶?zhàn)略將在多人游戲中變得支離破碎。幾年之前,鮑林曾進(jìn)行過三個(gè)機(jī)器人進(jìn)行比賽的試驗(yàn)。其中兩個(gè)機(jī)器人使用了與他實(shí)驗(yàn)室相似的技術(shù),另一個(gè)被編程可魯莽的增加籌碼。到最后,最蠢的機(jī)器人只是輸?shù)袅艘恍〔糠只I碼,而另外兩個(gè)機(jī)器人則是一勝一負(fù)。
“這個(gè)確實(shí)非常困難。你如何推算出和你坐在同一個(gè)桌面上的是人類牌手,還是其他不出色的機(jī)器人?你必須得為此做好準(zhǔn)備,”道林說。
人工智能概念股:埃斯頓、科大智能、漢王科技、江南化工、華東數(shù)控、和而泰、中科曙光、永創(chuàng)智能、北京君正、通富微電、永創(chuàng)智能、勁拓股份。
人工智能概念股
那么問題來了:最值得配置的人工智能概念股是哪只?即刻申請(qǐng)進(jìn)入國(guó)內(nèi)首個(gè)免費(fèi)的非公開主題投資交流社區(qū)概念股論壇參與討論!
申明:本文為作者投稿或轉(zhuǎn)載,在概念股網(wǎng) http://www.guangshenggb.com/ 上發(fā)表,為其獨(dú)立觀點(diǎn)。不代表本網(wǎng)立場(chǎng),不代表本網(wǎng)贊同其觀點(diǎn),亦不對(duì)其真實(shí)性負(fù)責(zé),投資決策請(qǐng)建立在獨(dú)立思考之上。