“閨女,我這兒正忙呢?!?
“爸,給你傳了份資料,你看看?!?
“什么資料?”
“小燁整理的關(guān)于peter的工作原理?!?
“他?他知道什么??!”
“你先看看吧。”
“資料可靠嗎?”
“你忘了小燁干什么的了?人家可是世界級的數(shù)學(xué)工作者,電腦程序這種東西,都是從數(shù)學(xué)二進(jìn)制來的,您說可靠嗎?在這一塊,他才是專業(yè)的,聽一個世界數(shù)學(xué)家的研究,總比一群圍棋選手研究出來的東西要強(qiáng)吧?”
“行了,我看看吧?!?
掛了線,吳長河就拿手機(jī)接收了文件。
不多時,單東河回來了,應(yīng)付幾十個記者媒體,讓他十分疲憊,因為他真的無法給出一個結(jié)論。
人又湊在一起了。
吳長河突然道:“來,都看看這個!”
“?。俊?
“什么東西?”
“長河老師,怎么了?”
眾人都看過來。
吳長河說道:“有人給了我一份關(guān)于那個p什么的東西的工作原理?!彼褨|西給了弟子田偉偉,“放屏幕上給大家看?!?
田偉偉立即道:“好的!”
眾人半信半疑。
“工作原理?”
“有人分析出來了?”
“是真的嗎?”
“這也太快了吧?”
單東河也眼睛一亮,趕緊大步上去,“吳哥,是誰發(fā)來的?”
吳長河撇了撇嘴,“你別管是誰了,反正是個搞數(shù)學(xué)工作的?!?
屏幕很快打出來了!
眾人全部看去!
向榮也抬起頭!
peter。
這是一款圍棋人工智能程序。
主要包括4個部分:
1.走棋網(wǎng)絡(luò)(policy-ork),給定當(dāng)前局面,預(yù)測采樣下一步的走棋。
2.快速走子(fast-rollout),目標(biāo)和1一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比1快1000倍。
3.估值網(wǎng)絡(luò)(value-ork),給定當(dāng)前局面,估計是白勝還是黑勝。
4.蒙特卡羅樹搜索(monte-carlo-tree-search,mcts),把以上這三個部分連起來,形成一個完整的系統(tǒng)。
它的主要工作原理是深度學(xué)習(xí)。深度學(xué)習(xí)是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會把大量矩陣數(shù)字作為輸入,通過非線性激活方法取權(quán)重,再產(chǎn)生另一個數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)‘大腦’進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識別物體標(biāo)注圖片一樣。它有兩個“大腦”,是通過兩個不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來改進(jìn)下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些圖片搜索引擎識別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過過濾,13個完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。
第一大腦:落子選擇器(move-picker)。
第二大腦:棋局評估器(position-evaluator)。
等等等等!
兩千字的研究分析,好像一個科研項目書,太專業(yè)了!
眾多職業(yè)棋手們都看傻了,好多專業(yè)性的單詞和詞語,他們甚至都看不懂,只能靠蒙,但大致也理解了peter到底是個什么東西!
向榮九段驚愕道:“這是誰寫的?”
院長單東河也道:“吳哥,你還認(rèn)識這種高人?到底哪位數(shù)學(xué)家?。俊?
“你管是誰呢?!眳情L河反正看不懂這些東西,“你就說有沒有用吧?”
“當(dāng)然有用!”陳瑛是最激-動的,她不但是個頂尖女棋手,還是個學(xué)霸,她是正兒八經(jīng)清華數(shù)學(xué)系的學(xué)生,“這份分析資料太重要了!這已經(jīng)把peter的運(yùn)作模式都曝光了!如果這是真的,這個人工智能絕不是老美吹噓的那樣會思考,它根本不會思考,只是讓人以為它會思考而已,它的核心還是數(shù)據(jù)處理!”
兩個“大腦”?
深度學(xué)習(xí)?
終于知道了!
終于知道這個peter的真面目了!(未完待續(xù)。)
_a