一级毛片免费不卡在线,啦啦啦资源视频在线观看8,日韩无码啪啪小视频

寫暴走歐洲的系列文，寫了一半，實在忍不住回過頭來寫圍棋。今天這個題圖，我特意從棋魂動漫的視頻中，找到這一幕截出來的。

柯潔棄子認輸人機大戰(zhàn)第二盤究竟發(fā)生了什么？

第二盤棋，柯潔中盤認負，盤面上大龍橫死，如果僅從結局來看，似乎沒有第一盤，1/4子小負聽上去那么好。

但實際上，這盤棋的質量和精彩，超出很多人的想象，而我今天要說的是，這是alphago與人類的所有對局里，棋譜最完美的一份。

alphago最早是15年底，alphago V13版本，在未公開的情況下，與退居二線旅居歐洲的職業(yè)棋手樊麾老師進行了測試性的對局，五盤不記錄成績的對局里，alphago三勝兩負，（實際上樊老師贏了兩次alphago，不過是V13的版本，那個版本的實力尚不足以挑戰(zhàn)人類頂級高手），五盤記錄成績的對局里，alphago五勝零負。

這十盤棋譜，實際上質量都不高，樊老師當時壓力也很大，畢竟作為第一個輸給AI的職業(yè)棋手，情緒上出現(xiàn)波動是很難控制的。職業(yè)棋手當時基于此棋譜做出判斷，認為AI面對李世石不堪一擊，并非是盲目自信，但樊老師直到半年后，才有機會證明真的并非是自己的問題。

然而職業(yè)棋手完全低估了AI自我進化的能力，2016年的alphago V18版本，已經擁有碾壓完爆V13版本的實力，據說是可以讓V13差不多3個子的水平。與李世石的五盤棋的結果大家都知道了，四勝一負，但這五盤棋譜，從質量上來說，也難堪完美，重壓下的李世石多處技術變形，與其巔峰狀態(tài)相比其實還是有所差距；而alphago也存在多處被職業(yè)棋手詬病的處理方式，而第4局更是被李世石一個實質上不成立的妙手打爆。

實際上，當時AI即便存在應對錯誤，局面仍然很難說就已經勝負已分。但alphago當時已經出現(xiàn)了嚴重誤判，連續(xù)走出重大問題手，導致局面完全不可收拾，最后棋力不錯的黃博士代替AI強行認輸，以免在棋譜上留下更加難堪的一幕。

所以，基于如上，柯潔才發(fā)出了，“能贏李世石，不能贏我”的豪言。而一些IT從業(yè)者當時已經神話AI，誤以為其棋力已經邁入巔峰，無以倫比，并對職業(yè)棋手做出的判斷不屑一顧，其實這也是另一種的傲慢與偏見。

最后打臉這些IT從業(yè)者的，恰恰是alphago自己，2016年底alphago V25版本化名master卷土重來，在網絡上橫掃人類頂尖棋手60盤。2017年與柯潔對戰(zhàn)的這個版本，功力又有提升，按照deepind公司他們自己最近官方公開的信息，這個版本和去年戰(zhàn)勝李世石的V18版本相比，可以讓前者3個子。

換句話說，去年那個版本，在今天的alphago眼里，千瘡百孔，不堪一擊，李世石所發(fā)現(xiàn)的問題和缺陷，絕不是僥幸和偶然的。而當時直播中所有做即時點評的嘉賓職業(yè)棋手里，只有柯潔的形勢判斷是一直是最準確的，有一定棋力的棋迷想必都還有印象。（我上篇文章是的，柯潔輸了，然而又怎樣。提到這個版本遠勝于去年版本，但當時官方還沒有提到3個子的領先優(yōu)勢，官方的聲明和數(shù)據印證了棋界之前的判斷，也凸顯了王思聰?shù)臒o理。）

那么，樊老師10盤，李世石5盤，master橫掃60盤，外加柯潔1/4子負的第一盤，截止到昨天為止，一共76盤公開的棋譜，我告訴你們，其實每一個棋譜里， AI都下的不夠完美，當然，這些不完美，有少部分是它依舊不夠完善，有很多是它認為這樣下足夠贏了。

除了保持優(yōu)勢“穩(wěn)如狗”的退讓策略，已經被廣泛理解之外。職業(yè)棋手對AI棋譜最大的詬病是AI會輕易的濫用先手，將變化走盡。從人類學圍棋的經驗來說，保留變化（專業(yè)術語是保留味道）是非常重要的，在后續(xù)的對弈中，根據不同的進程會有不同的選擇，而且特別是針對打劫的時候，根據劫爭的大小，先手是可以有選擇的用來作為劫財使用。

但AI專家說，走盡變化是算法剪枝，減少搜索樹的分支，減少后續(xù)的計算量。在過去的70多盤人機對弈里，AI頻頻出現(xiàn)這樣的場景，但很遺憾的是，由于其局面掌控能力過于強大，人類完全無法對這樣的行為作出有效的反制。

那么問題來了，第一，保留變化是否是人類對圍棋一廂情愿的理解？第二，AI是否會在劫爭緊張的時候出現(xiàn)這樣的問題？

所幸這一盤，柯潔的表現(xiàn)，迫使AI作出了答案。

這一盤柯潔的意圖非常明顯，（其實上一盤也很明顯，先撈后洗，簡單說就是先拿住能確定的空，再去破壞對手的成空潛力。）打亂棋形，通過亂戰(zhàn)尋求機會。而這一戰(zhàn)，柯潔成功的將棋局帶入了自己的意圖。（上一戰(zhàn)，AI在實地和外勢平衡方面，展現(xiàn)了強大的局面控制力，成功的破壞了柯潔的意圖，早早形勢就進入了AI的掌控）

經常看到柯潔在一塊棋尚未安定的時候，又強硬的開出一塊新戰(zhàn)場，形成雙方各有幾塊棋不活的彼此絞殺局面（最多時雙方各有五塊孤棋，這屬于極為罕見的亂戰(zhàn)形勢），可以說很早就進入了懸崖邊的戰(zhàn)斗，任何一方，只要一著不慎，就會萬劫不復。

盡管在二十多手的時候，AI就連續(xù)走出了讓職業(yè)棋手贊嘆不絕的定型妙手，但柯潔的頑強讓AI一直沒有借此真正建立優(yōu)勢，直到一百手棋的時候，雙方依然糾纏不清，局勢難判，根據deepmind老板在twitter的表達，在此時，AI并沒有認為自己占有優(yōu)勢，這是這個版本之前所有對局中，都沒有出現(xiàn)過的?？聺嵄瞥隽薃I的極限。（以上是基于alphago的自我形勢判斷數(shù)據，而非棋界人士的經驗，更不是無憑無據的恭維）。

柯潔其實在七十多手棋的時候，已經在左下角設計了一個巨大的劫爭，卻引而不發(fā)，繼續(xù)將局面搞亂，又在右下角試圖再度挑起一個劫爭，然而此時，alphago并沒有讓柯潔如愿，我不負責的猜測一下，一些其他的圍棋AI程序，在連環(huán)劫上判斷經常出嚴重問題，所以柯潔大約是希望將棋引入這樣的局面，甚至有可能考慮過去設計一個三劫循環(huán)，但很顯然，alphago不會讓人類如此輕而易舉的達成目標。

但關鍵的事情出現(xiàn)了，從柯潔引導alphago進入他所設計的劫爭，并引而不發(fā)之后，幾十手棋的進程里，我們注意到一個事實，alphago一直在保留變化，一直選擇引而不發(fā)，沒有剪枝，沒有濫用任何先手權力，沒有做任何浪費劫財?shù)氖虑椤?/p>

這證明了兩件事情，第一，保留變化是有價值的，人類對此的經驗積累沒有問題。只是絕大部分情況下，alphago認為無需保留變化也足夠贏棋。第二，alphago完全理解劫財?shù)膬r值和保留，但打劫會導致勝率的不可控，所以在非必要的情況下，它會主動規(guī)避打劫。

只有柯潔的實力展現(xiàn)，才讓人有機會看到alphago被逼交出的答案。

然而很可惜，在膠著的局勢下，alphago第119手使出了一步妙手，這步棋如果沒有職業(yè)棋手講解，我根本看不出來好在哪里。這步棋走出來后，柯潔兩片孤棋已經難兩全。

但盡管局勢轉向不利，劫爭尚在，勝負仍然存在懸念。可惜的是，千算萬算，劫財居然不如對手。是的，正如上面文章所提，在柯潔引入復雜劫爭的局面后，alphago本盤罕見的沒有浪費一個劫財，并一直有意或無意的保持著對柯潔的劫財優(yōu)勢。

在劫爭引爆后，136手被一些職業(yè)棋手批評為敗招，因為劫財明顯偏小，alphago斷然消劫后勝負已分，然而，我更愿意理解為，這是在劫財不足的情況下，柯潔對ai實施的一項騙招，此時AI尚有若干劫財沒有使用，柯潔保留了更大的劫財，而試圖用這個較小的劫財引導AI形成誤判應劫，一旦AI應劫，柯潔將憑空多出一個劫財，成功將局勢引導到自己掌控的一邊，但顯然這個策略并未生效。 alphago的邏輯簡單清晰，基于劫財?shù)膬r值不足，顯然消劫后勝率過高。

部分職業(yè)棋手認為，當時應該繼續(xù)擴大局面的復雜性，對AI的整片棋進行更大范圍的攻擊和纏繞，讓棋盤整體陷入更大的死活計算中，我作為業(yè)余棋手，沒有能力發(fā)表這方面的判斷，但從實戰(zhàn)而言，deepmind官方的表態(tài)已經證明了柯潔的狀態(tài)和能力，很多關鍵地方的處理與AI自己的最優(yōu)選擇完全一致，而直到中盤AI自己的數(shù)據判斷，依然是形勢混沌膠著不分。最后確實棋差一招，但也已經足夠體現(xiàn)了人類的尊嚴。

alphago消劫后，寥寥數(shù)手柯潔即示意認輸，其實雖然一條龍橫死看上去比較悲壯，但左上alphago也付出了巨大的代價，雙方的差距也并不是特別巨大，如果對手是人類，棋盤上依然有可戰(zhàn)的空間。

不過，此時亂戰(zhàn)已經結束，而 alphago將毫無疑問的進入“穩(wěn)如狗”的境界，繼續(xù)下去，是的，我們可以預料alphago不斷退讓，柯潔不斷占一點官子便宜，差距越來越小，但很抱歉，對手不會給你任何翻盤的機會。與其這樣獲得一個大殺小敗的外行看上去相對體面的結果，不如就這樣結束，保留一張沒有缺陷的棋譜給后人。

這就是我說的，在過去的76張alphago與人類的對局譜里，這是alphago最完美的一張棋譜，沒有退讓，沒有剪枝，沒有無棋自補，每一手棋都極具效率，恰到好處，因為只有遇到這樣的對手，alphago才會有這樣的答卷。

是的，去年李世石讓alphago交出了一份不及格的答卷，李世石的棋力和天才自然不容置疑，但別忘了，今年這個版本，棋力讓去年的三個子。

機器學習在快速的成長，但我們很多人似乎沒意識到，機器學習的成就，也帶動著人類的學習和進步，如果alphago把系統(tǒng)的決策數(shù)據完全開放出來，人類在棋道探索上的進步還會前進一大截，這件事情也是圍棋界一直在極力要求并渴望的事情。然而很遺憾，到目前為止，這一塊還只能停留在很有限的范圍內進行交流。