最近的幾年,網(wǎng)站建設(shè)已經(jīng)稱(chēng)為時(shí)代的主題,企業(yè)、政府、機(jī)關(guān)單位、團(tuán)體、個(gè)人都在籌備自己網(wǎng)絡(luò)方面的宣傳平臺(tái),自媒體時(shí)代的發(fā)展并不能使網(wǎng)站建設(shè)走向滅亡,隨著人工智能技術(shù)的應(yīng)用已經(jīng)在物聯(lián)網(wǎng)中得到應(yīng)用,通過(guò)人工智能技術(shù)實(shí)現(xiàn)應(yīng)用技術(shù)的深化和改革,讓整個(gè)時(shí)代的機(jī)械化轉(zhuǎn)化為了人性化,SEOer行業(yè)的人曾指出:人工智能時(shí)代將會(huì)徹底改變世界,對(duì)于網(wǎng)絡(luò)優(yōu)化也會(huì)產(chǎn)生一定的影響,SEO搜索算法目前只是使用搜索引擎算法,并未融入人工智能技術(shù),而影響人工智能技術(shù)范圍的擴(kuò)大人需要看搜索引擎工程師對(duì)于搜索系統(tǒng)的判斷。
人工智能是個(gè)黑盒子
用不太嚴(yán)格但容易理解的方式說(shuō),深度學(xué)習(xí)就是給現(xiàn)有數(shù)據(jù)(大量數(shù)據(jù))打標(biāo)簽,然后系統(tǒng)自己總結(jié)數(shù)據(jù)和結(jié)果(也就是所打的標(biāo)簽)之間的關(guān)系,面對(duì)新數(shù)據(jù)時(shí),就能依據(jù)自己總結(jié)的規(guī)律給出判斷。對(duì)圍棋來(lái)說(shuō),無(wú)論歷史棋局還是自我對(duì)弈,AlphaGo知道盤(pán)面,也知道結(jié)局(也是一種標(biāo)簽),系統(tǒng)就會(huì)總結(jié)規(guī)律,面對(duì)新盤(pán)面時(shí)判斷贏棋的概率。但AI系統(tǒng)找到的是數(shù)據(jù)的哪些特征,與結(jié)果之間是怎樣的關(guān)系,連創(chuàng)造AI的工程師也不知道。
所以,現(xiàn)在的人工智能系統(tǒng)是個(gè)黑盒子。我們知道AI判斷的正確率高,但不知道為什么,不知道是怎么判斷的。
搜索算法中的AI也是如此。百度搜索工程師的說(shuō)法很少見(jiàn)到,只是知道百度現(xiàn)在All In AI了。Google工程師明確表示過(guò),他們對(duì)RankBrain到底是怎么工作的也不太清楚。在這種情況下,在算法中大量使用人工智能就比較麻煩了,一旦出現(xiàn)異常結(jié)果,不知道是什么原因,也無(wú)法debug。
寫(xiě)這篇帖子是因?yàn)榍靶┨炜吹揭黄~約時(shí)報(bào)的文章“AI能學(xué)會(huì)解釋它自己?jiǎn)幔?rdquo;,非常有意思。一位心理學(xué)家Michal Kosinski把 20 萬(wàn)社交網(wǎng)絡(luò)賬號(hào)(是個(gè)約會(huì)網(wǎng)站)的照片及個(gè)人信息(包括很多內(nèi)容,如性向)輸入面部識(shí)別人工智能系統(tǒng),發(fā)現(xiàn)人工智能在只看到照片的情況下判斷性向準(zhǔn)確率很高。人工通過(guò)照片判斷一個(gè)人是否同性戀的準(zhǔn)確率是60%,比扔硬幣高一點(diǎn),但人工智能判斷男性是否同性戀準(zhǔn)確率高達(dá)91%,判斷女性低一些,也有83%。
從照片里是看不到音色語(yǔ)調(diào)、體態(tài)、日常行為、人際關(guān)系之類(lèi)幫助判斷的信息的。同性戀有純相貌方面的特征嗎?我個(gè)人的經(jīng)驗(yàn)是,靠相貌判斷不大靠譜。我以前認(rèn)識(shí)一對(duì)男同,他們都是很man的那種,常年健身,待人彬彬有禮但絕沒(méi)有女氣,從外表是看不出來(lái)的。也可能是依靠某種服飾特點(diǎn)?表情?背景?人工智能從照片中到底看到了什么我們?nèi)祟?lèi)很可能忽略了的特征,或者人類(lèi)根本看不到的特征,并達(dá)到91%的準(zhǔn)確率呢?不得而知,反正只是知道AI看得挺準(zhǔn)。
不能解釋自己的AI無(wú)法被信任
這種黑箱特征有時(shí)候倒無(wú)關(guān)緊要,像是判斷一下性向。有時(shí)候就不能這么草率了,比如看病。雖然AI系統(tǒng)診斷某些癌癥的正確率已經(jīng)達(dá)到人類(lèi)醫(yī)生的水平,但最后結(jié)論,目前還是要醫(yī)生做,尤其是AI不能告訴我們它診斷的理由是什么的時(shí)候。除非以后AI能解釋它為什么做出這個(gè)診斷,不然讓人類(lèi)100%信任AI是有比較大心理障礙的。
前幾天剛剛看到新聞,新加坡政府開(kāi)始測(cè)試無(wú)人駕駛公共汽車(chē)。這顯然是個(gè)正確的方向,我也相信不久的將來(lái)就會(huì)成為現(xiàn)實(shí)。雖然自動(dòng)駕駛汽車(chē)事故率比人低,理性上我們都知道其實(shí)更安全,但過(guò)馬路時(shí),停在旁邊的公共汽車(chē)沒(méi)有司機(jī),我會(huì)不會(huì)有點(diǎn)提心吊膽,怕它突然啟動(dòng)?開(kāi)車(chē)時(shí)扭頭一看,旁邊的Bus沒(méi)有司機(jī),我會(huì)不會(huì)嚇一跳,下意識(shí)地離它遠(yuǎn)點(diǎn)?至少初期會(huì)的吧。和幾個(gè)朋友聊起這個(gè)事,都是理性上相信,感性上心虛。
以前的程序是依靠確定性和因果關(guān)系運(yùn)行的,比如搜索算法中哪些頁(yè)面特征是排名因素,各占多少權(quán)重,這是工程師挑出來(lái)的、確定的,雖然挑的時(shí)候可能就是拍腦袋決定的,但經(jīng)過(guò)監(jiān)測(cè)效果、調(diào)整參數(shù),會(huì)達(dá)到一個(gè)比較滿意的平衡。人工智能系統(tǒng)并不依靠工程師給定的確定因果,而是更擅長(zhǎng)于在概率和相關(guān)性中找到聯(lián)系。對(duì)人來(lái)說(shuō),以概率和相關(guān)為特征的判斷,經(jīng)常就不好解釋理由了,比如也許是看心情,也許是看好看不好看。
要求AI系統(tǒng)解釋自己的判斷,不僅是心理上的問(wèn)題,也許以后會(huì)變成倫理和法律上的問(wèn)題,像看病。再比如涉及用戶(hù)利益的事情,像貸款,人工智能根據(jù)一大堆數(shù)據(jù)做出拒絕貸款的決定,銀行卻不能解釋為什么拒絕,對(duì)用戶(hù)該怎么交代?今年歐盟可能就要頒布法規(guī),要求機(jī)器做出的決定必須有解釋。這對(duì)Google、Facebook等全球性的企業(yè)是個(gè)壓力。在很多領(lǐng)域,如軍事、法律、金融,所有決定都是要有人來(lái)承擔(dān)責(zé)任的,如果某個(gè)決定無(wú)法解釋原因,恐怕也沒(méi)有人敢承擔(dān)這個(gè)責(zé)任。
另一個(gè)需要AI解釋理由的原因是,前面提到,人工智能看的是概率和相關(guān)性,但看相關(guān)性做決定有時(shí)候會(huì)導(dǎo)致嚴(yán)重錯(cuò)誤。紐約時(shí)報(bào)的文章舉了個(gè)例子。經(jīng)過(guò)數(shù)據(jù)訓(xùn)練的人工智能系統(tǒng)輔助醫(yī)院急診室分診,總體上看效果不錯(cuò),但研究人員還是不敢真的拿來(lái)實(shí)用,因?yàn)閿?shù)據(jù)中的相關(guān)性可能誤導(dǎo)人工智能做出錯(cuò)誤判斷。比如數(shù)據(jù)表明,患有肺炎的氣喘病人最后病愈情況好于平均水平,這個(gè)相關(guān)性是真實(shí)存在的。如果AI系統(tǒng)因?yàn)檫@個(gè)數(shù)據(jù)就給有肺炎的氣喘病人比較低的處理等級(jí),那可能就要出事了。因?yàn)檫@些病人之所以最后情況良好,是因?yàn)樗麄円粊?lái)就被給予最高等級(jí),得到最好最快的治療了。所以,有時(shí)候從相關(guān)性看不到真正的原因。
可解釋的人工智能
X.A.I.(Explainable AI)可解釋的人工智能,是剛剛興起的一個(gè)領(lǐng)域,目的就是讓AI對(duì)自己的判斷、決定和過(guò)程做出解釋。去年美國(guó)國(guó)防高級(jí)研究計(jì)劃局(Darpa )推出了David Gunning博士領(lǐng)導(dǎo)的XAI計(jì)劃。Google也依然是這個(gè)領(lǐng)域的領(lǐng)先者,Deep Dream好像就是這方面研究的一個(gè)副產(chǎn)品:
人工智能與SEO
回到搜索算法及SEO,搜索引擎之所以還無(wú)法全面應(yīng)用人工智能,其中一個(gè)原因也許就是人工智能的判斷沒(méi)有解釋、無(wú)法理解,如果算法使用目前的人工智能,一旦出現(xiàn)排名異常,工程師們將無(wú)法知道原因是什么,就更無(wú)法知道該怎么調(diào)整。
我想自動(dòng)駕駛是最先AI實(shí)用化的領(lǐng)域之一,和能否解釋也有一定關(guān)系。自動(dòng)駕駛汽車(chē)的大部分決定是不大需要解釋的,或者說(shuō)解釋是一目了然的,距離前車(chē)太近所以要減速或者剎車(chē),這類(lèi)判斷應(yīng)該不需要進(jìn)一步解釋理由了。
SEO們大概都有過(guò)同樣的疑惑,某個(gè)競(jìng)爭(zhēng)對(duì)手的頁(yè)面看著沒(méi)什么特殊的,內(nèi)容不怎么樣,視覺(jué)設(shè)計(jì)一般,外鏈普通,頁(yè)面優(yōu)化大家做的都一樣,為什么排名就那么好呢?現(xiàn)在的搜索算法還可以探究原因,搜索工程師們大概有內(nèi)部工具可以看到排名的合理性。如果搜索工程師看著一個(gè)挺爛的頁(yè)面就是排在前面,卻也不知道原因,還無(wú)從查起,他們的內(nèi)心可能就焦慮了。
XAI的研究才剛剛開(kāi)始,這給了SEO們最后的緩沖期。從人工智能系統(tǒng)在其它領(lǐng)域碾壓人類(lèi)的表現(xiàn)看,一旦大規(guī)模應(yīng)用于搜索,作弊和黑帽SEO恐怕將成為過(guò)去,現(xiàn)在的常規(guī)SEO工作也許變得無(wú)足輕重,SEO們需要回到網(wǎng)站的本質(zhì):提供有用的信息或產(chǎn)品,別無(wú)他法。