心得篇:網(wǎng)站SEO優(yōu)化是怎么從100名外做到首頁排名的 |
發(fā)布時間:2016-10-13 文章來源: 瀏覽次數(shù):2334 |
不要認為你可以上淘寶“偷偷”看一下情色物品,你在網(wǎng)站上做的一切都逃不外系統(tǒng)的眼睛。為了猜中你的心思,推薦算法需要盡可能多的采集你的數(shù)據(jù),從而確定你真正喜歡什么。當然,這仍是為了贏取你的信任,讓在線零售商賺更多的錢。 (文/Joseph A. Konstan & John Riedl) 講完了推薦算法是如何“猜你喜歡”的 ,現(xiàn)在,你對于每回上網(wǎng)購物時在線零售商是如何打量你,并努力把你的喜好和其他人的相匹配有了一個基本的概念。 推薦系統(tǒng)還有另外兩大特點,也對你終極看到的推薦結(jié)果有著明顯的影響:第一,在弄清晰你和其他購物者的相似度有多高之前,推薦系統(tǒng)必需先弄明白你真正喜歡什么;第二,推薦系統(tǒng)依照一組貿(mào)易規(guī)則運行,以確保推薦結(jié)果既讓你覺得有用,也使商家有利可圖。 推薦算法是如何贏得你的信任,又讓商家有錢可賺的? 采集你的上網(wǎng)數(shù)據(jù) 舉個例子,來看亞馬遜的藝術(shù)品商店,上次我們?nèi)タ吹臅r候那里有 900 多萬冊印刷品和海報在降價促銷。亞馬遜的藝術(shù)品商店有這樣幾個方法來評估你的喜好。它會讓你在 1 到 5 顆星的等級上給某一件藝術(shù)作品打分,它也會記實下你把哪些畫點擊放大了來看、哪些畫你反反復(fù)復(fù)看了好多次,你把哪些放進了心愿單,還有你終極實際下單買了什么。它還會追蹤在你瀏覽過的每一個頁面上都顯示了哪些畫作。在線零售商會使用你在其網(wǎng)站行進的路徑(你瀏覽過的頁面和點擊商品的鏈接) 來向你推薦相聯(lián)系關(guān)系的商品。此外,它還把你的購買記實和打分信息結(jié)合起來,建立一個你長期購買偏好的檔案。 像亞馬遜這樣的公司會收集大量此類有關(guān)客戶的數(shù)據(jù)。在你登錄期間,你在它網(wǎng)站上的幾乎每一個動作都會被記下來,留作將來使用。多虧有了瀏覽器 cookie,連匿名購物者的上網(wǎng)記實商家也能維持,終極這些數(shù)據(jù)將在匿名購物者創(chuàng)建賬戶或者登陸時,鏈接到顧客的個人資料。這種爆炸式的數(shù)據(jù)采集并非為在線商家所獨占,沃爾瑪便以其對現(xiàn)金收據(jù)數(shù)據(jù)的深入挖掘而著稱于業(yè)界。但是,網(wǎng)上商店處在一個更有利的位置去查看和記實,不止是消費者買了些什么,還包括你曾考慮過、瀏覽過和決定不買哪些商品。在全世界大部門地區(qū),所有這類流動都是任人監(jiān)督和記實的;只有在歐洲,數(shù)據(jù)隱私法在一定程度上限制了這種操縱。 當然,不論法律如何,顧客發(fā)現(xiàn)自己的數(shù)據(jù)被人濫用后,都會產(chǎn)生強烈的抵觸情緒。早在 2000 年 9 月,亞馬遜吃過一次苦頭:有一部門顧客發(fā)現(xiàn)他們收到的報價更高,由于網(wǎng)站將他們識別為老顧客,而不是匿名進入或是從某個比價網(wǎng)站轉(zhuǎn)接進來的顧客。亞馬遜聲稱這只是一項隨機的價格測試,其呈現(xiàn)出來的結(jié)果與老顧客身份之間的聯(lián)系關(guān)系純屬偶合。話是這樣說,它仍是叫停了這項操縱。 在貿(mào)易規(guī)則下運行 加在推薦算法之上的種種貿(mào)易規(guī)則,旨在防止算法給出愚蠢的推薦,并匡助在線零售商在不失去你信任的條件下實現(xiàn)營業(yè)額的最大化。最最少,推薦系統(tǒng)應(yīng)該避免人們說的超市悖論(Supermarket Paradox)。例如,差未幾每個去超市的人都喜歡吃香蕉,也常常會買一些。那么,推薦系統(tǒng)該不該向每一位顧客都推薦香蕉呢?謎底是否定的——這樣做既幫不上顧客,也進步不了香蕉的銷量。所以,智能的超市推薦系統(tǒng)始終會包括有一條規(guī)則,明確地將香蕉排除在推薦結(jié)果之外。 這個例子可能聽起來沒什么,但在我們早期經(jīng)手的一個項目中,我們的推薦系統(tǒng)就曾經(jīng)向幾乎每一個到訪我們網(wǎng)站的人推薦披頭士的《白色專輯》(White Album)。從統(tǒng)計學的意義上講,這是個很棒的推薦:顧客此前都沒有從這個電子商務(wù)網(wǎng)點購買過這張專輯,而大多數(shù)顧客對《白色專輯》的評價都很高。盡管如斯,這個推薦仍舊是無效的——任何一個對《白色專輯》感愛好的人都已經(jīng)有了一張了。 當然,大部門的推薦規(guī)則都是更加微妙的。好比說,當約翰在 9 月份在 Netflix 索動作影片時,結(jié)果中不會泛起《復(fù)仇者同盟》(The Avengers),由于這部大片在當時還沒有租借版,這樣的推薦結(jié)果不會讓 Netflix 有錢賺。因此,約翰被導向了《鋼鐵俠 2》(Iron Man 2),這部片已經(jīng)可以用流媒體播放了。 其他的規(guī)則還包括禁止推薦為招徠顧客而虧本銷售的商品(loss leader);反過來,鼓勵推薦滯銷品。在經(jīng)營Net Perceptions期間,我們就曾與一位客戶合作,他利用推薦系統(tǒng)來識別庫存積存商品的潛伏客戶,取得了相稱大的成功。 贏取你的信任 然而,這種事情很快就會變得棘手起來。一個只會傾銷高利潤商品的推薦算法是不會贏得顧客的信任的。這就像是去餐館,那兒的服務(wù)生極力向你推薦某道魚一樣。這個魚真的是他覺得最好吃的嗎?仍是大廚催著底下的人趕在魚變質(zhì)前把它給賣出去? 為了建立信任感,更復(fù)雜的推薦算法會盡力保持一定的透明度,讓顧客對系統(tǒng)為什么會向自己推薦這件商品有一個大致的概念,并且在不喜歡收到的推薦結(jié)果時,可以更改他們的個人資料。好比說,你可以刪除你在亞馬遜上買來送禮的購物記實;究竟,那些東西反映的不是你個人的喜好。你還可以知道系統(tǒng)為什么會向你推薦某些產(chǎn)品。當亞馬遜為約翰挑選了 Jonathan Franzen 的小說《自由》之后,約翰點擊標簽上的鏈接“為什么推薦給我?”。隨即顯示出一份扼要的說明,原來是他放在心愿單里的幾本書觸發(fā)了這一推薦。不外,因為他還沒有讀過心愿單上的那幾本書,約翰就不去管《自由》這個推薦結(jié)果了。像這樣的解釋說明會讓用戶明白推薦結(jié)果是否有用。 但是,完善個人資料和解釋推薦結(jié)果往往不足以保證系統(tǒng)不犯錯。最近,亞馬遜用高清大屏幕電視機(HDTV)的促銷電子郵件對喬進行了轟炸——每周 3 封,連續(xù)扔了一個月。除了給喬寄了過多的電子郵件,這家零售商還沒有意識到,喬已經(jīng)用他妻子的賬戶買了一臺電視機。此外,這些電子郵件并沒有提供一種很顯著的方法,讓喬可以說“謝謝,但我不感愛好”。終極,喬取消了他在亞馬遜的一些郵件訂閱;他并不在意收不到各種信息,而且他有了更多的時間來真的看他的電視。 推薦算法的作用畢竟有多大? alumni.berkeley.edu 那好,推薦算法畢竟起了多大作用呢?它們當然一直都在增加在線銷售額;據(jù)阿倫森團體(Aaronson Group)的分析師杰克?阿倫森(Jack Aaronson)估計,因為推薦算法帶動銷售額的增長,對推薦算法的投資能獲得 10%-30% 的收益。而且,它們還只是剛剛起步,F(xiàn)在,對我們這些研究推薦系統(tǒng)的人來說,最大的挑戰(zhàn)在于弄清晰如何去判定新的方法和算法才最好。這可不像基準化分析微處理器那么簡樸,由于不同的推薦系統(tǒng)有著非常不同的目標。 評價一個算法最簡樸的方法,是看它的猜測和用戶的實際評價之間差異有多大。舉例來說,如果約翰給青春浪漫小說《暮光之城》(Twilight )一顆星,亞馬遜或許會留意到算法根據(jù)其他相似用戶的評價曾預(yù)計約翰會給兩顆星,也即泛起了一顆星的偏差。但是,賣家更加關(guān)心算法在用戶評價高的商品上出的錯,由于好評多的物品是顧客更有可能購買的;約翰反正也不會買《暮光之城》。所以,把這個評價計入考慮對理解推薦算法起了多大作用沒什么匡助。 另一個常見方法是看算法給出的推薦結(jié)果和顧客實際購買的商品,之間匹配度有多高。不外,這種方法也可能起到誤導作用,由于這樣分析會將用戶自己想法找到的商品錯誤地算在推薦算法的頭上,而用戶自己找得到東西恰正是最不應(yīng)該被推薦的!鑒于這些方法的缺點,研究職員一直在研究新的評判指標,不只看精度,也會關(guān)注像發(fā)現(xiàn)意外驚喜和多樣性等其他屬性。 發(fā)現(xiàn)意外驚喜(Serendipity)會加權(quán)不平常的推薦結(jié)果,尤其是那些對某一個用戶極具價值,但對其他同類用戶而言沒什么用的推薦結(jié)果。調(diào)整為發(fā)現(xiàn)意外驚喜的算法會留意到《白色相簿》好像是一個對幾乎每個人來說都不錯的推薦,因此會改為尋找一個不太常見的選擇——也許是 Joan Armatrading 的《愛和情感》。這個不那么熱點的推薦結(jié)果不太可能擊中目標,但一旦它趕上了,則將給用戶帶來一個大得多的驚喜。 看推薦結(jié)果的多樣性同樣也很能說明題目。比方說,一個超愛看 Dick Francis 神秘類小說的用戶,在看到推薦表單里全都是 Dick Francis 的作品時,仍有可能會感到絕望。一個真正多樣化的推薦表單會包括不同作者和不同類型的書,還有片子、游戲和其他的產(chǎn)品。 推薦系統(tǒng)研究則需要突破各種各樣的阻礙,遠不止是在現(xiàn)有的系統(tǒng)長進行微調(diào)。研究者們眼下正在考慮的是,推薦算法應(yīng)該在怎樣一個程度上匡助用戶發(fā)掘一個網(wǎng)站的內(nèi)容集合中他們未曾了解的部門。比方說,把買書的人送去亞馬遜的服裝部分,而不是給一些安全的、顧客更有可能接受的推薦結(jié)果。在零售世界之外,推薦算法可以匡助人們接觸到新的想法主意;就算我們不同意其中的一些,但整體作用大概會是積極的,由于這將有助于減少社會的巴爾干化(Balkanization,即碎片化)。推薦算法能不能做到這一點,還要不讓人感到厭煩或者不信任,仍需拭目以待。 但有一點是明確的:推薦系統(tǒng)只會變得越來越好,收集越來越多關(guān)于你的數(shù)據(jù),并在別的、意想不到的地方展示出來。假如你喜歡這篇文章,亞馬遜會很興奮愿意向你推薦其他所有你可能會喜歡的關(guān)于推薦系統(tǒng)的書。 Joseph A. Konstan 和 John Riedl 都是美國明尼蘇達大學的計算機科學教授。身為 IEEE 高級會員的 Konstan 和 IEEE 會士的 Riedl 介入創(chuàng)建了 MovieLens 推薦系統(tǒng)。“猜你喜歡”是怎么猜中你心思的? 是本文的前半部門。 編譯自:《IEEE科技縱覽》Deconstructing Recommender Systems |
|