在Pinterest網站上,我發現到處都是能吸引我的圖片。我就好像是和最好的朋友踏進了一個party聚會。我看到的所有Pin圖釘都非常有趣,這真是一種讓人身心愉悅的使用體驗。
Pin圖釘中有中世紀的淺棕色皮質沙發、一間配有深棕色木質百葉窗的房間、在iMac電腦背后的書架、肉桂卷等等......
所有的這些推薦,并非是空穴來風。每一件事物都是我之前曾在Pinterest版墻上貼過的圖片,抑或是之前我瀏覽過以及搜索過的。就拿肉桂卷來說——這是因為我關注的某個賬號貼出了肉桂卷。
這絕非是巧合。Pinterest的工程師們一直在優化應用為用戶提供推薦Pin圖釘的系統。美國境內的用戶,比如說我自己,已經習慣了這種個性化設置。但如今,Pinterest擁有1.5億多名每月活躍用戶,大部分加入Pinterest的用戶都是在美國境外的。為了繼續促進公司的發展——用戶使用率相比去年增加了50%,去年Pinterest僅有1億名每月活躍用戶——Pinterest采取了各式各樣的方案,包括采用人工智能、更快的排名系統以及內容的本地化。
當然,其他極具前途的公司(比如說Airbnb以及Spotify)也在為用戶提供個性化設置并將提供的內容進行本地化處理,為的就是獲得更多的用戶并且保證用戶保持率。多虧了Pinterest用戶整理的龐大圖片收集庫,Pinterest從諸多公司中脫穎而出。在過去兩年來,Pinterest逐步采取措施。如今看來,收效甚好。
“在我們進軍全球市場的過程中,你可以發現我們的關注點在哪里,從而理解為什么視覺信號具有如此大的價值。”Pinterest的首席數據科學工程師Mohammad Shahangian在采訪中這樣說道。
深度學習
Pinterest提供的四大重點功能均使用了深度學習技術,它們分別是:本地消息流、搜索、相關Pin圖釘以及圖片搜索。今天,恰好是第四項內容(即圖片搜索)推出的一周年紀念日。
圖片搜索系統取決于一種叫做深度學習的人工智能,這包括訓練人工神經網絡對數據的處理,比如說pin圖釘里的照片。之后,通過神經網絡來對新數據進行推斷。蘋果、Facebook、谷歌、微軟以及其他公司都在廣泛使用此項技術,如今大家可以獲得越來越多的數據以及計算能力。
Pinterest將此項技術應用到了圖片搜索之中,這種方式絕對可以吸引用戶的注意力。你只需要點擊Pin圖釘頂角的放大鏡,你就可以調整疊映在圖片上的長方形的大小和位置。之后,軟件就可以找到與長方形框內的內容相似的圖釘。此外,某些情況下,你還可以點擊圖釘中出現在物體上方的點,之后就會呈現出其他含有類似圖片的圖釘。
此外,Pinterest也開始使用深度學習來優化應用里的其他部分——比如說決定相關Pin圖釘內容。
Pinterest對于你剛剛貼出的圖釘有很多的了解,部分原因是因為一些其他用戶也在貼圖釘的過程中貼了這些內容。這就是所謂的“共現關系”,這也可以強烈地暗示出這些圖釘都是相關的。但有些時候——比如說在一個當地語言并不是那么通行的國家——一個用戶貼出了圖釘,但Pinterest之前從未見到過,那么關于圖釘有關的文字,Pinterest能做的就不多了。但這時候深度學習就可以起到很大幫助作用了。類似的圖釘內容可以讓Pinterest了解到文字所說的是什么。
Shahangian表示基于上述內容,Pinterest就可以開始為用戶提供相關圖釘內容的推薦了。
但是!請注意!深度學習并非是Pinterest推薦系統里的主要驅動因素,即便你認為在圖片網站中,圖片數據的地位是至高無上的。
“其實在最后,你還是會更傾向于知道‘用戶都創建了什么內容?’以及‘用戶都做了些什么’,并且將此當做是最終信號來決定推薦內容......這是因為這兩件事是相關性最高的。”Pinterest的首席視覺搜索工程師Dmitry Kislyuk在采訪中說道,“這也是一個了解內容的絕佳機會,尤其是那些我們了解甚少的內容(用戶的行為往往能給我們帶來提示)。”
排名
2015年5月,Pinterest引入了排名系統,從而根據Pinterest預測用戶的參與度程度來改變Pin圖釘的順序。
這一舉措帶來的影響無疑是深遠的。公司相關推薦圖釘的工程師Stephanie Rogers表示這增加了30%的相關推薦圖釘數。
但在今年1月,Pinterest又采取了下一步措施。公司停止使用批量處理的機器學習系統來根據用戶的行為重新排列內容的順序,這一排名過程可以說需要一夜時間來完成。事實上,公司開始使用實時重新排列,這僅僅需要數秒就可以完成——速度之快使得Pinterest有足夠的時間去改進相關推薦圖釘的順序,而與此同時用戶也可以更加仔細得挑選圖片。
Pinterest還將用戶最近的活動行為考慮在內,比如說你最近的搜索以及你保存的最新圖釘。
圖為:相關推薦Pin圖釘基于對主題參與度的預測來進行位置排列。
“舉個例子,比如說你也許在搜索某一位明星,之后你就會看到明星穿著一套禮服,你點擊該圖釘。”Rogers說道,“相關推薦的內容就會包括這位名人而不是她們穿的禮服。”
Rogers表示通過把用戶最近活動考慮在內,這使得用戶保存圖釘的數量增加了4%。
本地化
過去一年來,Pinterest采用了一些技巧來在國外城市獲得牽引力。
“在這些新興國家,一切都屬于長尾內容(以前不太常見、但現在已經普及的內容)。”Shahangian這樣說道。因此,深度學習的地位非常重要。快速排名當然也很重要,這是因為人們最先看到的事物會對未來的參與度會產生很大影響。此外,還有其他一些原因。
員工們明白一些內容(比如說圖片、發型或是美容)在許多國家廣受歡迎,而其他一些圖片內容則表現得平平淡淡。比如說,其他國家與婚禮相關的Pin圖釘就沒有在美國那么受歡迎了。
Pinteres打造了機器學習模型,來集中關注某一個城市單個范疇的內容。隨著一些范疇已經開始流行,Pinteres可以借此確定早期使用者。Shahangian 表示Pinteres還需要找到某些國家的“測試者”,他們可以時不時得將Pin圖釘貼在Pinteres上。
以用戶的本土語言來提供內容,這一點非常重要。
圖為:當用戶將德語選為自己的語言時,Pinterest就會以德語語言出現。
“通過各式各樣的技術,我們基本上已經將本地內容的展示份額從8%提升到了54%。”Rogers這樣說道。換句話說,用戶看到的內容有一半多都是以他們自己選擇的語言來呈現的。
發言人在郵件中表示用戶對Pinterest的本地化工作很是贊賞,這是因為在某些情況下,這會增加用戶的參與度。
接下來的安排
正如你的預測,Pinterest對下一步的計劃確實也有了一些構想。
一方面,Pinterest開始重新對圖片搜索結果進行排列,這就如同它在處理相關Pin圖釘時一樣。
它還可以著手將深度學習應用到自然語言處理當中,憑此來做出一些推薦。Kislyuk 表示Pinterest的廣告團隊已經在進行實驗了。
此外,公司還可以采取更多措施來將搜索結果推廣給用戶。比如說,Pinterest可以開始將它自己的能力告知公眾:給定一個圖像,Pinterest可以識別一個物體。
這種體驗在現在已經是可以實現的了,但用戶并沒有過多察覺到這一點——盡管此舉已經讓許多用戶印象深刻并且為他們提供了很大幫助。
幾周之前,Rogers在電視上看到了一個清真寺,然后她拍了一張照片并將其貼到了Pinterest上。在進行圖片搜索之后,她可以找到含有同樣一座建筑物的Pin圖釘,而這塊Pin圖釘的描述內容顯示這個清真寺位于伊朗。“如今我知道這是在什么地方了。”她在回憶當時的情況時這樣說道,“這種感覺太棒了。”
Pintastic的數據
每月2億圖像搜索
1.5億每月活躍用戶,每年增長比例最高可達50%
750億Pin圖釘數
每秒2000萬Pin圖釘推選圖片
每天推薦的Pin圖釘數達到100億,是去年的兩倍
每秒針對相關Pin圖釘的消息流搜索達到3萬次
本國消息流中的本地化Pin圖釘數(根據國家和語言)增長了250%
75%的注冊用戶來在美國以外的國家
40%注冊的人都是男性,如今該數據最高可達70%
相關Pin圖釘帶來了30%的參與度
通過將“Pin it”變為“保存”,美國以外的新用戶數量又增加了20%
由于最近國內信息流的算法更新了,參與度又增加了12%
由于Pinterest為每位用戶推出了個性化話題,每周活躍用戶數量增加了10%
根據特定國家的話題重新設計了用戶體驗之后,活躍度增加了10%-15%
由于公司開始根據用戶最近保存或是搜索的內容來嘗試排列相關Pin圖釘,保存數量增加了4%,本地化相關Pin圖釘數增加了5%
自從推出了Pin圖釘中的發現物品功能,用戶存儲Pin圖釘的幾率增加了6倍;探測的物品數量多達數億
對在美國境外的用戶而言,個性化Pin圖釘數增加了5倍
相比去年,如今美國境外的用戶在搜索以及相關Pin圖釘中看到本地化內容的可能性增加了3倍
在全面修改之后,應用的速度相比以前提升了3倍
相比去年,使用圖片搜索的用戶數量增加了一倍