虐狗節剛剛過去,去年看過一篇文章,講如何通過大數據找到你的另一半(見參考資料)!里面通過理性建模和精準定位找到合適伴侶,不過大數據真有這么神奇么?我就隨便聊聊約會 APP 算法和現實中策略。
我們很多人抱怨現實中約會很難一下子找到宿命中的人,在線網站也讓找到真愛的幾率變大,操作又容易上手。據我所知,目前微信,陌陌,探探,世紀佳緣,match,tinder 很多這樣的 “嚴肅” 交友(約會)的工具,他們號稱采用大數據建立人物畫像,采用 KNN 聚合,DNN 神經網絡,幫你提升匹配率,找到人生幸福另一半,事實上是這樣的嗎?
工作原理
當你把你的簡歷在這種網站或者 APP 更新,一些算法就開始準備潛在合拍的。然后給你打分,或者隨機給你幾個選。而這些結果基于也許就幾十個,一般你回答幾個問題,或者你產生的一些行為?;緮祿耗挲g、身高…戶口所在地、畢業學校、工作單位、家庭狀況。一些網站最厲害的問你 100 個問題,什么喜歡的顏色,食物,運動,偶像,喜歡看的書類型,然后開始關聯賬號,微信,微博,比如微博、微信等社交媒體的內容及更新頻率,QQ 登錄及在線時間,更新發型頻率,作息時間規律,經常出現的場所。
這些背后就是對用戶行為做預測和匹配,跟亞馬遜,Netflix 去預測產品差不多,不同的話 Netflix 推薦電影給你,電影卻不需要反向去關注你。下面就介紹一個有趣的匹配算法。
穩定婚姻匹配算法
1962年,美國數學家 David Gale 和 Lloyd Shapley 發明了一種尋找穩定婚姻的策略,人們稱之為延遲認可算法(Gale-Shapley 算法)。
為了讓大家相信數學家不是真得如此無聊,我要指出它確確實實是一個地道的組合數學問題,有其特定的數學價值。當然啦,它也有很多別的背景和應用,比如用來在若干個公司和應聘者之間進行招聘中介……但是數學家們怎么會放過如此八卦的一個名字呢?于是它就這樣流傳下來了。
規則如下:
先對所有男士進行落選標記,稱其為自由男。當存在自由男時,進行以下操作:
①每一位自由男在所有尚未拒絕她的女士中選擇一位被他排名最優先的女士;
②每一位女士將正在追求她的自由男與其當前男友進行比較,選擇其中排名優先的男士作為其男友,即若自由男優于當前男友,則拋棄前男友;否則保留其男友,拒絕自由男。
③若某男士被其女友拋棄,重新變成自由男。
在算法執行期間,自由男們主動出擊,依次對最喜歡和次喜歡的女人求愛,一旦被接受,即失去自由身,進入訂婚狀態;而女人們則采取 “守株待兔” 和 “喜新厭舊” 策略,對前來求愛的男士進行選擇:若該男子比未婚夫強,則悔婚,選擇新的未婚夫;否則拒絕該男子的求婚。被女友拋棄的男人重獲自由身,重新擁有了追求女人的權利——當然,新的追求對象比不過前女友。
這樣,在算法執行期間,每個人都有可能訂婚多次——也有可能一開始就找到了自己的最愛,從一而終——每訂一次婚,女人們的選擇就會更有利,而男人們的品味則越來越差。只要男女生的數量相等,則經過多輪求婚,訂婚,悔婚和再訂婚之后,每位男女最終都會找到合適的伴侶——雖然不一定是自己的最愛(男人沒能追到自己的最愛,或女人沒有等到自己的最愛來追求),但絕對不會出現 “雖然彼此相愛,卻不能在一起” 的悲劇,所有人都會組成穩定的婚姻。
這個是數學界切切實實研究過的問題。對于以前沒有接觸過這個問題的人,這個理論最出人意外的結論是:傳統的求愛,結婚過程是 male-optimal 的,也就是說,男性能夠得到盡可能好的心上人,女性卻不然。這就是所謂的穩定匹配問題 (StableMarriageProblem,也叫穩定婚姻問題)。
真的行得通嗎?
那么問題來了,這些數據和計算之后的結果會導致更好的匹配嗎?我想還是不行。這些約會工具越來越多,成功的反而越少。伯克利大學還做過調查,比如說美國人只有 5%是從網上認識建立長期關系(only 5 percent of Americans in long-term partnerships met online. )
那個報告說了幾點有意思的,個性習慣的相同對健康的兩性關系也沒啥幫助。就算算法再復雜,也對找到合適對象沒多少幫助,除非你把可能遇見的人數增加。
但最麻煩的還是用戶會說謊,對他們多高,多重,收入,年齡都可能是瞎扯,如果給你選擇年薪 3 萬,30 萬,在沒有任何信用的情況下,你選哪個?或者你隨便填個數,你怎么不上天呢?這樣建立起來的模型有什么意義?
還有一點,有些人號稱需要一些硬性指標和條件,一定對方多高,多有錢,多牛逼,但真正相處,也許就不會這么要求了。然后就發現那些把錢放在考慮第一位的人,照樣 dating 藝術家或者彈吉他的。
有些交友網站,讓你去填個問卷調查,什么心理分析,性格色彩,MBIT,喜歡的電影,(還有要填政治理想的?。┤绻眠@些作為匹配可能是誤區,但換一個思路,通過用戶的活躍度和發布的朋友圈來做。那么這就得去監控用戶行為,后臺將這些動作作為依據去迭代模型。
到底約幾次才能找到真愛?
這是個有趣問題,老派的約會方式是去本地的 PUB,比如你有 1%的可能性對方同意要約,你得去 100 次才能搞定一個。而作為另外一方,應該用什么策略來接受約會邀請?其實根據博弈論,拒絕掉前 37%的你想要約會的人,然后挑選下一個出現的比前 37%都要好的人。令人驚訝的是,你最終將找到真愛的幾率為 37%,具體計算過程不展開了,參考文檔在最后。
約會 APP 和其他方式
其實通過這些網上 APP,你極大增加曝光率,因為池子大,還可以加過濾,來個快速排序:)總體上這種方式未必浪漫,但高效啊。還有哪些方式去約呢,比如公司同事(讀到一個調查 1/3 的公司員工,包括上下屬約會也占很大比例),書店(聽說高曉松老師剛開的書店還促成了眷侶),微博(我一個程序員朋友就這樣認識他愛人后來結婚了),甚至微信公眾號留言都有可能。。。
最后啊,大數據能不能幫你找到對象,我還是持懷疑態度的,大數據是理性推理的工具,但人心是很善變的,女人心更是海底針,只能感慨一下:就算知道了所有的道理,還是過不好這一生。