我有個朋友從事銀行數據科學工作,對大數據隱私比較敏感。
銀行輔助進行黃賭毒排查工作。
以黃為例,聊聊大數據如何用最基本的信息和最簡單的手段,找出LSP和不法分子。
每個銀行都有一張最基本的用戶收支明細表,記錄每個用戶的每一筆收支記錄。
如【時間】2021年7月5日8點15分,【持卡人】Jack在【商家】永和豆漿早餐店花【金額】5.5元買了一杯豆漿、一根油條和一個荷包蛋。
這份數據可以用來解讀非常多的信息。
如何掃黃?
第一步,找出那些晚上11點至凌晨3點仍有活躍交易的賬戶;
第二步,如果這些金額也符合金額特征如"398元"、"498元"等,那就把這筆交易標記為可能涉黃;
這里需要特別指出的是為什么不用商家名稱,因為有些搞黃色的按摩會所非常狡猾,很少有使用直接商戶名的(如"紅浪漫按摩養生會所"的收款名稱可能搖身一變成了"永久便利店");
第三步,假設一個商家1個月有1萬筆交易,且70%的交易都符合上述特征。那么大概率這個商家就是涉黃的。
銀行會把這批名單輸送到公安,至于公安下一步怎么做那就不知道了。
一個特別搞笑的事情是4月份月度排查的時候,名單里居然出現了一家"榆林市解放路空氣凈化器"的商家,我們覺得不可思議,是不是數據搞錯了。
再次核實后確認,這個商家4月份共有989筆交易,有304筆交易是398元,483筆交易是698元,而且交易發生的時間都是在凌晨。
后來同事們笑稱,這哪里是空氣凈化器,明明是前列腺凈化器。
回到滴滴,滴滴掌握的是用戶出行數據。
何為用戶出行數據?從數據庫的角度,至少可以拆解成三張表。
1.用戶出行記錄表,Linda早上8:00從科苑路打車到科技園;
2.底層LBS表。精確到經緯度的位置映射,如北京動物園,116.344765,39.941026;
3.地理名詞標簽表。如科技園西南門-高檔寫字樓;紅浪漫KTV-休閑娛樂;湊湊火鍋(大悅城店)-餐飲火鍋。
這三張表可以用來干什么壞事兒?我腦補如下:
1.用戶隱私角度。
還是搞黃色,拿搞黃色的為例,近半年內去過5次以上休閑娛樂場所的標記為可能搞黃色;
當然了,滴滴不拿搞黃色盈利,推送貸款才是主要用途。
這里從風控角度可以衍生非常多的標簽;如經常往返機場,說明你是有一定消費能力的差旅人士;半年前就注冊了但是一直沒用,最近開始使用打車軟件并且去了好幾趟趟家居城。
那么你極有可能被推送貸款。
因為你還得起且有貸款需求。
2.國家安全角度。
2.1暗殺大人物。
北京大院住了很多大人物,當然這些住所很隱蔽,就算你是FBI,也不能挨個排查。因為工作量大。
如果有了滴滴大數據,就可以用排除法了。
首先這些大人物大院子不可能有人經常坐滴滴,人員活動受到限制。搞清楚打車熱力圖就可以極大減少排除工作量。然后展開暗殺行動。
2.2策反小人物。
從差旅人士里面找策反對象。
比如祿口機場-南京核工業集團、中川國際機場-蘭州核工業基地。
有人會問了,這么級別的人物還需要打車?派奔馳接送不就完了么?
有一類群體是管理咨詢顧問。他們經常出入各個國企,自己打車…十四五戰略規劃項目接觸到保密材料綽綽有余。
大數據時代,每個人都在裸奔。
怎么把褲子穿好?幾個tips送給大家
1.笛卡爾集支付。3張銀行卡、3種支付方式(微信 支付寶 銀聯),比如今天用微信建行卡吃飯,明天用支付寶招行卡網購。
當然,現金最安全。
2.不使用真實地址。如想打車去紅浪漫ktv,那最好是定位終點為附近100米的雞公煲或者肯德基。
3.不作惡。人在做,天在看,數在記。