大數據「殺熟」,細思極恐!(圖片來源:Lintao Zhang/Getty Images)
【看中國2018年12月1日訊】我最近發現個詭異的事情。
我前幾天在淘寶和京東分別搜過一樣特別小眾的商品,小眾到什麼程度呢?小眾到一般人根本不知道這類東西的存在。結果我今天打開拼多多,拼多多居然在首頁第一條就推薦了我這件東西。
這是怎麼回事?
要知道我在拼多多上沒有搜過任何東西,純粹是因為好奇拼多多有多傻才下的,同時我也沒有在任何搜索引擎搜過這個商品的名字。也就是說,拼多多只可能從淘寶和京東那裡拿到我的搜索記錄。但我想這兩個大戶顯然不會和這樣一個競爭對手共享這種大數據。
那問題來了,拼多多是怎樣拿到我的偏好的呢?難道是淘寶有內鬼兜售?難道淘寶被拼多多的間諜攻破了資料庫?難道是我的華為手機把我賣了?難道說現在各種軟硬體之間已經在互相利用及共享用戶信息,但凡手裡有數據的都會拿到台面上互通有無?
百思不得其解,細思極恐。
–01–
你也遇到過嗎?
我把拼多多這個事情發在知乎裡,想看看是不是有人和我一樣有這種感受。結果好多人紛紛和我表示,我現在才發現這個實在是太遲鈍了:
有人試過在B站搜一首歌聽,結果第二天網易雲音樂的每日推薦裡就有這首歌。B站和網易雲音樂有沒有交易?——我猜應該是有的。當然這尚可接受。
有人在小紅書看到一個RC的鞋,然後就去淘寶上搜有沒有代購,後來感覺不靠譜就放棄了,結果馬上就在微博上就看見同款鞋的推廣。微博和淘寶有沒有py交易?我不知道。
有人只是去參加了一次北京婚博會,晚上回到家打開微博和微信,發現信息流廣告全部變成了婚紗照、婚慶公司、婚禮禮服等。令他感到恐怖的是在此之前從未在手機進行過結婚相關的任何搜索。這一切發生改變的原因僅僅是因為他去了一次婚博會這個地方而已。
有人在知乎看到除甲醛的相關問題,只是百度了一下,結果連一個美食app都開始推薦除甲醛公司。在百度上打開某理財網站,不到半小時推銷電話就打過來了。
有時候你在網上搜了一本小說,然後突然就會有很多假網站在百度上顯示他們網站有這本小說可以下載,然後讓百度把他推在首頁,你打開鏈接一看其實裡面沒有,但是有其他東西的廣告。
qq也是,推送的店舖廣告會一直隨著你的行程而變。你在武漢它就給你推武漢,你在蘇州它就推蘇州。
看完知友的傾訴,我覺得今天的網際網路真是太可怕了。我知道大數據發展到最後一定會迎來這一天——我們自己被賣了都不知道怎麼被賣的。
但我沒想到這一天來的這麼快。
我本來已經被忽悠的快相信大數據這個東西了。
我以前覺得,就像你去樓下餛飩店吃餛飩,由於你喜歡吃香菜,老闆為了留住你,在你去過第一次後,每次都多給你加一些香菜來討好你,這是好事情,所謂的大數據就應該這樣改善我的生活。
但如果這個老闆把我的喜好賣給方圓20里地所有出得起錢的人,也不問他們拿了這個信息要幹嘛,這個事情就變得讓我有點不安起來。何況,現在出售的可不僅僅是我愛吃香菜這點信息。
我有一個粉絲作為網際網路從業人員告訴我,這些都是正常現象,讓我去百度一下「阿里媽媽」就知道了,於是我真的去百度了。
你們能想像嗎,「人群捕撈」這種用詞居然能被當成公開的營銷策略來叫賣。
我不是牲口,誰也別想「捕撈」我。
–02–
到底是誰出賣了你?因為拼多多這個事情,我最近開始反思我的上網習慣。
除了這幫網際網路公司可能在相互勾兌之外,我們身邊還可能隱藏了哪些出賣我們的東西呢?會不會是瀏覽器泄露了你的信息?
當年瀏覽器還是流量主入口的時候,多少奸商在瀏覽器上打主意。今天這個生態還在不在,有沒有升級成新的手段?
會不會是輸入法的鍋?
要說嫌疑,輸入法其實是最大的,因為各個軟體之間就算沒有數據共享,但輸入法卻是連接各個軟體的東西。它掌握了你線上線下的中文輸出內容,如果有心利用,這可是個巨大的財富池。
還有路由器這個東西,這個最容易被普通人忽略。
我記得過去銀行搞網際網路安全科普,一條重要的經驗就是登陸網銀的時候不要用公共場合的wifi,而是直接連移動聯通的4G,因為你不知道公共wifi路由器是不是在中間截取了你的傳輸信息。
其實想想,家裡的路由器就可靠嗎?很多人現在都反應用手機連家裡wifi搜個東西,然後在家用電腦會發現給你推薦類似手機搜過的東西。現在很多搞網貸區塊鏈的公司甚至願意免費送你路由器,能安什麼好心?
中國的運營商也不值得信任。
雖然說移動聯通搞你的網銀密碼可能性不大,但是賣你一點個人信息還是很有動力的。就算移動聯通能管住自己,就一定能管住自己下面幾十萬員工嗎?不要太樂觀。
當然,這些都不是最狠的,最怕就是直接在手機硬體上打主意。以普通人的動手能力和數碼水平,想在硬體層面上對抗那基本是完全無招架之力的。
為什麼斯諾登常年保持把攝像頭用膠布貼起來的習慣?他知道這裡面水有多深,很多app監聽著你的手機麥克風,剛和別人語音說過的東西馬上就推薦給你絕對不是空穴來風。
目前的語音識別已經非常完善。哪怕帶著很重的口音/使用方言,語音輸入法都有極高的識別率。當然,當手機在口袋裡時會出現很多干擾,這會降低識別率;但哪怕只能識別一些片段,也足夠拿來完成很多分析了。
新加坡的一個團隊甚至成功利用每個手機上都有的加速計、陀螺儀、磁力計、近距離感測器搞到了你輸入的密碼。
原理是這樣的:當你伸手在屏幕上劃來劃去時,手機微不可察的細小位置變動會體現為加速度計、陀螺儀裡面數值的極小變化,通過細微的力矩差異足以推斷出你手指點在屏幕哪個角落。
這些感測器,過去並不認為它是敏感的、需要保護的,所以任何程序都可以讀它。
怎麼樣,是不是毛骨悚然?
智能手機可能是至今發明的最私密的監控設備。它持續跟蹤我們的位置,它知道我們居住在什麼地方,在何處工作,在何地消遣。知道我們什麼時候醒來什麼時候睡覺,因為人人都有手機,因此它還能知道我們和誰一起睡覺。
–03–
所謂的「新零售」究竟是什麼鬼?我已經大概摸清了,所謂的新零售,其實就是用大數據殺熟。
一家酒店,如果有好多ip都在查詢,別想了,價格肯定嗖嗖漲。如果你用同一個ip的不同設備反複查,一天查好幾次,他還會故意無房。要是你第一次點了取消後,回頭再來看,價格會陡然升高。因為他知道你現在的需求特別迫切了。
馬未都講過他掏古董的時候也有類似的經驗:買古董如果當場看中當場買,往往價格會比較低,如果猶豫了一下,過兩天再去,對方就知道你是有明確購買意向的,立馬漲價。他管這叫做「買驚了」。
如果發現你住在「富人區」,賣給你的東西不貴個幾成,對得起大數據嗎,對得起網際網路業界的努力嗎?
以後那幫搞電商還能做到分辨每一個購買者的消費能力,同樣買一雙nike,根據你平時的消費,判定是高帥富的,有一定鑒別能力的,給發真貨。一般窮人,就圖個牌子的那種,直接發假貨,美滋滋。
現在人類全基因組全測序完也才70個G的大小,包含你所有的信息,以後要是這個也被賣來賣去,保險公司一定會推薦你買你最不可能的病的保險,這樣他們的賠付率會大幅降低。
大數據要是再和證券市場一結合那更是割韭菜的利器。在這種零和遊戲裡面,機構對散戶的收割會變成單向的屠殺。
如果一定要總結出來那些台面上的商人學者反覆念叨的新零售究竟是什麼,那麼可以這麼給他下一個定義:
通過綜合一系列的分析,判斷出
你是誰,
你現在要做什麼,
願意付出多少代價去做。
然後通過精準的用戶畫像,去對消費能力高、消費意願強烈的用戶展示更高的價格,賺取更多的利益。
更具體的說,他們會根據你以及你的朋友們使用搜索引擎搜索的詞彙、時間、頻率,判斷你是「隨便看看」還是「心裏長草」甚至是「心急如焚」,從而給你以及你的整個社會關係圈調整報價。你會越來越被引導著去買那些對你來說非最佳、但對商家來說利潤更高的東西。
不要覺得關於你的看似不起眼的信息泄露出去沒什麼。只要有心,從你身上多找點錢還是很容易的——而且你還發現不了。
所以你猜,為什麼國產應用,總喜歡一口氣要3、40項甚至更多授權,試圖把你的通訊錄你的簡訊你的攝像頭你的麥克風你的SD卡等等等等,把所有的內容都一網打盡呢?
未來這幫大佬們的市值再增長個幾千億,就靠這個了。
–04–
更加可怕的未來就在前方。
過去要洗一個人的腦是一件很麻煩的事情。
比如傳銷組織,要先把你騙去一個地方,安排壯漢把你關起來不讓走,然後主持人每天說的口乾舌燥,又唱又哭,還未必能洗成功。
未來?洗腦根本不需要那麼麻煩,隨著你交付出越來越多的個人信息,掌握在雲端的數據日益龐大,比你自己更瞭解自己的利益集團和別有用心的人可以讓你的大腦自己自動產生出他們需要的念頭。
這些掌握了大量個人信息的網站,不僅僅有你的生辰八字,身份住址,關鍵他記錄了你的行為,通過後臺反覆模擬計算,他可以以最短時間瞭解到你的需求,然後迅速滿足你。
慢慢地,網際網路的「好用」會逐漸綁架你的心智。
在龐大的數據面前,人類越來越像一個提供輸入的變數角色,任何試圖偽裝和保護自己的舉動,在無死角的數據監控下都顯得徒勞。
那個垃圾頭條和抖音就是一場預演,每天大量的運算被用來預測1億用戶的「真實」需求,1億用戶的「真實」需求是什麼?沒人說得清,演算法告訴你。
說實話,只是通過爬到我輸入的關鍵詞來打廣告這還不是最恐怖的,最恐怖的是,我只是在心裏想,然後它也會推送這樣東西的廣告。
而且他推了以後,我居然覺得自己確實需要。
可見演算法工程師的工資不是白拿的。
這個過程是怎樣的呢?舉個例子:
你有一天你心中突然想瞭解一下某個品牌筆記本電腦,結果一打開某個網站發現廣告推薦已經給你把這個商品給推薦過來了。
你也許會心裏疑問,我明明沒在網上搜過這東西啊,也從來沒和人談起過這個品牌啊,怎麼廣告就知道了正好我現在就想瞭解一下呢?
其實很簡單,你之所以會有想瞭解這個筆記本這個想法,並不是憑空產生的,有可能是你在瀏覽其他地方時,對筆記本相關的評測或推廣的目光停留稍微長了幾毫秒。
滾動慢了0.1秒那麼一下,人再「姦」都發覺不了這個小動作;甚至連你自己都沒注意到自己手指撥動慢了那麼一絲絲;但電腦卻可以輕鬆察覺到這個停頓——然後立即採取行動。
就這麼幾毫秒,這個動作馬上被記錄下來,說明你看中這個商品了。現在,只需要想辦法「推」你一把,幫你更快下定決心。
演算法就會在接下裡的諮詢中傾向於給你推薦更多和有關某個品牌創始人、遊戲、硬體方面的信息。
積少成多,終於這些活動引起了你意識層面的念頭——我需要買一個新的筆記本電腦,演算法大功告成,這個時候可以正式給你推它的廣告了。
演算法還可以根據你周圍的朋友,從他們的網上留下的信息裡歸結出最近這些朋友的高頻詞,也即他們最近所關心的話題。而你是他們的朋友,所以演算法就認為你可能總會從朋友那聽說這個話題,從而變得關心。
個體的行為不全部是隨機產生的,在之前的所見所聞所搜索中已經蘊含了你下一步行動的信息。所以你會覺得計算機怎麼這麼厲害,都窺探到你心裏想什麼了。其實並不是猜到,而是你的意識是被引導了,只是你察覺不到。
最終,我們自己變成了移動資料庫。
我們的每次搜索都會變成用戶畫像中的一個標籤在網際網路上的這些平台上轉發,我們每打開一次網頁或者app,我們就被掛起來賣了:
誒!瞧啊!這個人在這上網呢,誰要給他顯示廣告,價高者得!
大數據時代,你無處可遁。
百度的李彥宏曾經公開宣揚過,中國人願意用隱私換取便利。
借一句知乎上的評論:古往今來,所有損害中國人民利益的人都會用這麼一個藉口——中國人不需要。而中國人需要什麼,人民自己反而是無權定義的。
–05–
後記
我諮詢了一個比較Geek硬核的朋友要怎麼擦除網際網路上留下的痕跡,他給我的建議是:
國產服務不要想刪除數據的事了。想徹底抹去網際網路上的痕跡是很賽博朋克的行為,不要自找苦吃。除非你像我一樣,關閉掉一切非必須的定位許可、照片讀取許可、通訊錄讀取許可,從來不在外面連wifi。所有app禁止讀取通訊錄,禁止讀取應用列表,禁止讀取信息。
我說,那還有啥軟體能用啊?這不全歇菜了。
他說,所以我從來不用任何大陸軟體,能用開源軟體一律用開源,任何大陸產軟體都放在virtual machine或者Sandbox裡面用,多重代理加TOR。
我想了想,放棄了。
上次爆出來大數據殺熟還是上半年的事情,這事居然最後不了了之了,媒體集體閉嘴,關鍵詞搜索消失,巨頭的力量真是牛叉透頂。
我們唯一能做的,只有提高警惕。如果可能,轉發這類文章給周圍的人。我們的漠不關心,終將滋養出一批可怕的怪物。