連黃牛黨都開始玩AI了,春節搶票不加錢是回不去了通信
就算有一些現成的技術,12306也未必能夠拉起一支懂機器學習的隊伍天天來跟搶票黃牛們斗智斗勇,實時監控他們的策略變動并加以應對。
最近,中國鐵路總公司發布消息,暫不開放今年12月25日之后的火車票預售。若想購買12月25日之后的車票,最早要等到12月上旬。這就意味著,在12月,火車票預售情況將比往年更火(kong)爆(bu)!
票已然很難搶了,可12306還不斷搬出各種神招來讓你哭暈在廁所:比如那一年,“請點擊下圖中所有的白百合”……據某網站統計,上述驗證碼一次性輸入準確的比例僅為8%,也就是說,在熱門車票“秒光”的瞬間,92%的人會直接被這些圖片驗證擋在門外,連回家車票的面都見不上。
你抱怨眼神不好,抱怨手腳太慢,抱怨大腦走神......你以為這些真的是你自己的問題嗎?
No.No.No~~
與你一起搶票的,是無數你看得見的看不見的新興網絡黃牛。他們規模作戰,經驗豐富,搭配高配電腦高配光纖,外加專業搶票軟件及專業服務器。你的單兵作戰,哪里敵得過有組織有紀律的團隊作戰。
專業化的網絡黃牛搶票黨
在淘寶上,一搜“搶票”,竟有多達2000多家店鋪,專業做著這門幫人搶票的生意。
甚至,這條專業之路上,還形成了自己的鄙視鏈:
團隊協作淘寶店鄙視老板兼客服淘寶店,高端搶票軟件鄙視三流搶票軟件,固定價格淘寶店鄙視浮動價格淘寶店。
還有了人格擔保:“沒有金剛鉆,不攬瓷器活,專業的事情還需交給專業的人來做?!?/p>
所以,面對已經如此專業的團隊,你再火眼金睛,眼疾手快,也比不過一秒就能搶光一車廂票的機器。
12306本意用來阻擋黃牛的設計,如“識別白百合”的圖片驗證碼,反倒成為黃牛在搶票速度上碾壓普通人的一大殺器。因為圖片驗證碼的出現,讓黃牛和規?;膿屍逼脚_也速度AI化,其加大自動化圖像識別的機器訓練規模,讓普通用戶在這場速度競賽中遠遠落在后面。
于是,想要搶得票,就得加價。想要搶到票的幾率大點,就得狠狠地往上加價。
網絡黃牛黨越演越烈,就連飛豬、攜程也加入了這場網絡倒票的大潮中。搶票還搶出了三六九等,VIP級搶票一次收80元。
面對如今越來越瘋狂的網絡搶票黃牛黨,有沒有技術可以治治這些猖狂的行為呢?
有。
傳統的機器學習,可以對用戶進行分類和預測。它能夠針對有欺詐行為的用戶建立模型,然后根據模型來預測哪些用戶有問題,哪些用戶沒有問題。
但是,由于搶票往往都躲在暗處,傳統的機器學習想做出他們的模型,并非易事。
不僅如此,整個黑產鏈條上的各個環節,都伴隨著AI不斷進化,“與時俱進”。
驗證碼自動識別在機器大規模訓練后,變得火眼金睛;
從業人員在進行虛假注冊后,通過AI輔助模仿正常用戶來刷留存;
此外,AI還被用于自動生成所需的用戶資料和虛假評論內容等等;
最后,AI還可以被用來探查某平臺的風控規則、模型的邊界和漏洞。
“最新的方式是用無監督學習,這種方式目前是更有效的?!痹趯咕W絡黃牛黨這件事情上,DataVisor技術總監兼中國區負責人吳中在接受AI科技大本營的采訪時,提到了新的技術對抗手段。
治網絡黃牛的新招――無監督學習
據他描述,對于反欺詐的一方來說,基于固定標簽和規則的傳統有監督學習在應變性方面就比較弱,挖掘未知風險能力也相對較差。為了應對欺詐手段的不斷進化,基于無監督學習的防欺詐技術逐漸開始實裝。它能夠自己學習異常賬號的關聯和聚集性,當欺詐者的手段出現變化或是能力出現增強之后,無監督學習的系統可以自行做出相應的改進。也就是說,一套系統就可以解決不同的欺詐行為。
為什么無監督學習會表現得相對有效呢?
吳中告訴AI科技大本營,正常用戶同異常用戶之間的差別,簡單來說就是“壞人扎堆,好人分散”:
一般來說,正常的人是基于獨立的意志和偏好在電腦或是App上進行操作。而有欺詐行為的異常用戶,大部分是團伙作案,比如某犯罪團伙控制了100個用戶,然后去進行批量操作。
雖然在作案過程中,黑產人員會通過一些手段來把操作掩飾得相當逼真,比如換一下設備。但是從行為模式和很多緯度上面,還是很容易漏出馬腳的,比如頭像很奇怪,或者前后名字不一樣,抑或是時間間隔有異常……平臺日志會記錄用戶的行為,包括他叫什么、什么時候注冊、什么時候登陸、在什么時間做了什么事情、評論了誰、評論的內容是什么,等等。此后,無監督學習便通過讀取所有這些數據,把相似的行為歸為一組,把異常的行為甄別出來,從而判斷出各種各樣的欺詐行為。
而具體到網絡黃牛,無監督學習又是如何發揮效力呢?
我們知道,傳統的監督學習是要用黃牛搶票行為的模型來甄別異常購票行為的。但是,在倒票暴利的刺激下,他們有著極大的動力去不斷變化策略,以避免被鎖定出來遭受打擊。這就是為什么這樣的模型建立起來會相當難,而且即便是建立出來,也未必能有效應對黃牛們的新策略。
“不過,非正常的搶票、刷票行為,跟普通用戶正常的在線購票終究是不一樣的?!眳侵欣^續解釋到:
“一秒鐘買光一車廂票”的背后,是由軟件所執行的批量化操作;只有額外出錢才肯為你排隊的購票平臺,本質上也是靠后臺軟件來執行它對普通購票人群的群體控制。無監督學習,可以把這類群體性的、時常變化的搶票行為,同普通用戶個體化的、相對零散的行為區分開來。它所做的可能只是讀取各個用戶在注冊、下單、登陸等關鍵事件上的數據,但在下單付費的環節就能主動去攔截和封堵那些有欺詐行為的操作。
結語
技術的內容終究歸技術。網絡黃牛這件事情,只能是說起來輕松。就算有一些現成的技術,12306也未必能夠拉起一支懂機器學習的隊伍天天來跟搶票黃牛們斗智斗勇,實時監控他們的策略變動并加以應對。就算12306能做到這樣,真的把黃牛封堵光了,想必還是會有很多人因為火車沒了回不了家……不過到那時,鐵老大就只有老老實實挨罵的份了。
那么,我們普通人買票時,到底是希望徹底地消滅黃牛呢?還是從黃牛的口中分一點殘羹冷炙也無所謂?請投票表達你的想法~~
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。