明:之前在《[轉載] 在線廣告作弊手段一覽》和《[轉載]Facebook廣告陷入信任危機:虛假點擊泛濫》兩篇文章中,我們介紹了Web媒體如何作弊和識別廣告點擊作弊的方法,那在移動互聯網中是否存在作弊呢?答案顯而易見。本文的作者就為我們描寫了是如何識別APP付費推廣作弊的。同樣,我們重點來學習作者的分析思路。原文鏈接是:http://www.leiphone.com/0731-utlee-app-channel.html
正文開始:
創業者很苦鱉的,苦於創意,苦於開發,苦於用戶體驗。
創業者很苦鱉的,就算把產品做好了,不推廣也很難獲得用戶。
創業者很苦鱉的,遇上無良渠道商,花錢做推廣,花時間做換量,可產品還是不見起色。
看看一個同樣苦鱉開發者的自述吧。
我做數據挖掘技術出身,並從事推廣工作三年,App付費推廣的作假現象已屢見不鮮,
這次終於長見識了,見過作假的,沒有見過那么扯淡的。
數萬元推廣費用,獲得上萬激活量,只有7個真實用戶,當然,還不排除這7個“真實”全是這個坑爹渠道的測試人員,產品、運營、商務的親們千萬小心了:
我所在公司長期做App的換量及付費推廣,最近上線一套智能算法用來甄別假量,發現某“渠道A”(該渠道真實名稱可向趙童鞋私下詢問)嚴重作弊刷假量。先來看看該渠道A最近一周的數據(注:因涉及產品機密數據,隱去了具體數值,僅表現大體趨勢。下述所有圖表均如此):
(1)注冊率
(2)一次留存用戶
(3)啟動次數(平均每人每日)
所有數據無明顯異常,從數據上看,還是個“高質量渠道”。不甘心?!?!再多些深度數據(最近一周):
(1)用戶流失速度
(2)用戶回訪間隔
(3)鐵桿用戶比率
常用的數據都查了,還是沒有確鑿的異常!好吧,不管願意不願意接受,苦逼的現實是:
傳統的數據指標已區分不出作假的渠道了。
怎么辦,還有沒有數據能夠讓作假無處遁形的?有!比如用戶的應用使用時長。
可以設想一下,刷假量的機器人畢竟不是真實用戶,它們完成“指定”的操作任務后,不會再因為看到美女就猛點她的頭像,也不會玩爽了再多玩會兒。那么來看一下用戶使用時長曲線對比:
渠道A的使用時長遠低於整體平均值(其他渠道),且沒有隨着日期形成周期性規律震盪。總算是露馬腳了,完全可以確定是機器人刷假量!
機器人刷假量,應該是能找出特征的。按以前的做法是對比IMEI號,但現在的刷量機器人卻早就能偽造假IMEI了。
但依然可以根據IMEI尋找機器人特征,正常渠道的IMEI號極少重復,且重復的概率不隨時間推延而增大;而作弊渠道的IMEI重復率往往較高,且隨着時間不斷增長。
可以實際上IMEI數據還是不能看出異常,需要再想別的辦法。不同用戶的手機,是用的不同通訊運營商(諸如移動、聯通、電信)的電話卡,通過統計運營商有希望找出機器人特征。為了做分析,抽樣了一小撮用戶,提取了他們的運營商信息,統計結果顯示:
看來通過運營商的情況是分析不出機器人特征的。而我又抽樣部分用戶IP地址,不管是IP分布還是IP跨省概率都與正常用戶一致。
一個血淋淋的現實擺在了眼前:
假用戶的仿真度越來越高,識別它越來越難,而提取作假特征幾乎已不可能。
當然,沒有苦鱉青年走不通的路,最終我們公司還是完成了取證。
抽樣提取了該渠道部分Android用戶所安裝的App列表,發現很多用戶安裝的App是一模一樣的。再深挖這個貓膩,結果得知:
A渠道,一共制作了4組機器人,每組機器人數量若干,同組內機器人所安裝的App一模一樣,且不增不減。
總算是把A渠道的機器人揪出來了,但是因為法律法規的問題,我們並不能把該渠道怎么樣,只能是不給錢,然后將造假消息告訴認識的朋友。
而且,事件的結果並沒有像童話故事一樣美滿,苦鱉的我們又遇上了更無敵的機器人刷量,而且上述的所有判斷方式全部失效。真是道高一尺,魔高一丈。
至今為止,與我所在公司合作的渠道,有近3成查出了刷假量作弊,從2010年最簡單的弱智灌水;到2011年出現智能機器人,開始會模擬真實用戶進行注冊,還能夠回訪;再到2012年,機器人已能做到個性化的高仿真。
而事后想想,這樣的渠道能提供如此高仿的假用戶,傳統的所有數據指標都無效,讓普通的開發者完全沒辦法區分,最大的原因就是因為暴利的驅使,花費數萬元獲得的上萬激活卻只有7個真實用戶,這黑心錢掙得太犀利了,這幾乎是零成本的獲利!
而且現在並沒有多少家公司在查作弊,作弊的風險的低,且無相關法規約束,作假也變的理所當然了。
此外,就我所知,做假量的激活cpa,單價僅在1角到7角之間,遠低於真量,中間巨大的差價帶來了巨大的回扣空間。推廣的負責人也許已經發現了作弊,但是受回扣驅使或者是業績壓力,故意隱而不發也是很有可能的。
通過本文,我們可以看到作者的分析思路和指標及各指標可能的公式如下:
排查的順序 | 排查的指標 | 可能的公式 | 維度 |
1 | 注冊率 | 注冊量/下載量 | 每天 |
2 | 留存率 | 開機量/注冊量 | 每天 |
3 | 平均啟動次數 | 啟動總次數/啟動唯一用戶量 | 每天 |
4 | 用戶流失曲線 | 符合流失標准的用戶數/注冊量 | 每天 |
5 | 回訪平均間隔 | 回訪間隔總時長/回訪總次數 | 每版本 |
6 | 鐵桿用戶比率 | 符合鐵桿標准的用戶數/注冊量 | 每天 |
7 | 人均使用時長 | 使用總時長/使用唯一用戶量 | 每天 |
8 | IMEI重復率曲線 | 每日與之前所有IMEI重復總量/每日IMEI量 | 每天 |
9 | 運營商分布 | 注冊量中某運營商總量/注冊量 | 每天 |
10 | APP安裝包出現比率 | 注冊量中相同APP總量/注冊量 | 每天 |
http://www.iamniu.com/2012/08/15/apps-anti-cheating/
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。