渠道商用假量冒充真實用戶:開發者求給條活路


明:之前在《[轉載] 在線廣告作弊手段一覽》和《[轉載]Facebook廣告陷入信任危機:虛假點擊泛濫》兩篇文章中,我們介紹了Web媒體如何作弊和識別廣告點擊作弊的方法,那在移動互聯網中是否存在作弊呢?答案顯而易見。本文的作者就為我們描寫了是如何識別APP付費推廣作弊的。同樣,我們重點來學習作者的分析思路。原文鏈接是:http://www.leiphone.com/0731-utlee-app-channel.html

正文開始:

光盤機器人創業者很苦鱉的,苦於創意,苦於開發,苦於用戶體驗。

創業者很苦鱉的,就算把產品做好了,不推廣也很難獲得用戶。

創業者很苦鱉的,遇上無良渠道商,花錢做推廣,花時間做換量,可產品還是不見起色。

看看一個同樣苦鱉開發者的自述吧。

我做數據挖掘技術出身,並從事推廣工作三年,App付費推廣的作假現象已屢見不鮮,

這次終於長見識了,見過作假的,沒有見過那么扯淡的。

數萬元推廣費用,獲得上萬激活量,只有7個真實用戶,當然,還不排除這7個“真實”全是這個坑爹渠道的測試人員,產品、運營、商務的親們千萬小心了:

我所在公司長期做App的換量及付費推廣,最近上線一套智能算法用來甄別假量,發現某“渠道A”(該渠道真實名稱可向趙童鞋私下詢問)嚴重作弊刷假量。先來看看該渠道A最近一周的數據(注:因涉及產品機密數據,隱去了具體數值,僅表現大體趨勢。下述所有圖表均如此):

  • 注冊率
  • 留存率
  • 啟動次數

(1)注冊率

注冊率

(2)一次留存用戶

一次留存用戶

(3)啟動次數(平均每人每日)

啟動次數

所有數據無明顯異常,從數據上看,還是個“高質量渠道”。不甘心?!?!再多些深度數據(最近一周):

  • 用戶流失速度
  • 用戶回訪間隔
  • 鐵桿用戶比率

(1)用戶流失速度

用戶流失速度

(2)用戶回訪間隔

用戶回訪間隔

(3)鐵桿用戶比率

鐵桿用戶比率

常用的數據都查了,還是沒有確鑿的異常!好吧,不管願意不願意接受,苦逼的現實是:

傳統的數據指標已區分不出作假的渠道了。

怎么辦,還有沒有數據能夠讓作假無處遁形的?有!比如用戶的應用使用時長

可以設想一下,刷假量的機器人畢竟不是真實用戶,它們完成“指定”的操作任務后,不會再因為看到美女就猛點她的頭像,也不會玩爽了再多玩會兒。那么來看一下用戶使用時長曲線對比:

用戶使用時長

渠道A的使用時長遠低於整體平均值(其他渠道),且沒有隨着日期形成周期性規律震盪。總算是露馬腳了,完全可以確定是機器人刷假量

機器人刷假量,應該是能找出特征的。按以前的做法是對比IMEI號,但現在的刷量機器人卻早就能偽造假IMEI了。

但依然可以根據IMEI尋找機器人特征,正常渠道的IMEI號極少重復,且重復的概率不隨時間推延而增大;而作弊渠道的IMEI重復率往往較高,且隨着時間不斷增長。

IMEI重復率曲線

可以實際上IMEI數據還是不能看出異常,需要再想別的辦法。不同用戶的手機,是用的不同通訊運營商(諸如移動、聯通、電信)的電話卡,通過統計運營商有希望找出機器人特征。為了做分析,抽樣了一小撮用戶,提取了他們的運營商信息,統計結果顯示:

渠道A運營商分布

其他渠道運營商分布

看來通過運營商的情況是分析不出機器人特征的。而我又抽樣部分用戶IP地址,不管是IP分布還是IP跨省概率都與正常用戶一致

一個血淋淋的現實擺在了眼前:

假用戶的仿真度越來越高,識別它越來越難,而提取作假特征幾乎已不可能。

當然,沒有苦鱉青年走不通的路,最終我們公司還是完成了取證。

抽樣提取了該渠道部分Android用戶所安裝的App列表,發現很多用戶安裝的App是一模一樣的。再深挖這個貓膩,結果得知:

A渠道,一共制作了4組機器人,每組機器人數量若干,同組內機器人所安裝的App一模一樣,且不增不減。

APP包名列表

APP包出現比率

總算是把A渠道的機器人揪出來了,但是因為法律法規的問題,我們並不能把該渠道怎么樣,只能是不給錢,然后將造假消息告訴認識的朋友。

而且,事件的結果並沒有像童話故事一樣美滿,苦鱉的我們又遇上了更無敵的機器人刷量,而且上述的所有判斷方式全部失效。真是道高一尺,魔高一丈。

至今為止,與我所在公司合作的渠道,有近3成查出了刷假量作弊,從2010年最簡單的弱智灌水;到2011年出現智能機器人,開始會模擬真實用戶進行注冊,還能夠回訪;再到2012年,機器人已能做到個性化的高仿真。

而事后想想,這樣的渠道能提供如此高仿的假用戶,傳統的所有數據指標都無效,讓普通的開發者完全沒辦法區分,最大的原因就是因為暴利的驅使,花費數萬元獲得的上萬激活卻只有7個真實用戶,這黑心錢掙得太犀利了,這幾乎是零成本的獲利

而且現在並沒有多少家公司在查作弊,作弊的風險的低,且無相關法規約束,作假也變的理所當然了。

此外,就我所知,做假量的激活cpa,單價僅在1角到7角之間,遠低於真量,中間巨大的差價帶來了巨大的回扣空間。推廣的負責人也許已經發現了作弊,但是受回扣驅使或者是業績壓力,故意隱而不發也是很有可能的。

總結:

通過本文,我們可以看到作者的分析思路和指標及各指標可能的公式如下:

排查的順序 排查的指標 可能的公式 維度
1 注冊率 注冊量/下載量 每天
2 留存率 開機量/注冊量 每天
3 平均啟動次數 啟動總次數/啟動唯一用戶量 每天
4 用戶流失曲線 符合流失標准的用戶數/注冊量 每天
5 回訪平均間隔 回訪間隔總時長/回訪總次數 每版本
6 鐵桿用戶比率 符合鐵桿標准的用戶數/注冊量 每天
7 人均使用時長 使用總時長/使用唯一用戶量 每天
8 IMEI重復率曲線 每日與之前所有IMEI重復總量/每日IMEI量 每天
9 運營商分布 注冊量中某運營商總量/注冊量 每天
10 APP安裝包出現比率 注冊量中相同APP總量/注冊量 每天

http://www.iamniu.com/2012/08/15/apps-anti-cheating/


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com