00-用戶軌跡挖掘


用戶軌跡挖掘學習

現有的位置服務,通常直接使用用戶提供的位置數據,缺乏對這些數據的分析和挖掘,忽略了這些位置數據中蘊含的信息和知識。

如何利用數據挖掘和機器學習等技術從個人及大眾用戶軌跡數據中獲取知識,並利用這些知識來定制更加智能的基於軌跡的位置服務。

一:基於位置的服務(LBS)

軌跡記錄了用戶在真實世界中的活動,這些活動在一定程度上體現了個人的意圖,喜好和行為模式。

從軌跡中可挖掘的知識包括:

        1:個人數據中挖掘出的用戶行為,意圖,經驗和生活方式

        2:集合多人數據來發現熱點地區和經典線路

        3:理解人與人的相關性,以及人與地域之間的活動模式:

二:個人軌跡頻繁模式挖掘

 

    個人歷史軌跡建模

     

    停留點進行聚類,利用各個停留點所歸屬的聚類來替換停留點,將停留點序列進一步轉化為聚類的序列。

    這樣用戶在不同時間階段的歷史軌跡可比

  個人軌跡頻繁模式挖掘

    利用Aprior,FP_growth挖掘頻繁項集

    利用prefixspan算法挖掘序列模式

三:基於多人軌跡數據的大眾旅游推薦

    大眾軌跡數據建模

         基於層次圖模型的多用戶軌跡聚合

         從每個用戶的每條線路中提取出停留點,放在集合中,然后利用一種基於密度的聚類算法,對停留點集合進行層次化聚類

         在不同的地理尺度上,將相近的停留點划分到同一個聚類,得到一個層次樹

         樹種的節點代表不同的停留點聚類,不同層次表示不同的地理空間尺度。

         層次越深,粒度越細,代表的地理空間也越小。

         

 

    發掘興趣點(旅游地點)和旅行專家(旅行達人)

        概覽

            每個地區(聚類)的興趣度

            每個用戶的經驗值(對一個地域的了解程度和所具備的經驗值)

            對地點按照興趣度排名,對用戶按照經驗值排名

            把具有較高排名的地區作為有趣的景點

            把經驗值較高的人作為本地的專家推薦給用戶

        如何計算興趣度和人的經驗值

               一個人的經驗值可表示為他去過的地方的興趣度的和

              一個地方的興趣度可表示為所有訪問過該地點的人的經驗值的和

              因此 給地點的興趣度和人的經驗值賦上非全零的隨機初值,通過一個簡單迭代的算法計算出最終的收斂結果。

        區域性:

             一個人的經驗值跟地域有關系。比如一個北京的旅行專家可能對上海不是很熟悉。

            如圖:人的經驗值和地點的興趣度相互依賴和關聯的關系

            

     檢測景點旅行線路

           根據得到的地點興趣度和人的經驗值

                 1:選擇這個順序的人的經驗值之和,即選擇這個順序的人越有經驗,這個訪問順序可能越合理

                 2:這個順序中包含的景點的興趣度,如果一條線包含的景點越有趣,越值得被推薦

                 3:人們選擇這個順序的概率

           如圖:計算一個順序的經典程度

           

           線路A->C的經典值:

           這里,IA 和IC表示地點A和地點C的興趣度,e^k,為用戶 UK的經驗值,

           5/7表示有7個人從A點離開,5個人選擇了A->C這條路線。表示A點的興趣度只有5 /7可以傳播到這條線路上來

           5/8表示有8人到達C,其中有5人來自A->C這條線路。表示C點的興趣度只有5/8分配到A->C這條線路上來

           進一步的,這個建模方法將挖掘景點旅行線路轉化成一個帶權值的最小生成樹問題。

           利用改進的最小生成樹算法!就可以得TopN的旅行線路

          

四:個性化朋友和地點推薦

        基於歷史軌跡的人與人之間的相似度的計算

            人在地理空間的移動的相似性,也在一定程度上反應了不同人之間的品味和愛好的相似性。

             利用層次圖來比較用戶的相似性

             方法:利用層次化聚類的思想將所有用戶的停留點轉化為一個公共的層次樹,樹種的各個節點表示不同

                       尺度和粒度的地點。此后,將每個用戶的線路分別導入這個公共的框架,便可得到用戶各自的層次圖

             通過匹配兩個層次圖來計算用戶相似度

                       層次:較深的層次具有較細的空間粒度和尺度。兩個用戶在越深的層次上圖越相似,活動軌跡越相似

                       相似序列的長度:用戶共享的序列越多,序列的長度越長,相似性越大

                       

   個性化朋友和地點推薦

            1:計算出用戶之間的相似性,為某個用戶找出最相似的n個人作為潛在的朋友,完成個性化朋友推薦

            2:在潛在的朋友歷史軌跡中查找出一些該用戶沒有去過的地點,並利用協同過濾的方法來估計該用戶

                  對這些地點的興趣度。

                  如圖:用戶和訪問地點之間關系的矩陣表達式

                 

          3:按照估算的興趣度對用戶去過的地點排名,並把排名較高的m個地點推薦給用戶

 

 

 

                 

 

 

 


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com