如何了解用戶需求?根據用戶是否主動參與分為顯式與隱式兩種挖掘模式,因為顯式的動靜比較大,有很大局限性,所以為了保證結果準確性以及提高用戶接受度,一般都采用隱式。
用戶的日常交互行為會產生四類關鍵數據:鼠標移動軌跡、鏈接點擊分布、頁面瀏覽流、頁面停留時間。通過用戶的行為能反映用戶的觀點,同時利用訪問的網頁次序可以找出網頁之間的隱性關系。
收集數據
1)Web服務器的日志(用戶會話記錄)
2)Web trends或類似的第三方共享軟件(客戶端分析,流量分析,可用性分析)
3)自己開發(fā)的第三方軟件/插件(需求自定義)
大型網站通常會把以上三種方法組合應用,大致原理就是給進入網站的用戶賦予身份識別,每次產生交互動作就向服務器發(fā)回請求,通過時間和頁面判斷連接各個請求點并且記錄下來。(算法不討論)
過濾數據
1)明確目標,定義核心數據。
2)界定用戶行為,利用多數人的行為來消除個人行為的主觀性。
3)對用戶進行歸類,確定數據類別。
大型網站每天所產生的數據量是驚人的,所以常規(guī)需求一般都是定時或定量的分析。另外,額外的數據處理會減慢網站的速度,搜集的數據越多,潛在的負面影響越大。
習慣分析
1)對用戶瀏覽過的頁面進行內容分析,根據信息主題對頁面進行聚類。
2)聚類過程中除了考慮頁面內容相近程度,還應該考慮頁面路徑。
3)把用戶瀏覽行為對其興趣的作用列入聚類結果,得到綜合評估模型。
用戶興趣分偶然和穩(wěn)定兩種情況,其中偶然可以認為是隨機變化的,穩(wěn)定的挖掘又有基于內容和行為兩種方式,在內容上表現有重復度、相似度等,在行為上表現有停留時長、點此次數、拉動滾動條次數等。
實際案例
類似系統(tǒng)、瀏覽器、分辨率的客戶端分析,常見而且簡單,略過。
關于鼠標軌跡、點擊分布的可用性例子:
跟蹤用戶在進行檢索時的鼠標移動軌跡,可以獲取用戶操作的先后順序、熱點功能、動作曲線等一手數據,這些都是改善或簡化表單的重要參考。
在重要的頁面進行詳細的點擊分布監(jiān)控統(tǒng)計,主要檢查信息呈現的易用性,看看有沒有偏離設計初衷,經常更新,找到規(guī)律。
處理特定用戶行為、用戶群、用戶來路的任務流例子:
監(jiān)控分布式注冊流程,能夠看到有多少用戶填了表單、填完了表單,或者在某個步驟有異常流失。
監(jiān)控不同模塊入口過來的注冊用戶,能夠統(tǒng)計出各模塊導入的有效注冊量、百分比、成功率,以便合理調配資源。
監(jiān)控投放廣告過來的注冊量、注冊成功率、轉換付費用戶成功率,以便明確廣告的投入產出比。
監(jiān)控用戶的縱深瀏覽行為,是測試導航可用性很好的辦法,也就是說用戶會不會在你的網站內迷路?
結束
再次強調,這里的討論**于后期研究的隱式挖掘,就是不去驚動用戶,不讓用戶察覺的方法,完全通過技術手段拿到我們想知道的數據,再通過理論分析來改進產品。
之前在某上市公司全程參與了類似系統(tǒng)的開發(fā),更艱難的部分還是在如何獲取數據的基礎建設階段,但終歸是一勞永逸的事情,對以后的發(fā)展有益無害。
隱式挖掘網站用戶行為,謝謝圍觀。