摘要:今天這篇文章,主要圍繞馬蜂窩用戶標簽體系中的用戶貢獻能力標簽,來介紹我們如何挖掘那些對馬蜂窩的有貢獻能力的群體,這樣做的價值是什么。挖掘用戶內容貢獻能力的意義鼓勵用戶分享原創內容彼此借鑒旅游信息,是馬蜂窩得以持續吸引用戶的核心。
在用戶個性化時代,垂直化、精細化的運營,被看作企業重要的競爭力。完整、清晰的用戶畫像體系,可以幫助企業從海量的用戶信息中發掘每個用戶的行為特性、潛在能力及興趣等信息,從而為用戶提供具有針對性的服務。
馬蜂窩擁有海量的用戶出行體驗數據,在成長和發展的過程中一直在探索如何通過基于海量 UGC 的數據挖掘出每個用戶的基本特征、對旅游主題、目的地的偏好和潛在興趣,從而精準地定位和標記用戶,將優質的內容、商品和服務與用戶進行連接。
今天這篇文章,主要圍繞馬蜂窩用戶標簽體系中的「用戶貢獻能力」標簽,來介紹我們如何挖掘那些對馬蜂窩的 UGC 有貢獻能力的群體,這樣做的價值是什么。
挖掘用戶內容貢獻能力的意義鼓勵用戶分享原創內容、彼此借鑒旅游信息,是馬蜂窩得以持續吸引用戶的核心。這些用戶產生的原創內容不僅包括記錄自己旅游體驗的攻略、游記,也包括幫助其他用戶解決旅行疑惑的問答、點評等。通過這種互享型的內容互動模式,越來越多存在個性化旅行需求的用戶在馬蜂窩完成旅游消費決策的閉環。
為了更好地幫助用戶提升決策效率,我們需要挖掘出那些擁有豐富的自由行經驗,并且具有一定內容生產能力的旅行者,圍繞內容增長、用戶活躍制定相關策略。
如果只通過用戶的等級劃分來評估該用戶的影響力,顯然是存在問題的。我們都知道,用戶等級作為用戶激勵體系中的一種方式,是對用戶過往行為的認可,因此等級一般只會上升不會下降,這種特點導致:
用戶核心輸出能力無法得到有效量化:用戶只要每天進行打卡、回復、評論等簡單行為也會慢慢升級到高級別;
用戶升級以后等級固化:例如用戶很長時間沒有登錄,但從等級來看他的影響力依然很強;
無法感知用戶的內容輸出意愿:即使用戶等級高且在近期有過登錄行為,但對哪些話題感興趣、是否存在生產內容的意愿我們無從感知。
為了解決以上問題,我們將內容貢獻能力作為用戶畫像標簽體系中的一個字段進行挖掘,并應用到馬蜂窩很多業務當中,比如:
旅游問答邀請
馬蜂窩問答可以看成是一種更快捷、簡短、個性化的旅游攻略。我們可以圈定近期在該領域內容貢獻豐富的、以及內容受歡迎的相關用戶,推薦給提問者定向邀請回答,保證旅行者的問題能夠快速、準確地被解答。
馬蜂窩 KOL?挖掘
利用用戶內容貢獻能力標簽,我們可以更精準地挖掘活躍的、專業的、熱愛旅行并能生產高質量內容的 KOL,一方面可以在線上通過邀請入駐、內容推薦等方式,讓這些資深旅行者的優質內容得到更多曝光;另一方面,可以將 KOL 的力量組合起來,轉移到線下,用他們的親身經驗最簡單地帶動用戶的直觀認知,比如「馬蜂窩指路人」等。
圖:馬蜂窩旅行家專欄
圖:馬蜂窩指路人俱樂部
用戶內容貢獻能力模型簡單來說,就是從用戶的的活躍度、在一定時間內的受歡迎度、輸出意愿三個維度構建模型,從而對用戶貢獻能力進行測度,即:
用戶內容貢獻能力 = 用戶的輸出意愿 + 用戶的活躍度 + 用戶的受歡迎程度
1. 用戶活躍度模型RFM 模型我們很多人都不陌生,這是衡量用戶價值和用戶創利能力的經典工具。這里我們基于馬蜂窩旅游社區的場景,將 RFM 模型的三個因素調整為:
A(Activity):用戶活躍度
e^(-αt):最近一次訪問時間距今天的時間衰減,采用指數衰減,其中?α 為衰減系數。這里利用指數衰減函數做為時間衰減因子,F*E 可以理解為用戶的活躍的熱度,時間衰減因子體現了用戶活躍的熱度隨著時間逐漸衰減的過程。在馬蜂窩場景下,通過對實際數據的調參,我們選擇當時間 t 為一年(365)的時候衰減為最小值 0.0001,此時帶入公式求出 α 的值。這里考慮的是用戶一年未貢獻任何的內容則意愿衰減至最低,求得 α 為 0.0189;
F(Frequency):?用戶在特定時間內的內容貢獻頻次。這里也是基于場景包含對游記、問答、攻略、筆記(圖、文、視頻結合)等所有類型內容的計算;
E(Engagements):用戶最近一次貢獻內容的類型,不同類型的 UGC 對應的值不同。例如產出一篇游記的難度以及內容的價值要高于回答一個用戶的問題,和以圖片、視頻為主的筆記。經過在馬蜂窩全站計算不同類型的文章在 UGC 數量占比,得出如下結論:游記的 E 值為 5,問答值為 2.5,筆記值為 3 。
2. 用戶受歡迎程度?無論是什么形式的 UGC,被認可的方式通常基本都是通過其他用戶的點贊、評論、收藏、分享幾種方式。在馬蜂窩,游記、問答、攻略、筆記等不同的文章形式歡迎度是不同的,比如以圖片、視頻形式為主要呈現形式的短內容(筆記 )雖然曝光較多,但是被點贊、評論等認可度卻不如攻略或者游記這樣的長文章。
因此這里通過分析社區中游記、問答、筆記等不同內容的被贊情況進行分析,算出一個用戶歡迎程度最終綜合得分和平均分,如下:
以上,W 代表的是用戶受歡迎程度的綜合得分,α、β、χ?分別代表不同類型內容的權重因子。這里通過計算全站不同形式的文章被贊的情況進行分析,得出 α:β:χ = 1:1.05:0.98 ,為了計算方便近似取 α、β、χ ?均為1。
Travel 值表示游記的受歡迎程度,計算方式是通過點贊、收藏、分享、回復等相關特征,作為衡量一篇文章是否受歡迎的特征屬性,然后通過 logistic 回歸模型訓練特征權重,如下:
Y 表示訓練的文章是否是優質,W_i 代表權重,通過模型訓練得出權重的值,N 代表文章類型,vote代表點贊,Fav 代表收藏,Comment 代表評論,Share 代表分享。最后求得權重以通過權重計算 Travel 來評判一篇游記受歡迎的程度。Answer、Note 的計算方式同上。經模型訓練的得出結果如下(這里為了計算方便,四舍五入取值小數點后一位):
游記:w1:0.1,w2:0.5,w3:0.2,w4:0.4;
問答:w1:0.2,w2:0.9,w3:0.3,w4:0.6;
筆記:w1:0.1,w2:0.5,w3:0.3,w4:0.6;
3. 用戶分享意愿?用戶分享意愿是根據為用戶打標簽和 PageRank 來實現。將用戶貢獻內容標簽作為用戶興趣的代表,然后結合實際場景,根據 PageRank 計算模型來分析話題與用戶之間的關系,結合標簽相似度計算向用戶推薦其感興趣、分享意愿高的內容。比如當用戶貢獻內容標簽與當前話題的標簽分類屬于同一類的時候,我們可以理解為用戶對當前同類標簽的話題輸出意愿是比較強的。如果用戶還貢獻過當前話題標簽相類似的內容,用戶的分享意愿會對應提高。如下:
D 代表用戶的內容寫作意愿程度,d_i 代表用戶對某一類型的文章的貢獻意愿(比如寫作游記的意愿);
T_i 代表用戶在過去時間生產的某一類型內容占用戶分享的所有內容比值,其中 T_1 代表游記,T_2 代表問答,T_3 代表筆記;
C_i 代表用戶寫過的某一類型的文章其中出被評選為優質的數量,同理 C_1 為貢獻優質游記的數量,C_2 為貢獻優質問答數量,C_3 為貢獻優質筆記數量。
N 代表阻尼系數,這里默認 N 值為 0.85。
綜上,通過「用戶的輸出意愿 + 用戶的活躍度 + 用戶的受歡迎程度」,我們就可以給出相應的用戶 UGC? 等級,從而使用戶的內容貢獻能力得到客觀、有效地量化。
小結用戶內容貢獻模型充分考慮了用戶等級設置中沒有突出用戶行為類型、時間衰減因素,以及沒有充分挖掘用戶興趣的三個問題,提出了一種新的模型視角,并在馬蜂窩的當前產品中充分應用。
未來,我們會繼續優化算法,例如在模型中加入評論等多個維度的屬性;在內容影響力方面加入內容畫像的質量分+文章本身的得分,而不僅僅局限于優質、蜂首、采納回答等等,來更加準確地挖掘用戶內容貢獻能力,完善馬蜂窩用戶標簽體系。
本文作者:于允飛 & 張陽,馬蜂窩推薦架構 & 用戶畫像研發工程師。
(題圖來源:網絡)
關注馬蜂窩技術,找到更多你想要的內容
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/54004.html
摘要:本文將結合馬蜂窩容器化平臺賦能前端應用構建的實踐經驗,介紹整個平臺背后的設計和實現原理,取得的一些效果及問題的優化方案。如果使用容器化平臺就不會出現這方面的擔憂。 容器對前端開發真的有用嗎?答案是肯定的。 最初當我向公司的前端同學「安利」容器技術的時候,很多人都會說:「容器?這不是用在后端的技術嗎?我不懂啊,而且前端開發用不上吧。」 showImg(https://segmentfau...
摘要:本文將結合馬蜂窩容器化平臺賦能前端應用構建的實踐經驗,介紹整個平臺背后的設計和實現原理,取得的一些效果及問題的優化方案。如果使用容器化平臺就不會出現這方面的擔憂。 容器對前端開發真的有用嗎?答案是肯定的。 最初當我向公司的前端同學「安利」容器技術的時候,很多人都會說:「容器?這不是用在后端的技術嗎?我不懂啊,而且前端開發用不上吧?!?showImg(https://segmentfau...
摘要:本文將結合馬蜂窩容器化平臺賦能前端應用構建的實踐經驗,介紹整個平臺背后的設計和實現原理,取得的一些效果及問題的優化方案。如果使用容器化平臺就不會出現這方面的擔憂。 容器對前端開發真的有用嗎?答案是肯定的。 最初當我向公司的前端同學「安利」容器技術的時候,很多人都會說:「容器?這不是用在后端的技術嗎?我不懂啊,而且前端開發用不上吧?!?showImg(https://segmentfau...
閱讀 3297·2021-09-02 15:41
閱讀 2836·2021-09-02 09:48
閱讀 1375·2019-08-29 13:27
閱讀 1164·2019-08-26 13:37
閱讀 840·2019-08-26 11:56
閱讀 2486·2019-08-26 10:24
閱讀 1649·2019-08-23 18:07
閱讀 2623·2019-08-23 15:16