用戶畫像從0到100的構(gòu)建思路
掃描二維碼
隨時隨地手機看文章

導(dǎo)讀:用戶畫像作為當(dāng)下描述分析用戶、運營營銷的重要工具,被全部互聯(lián)網(wǎng)人熟知,用戶畫像的定義并不復(fù)雜,是系統(tǒng)通過用戶自行上傳或埋點上報收集記錄了用戶大量信息,為便于各業(yè)務(wù)應(yīng)用,將這些信息進行沉淀、加工和抽象,形成一個以用戶標(biāo)志為主key的標(biāo)簽樹,用于全面刻畫用戶的屬性和行為信息,這就是用戶畫像。
畫像這種結(jié)構(gòu)化的用戶信息加工方式,極大程度上做到了完整、全面且直觀地刻畫用戶。畫像是用戶在產(chǎn)品的檔案,便于人工使用、機器輸入和算法理解。簡而言之:畫像是由標(biāo)簽樹及末級標(biāo)簽的標(biāo)簽值構(gòu)成的,全面定量刻畫用戶的結(jié)構(gòu)化信息產(chǎn)品。畫像是標(biāo)簽的總成,用戶標(biāo)簽是具體刻畫用戶的結(jié)構(gòu)化信息,以下簡稱標(biāo)簽。
本文將介紹用戶畫像的構(gòu)建思路,在畫像構(gòu)建的過程中,我們把工作分為兩步:
第一步:介紹從0到1的構(gòu)建思路。
第二步:介紹從1到100的構(gòu)建思路。
1. 畫像從0到1的構(gòu)建思路
一個比較成熟的畫像系統(tǒng),會有成千上百的標(biāo)簽,這些標(biāo)簽的生產(chǎn)不是一次完成的,而是隨著業(yè)務(wù)的發(fā)展需要,逐步補充完善,最終呈現(xiàn)在大家眼前的就是一棵龐大的標(biāo)簽樹。
跟自然界的樹木一樣,要想長得茁壯參天,必須有一個穩(wěn)定的根基和合理的結(jié)構(gòu),用戶畫像的構(gòu)建也是一樣的,前期最重要的仍然是搭好畫像骨架,確保后續(xù)的發(fā)展過程中,依然保持清晰的結(jié)構(gòu)和高延展性。相反的,如果一開始為了搶時間,將大量標(biāo)簽無序的堆在線上,后期管理和使用的難度會迅速凸顯出來,重構(gòu)的代價巨大。
上面說到,一個好的標(biāo)簽樹結(jié)構(gòu)要滿足兩個條件,“高概括性”和“強延展性”,高概括性意味著結(jié)構(gòu)體系能夠很好的包含一個用戶的基本屬性和產(chǎn)品交互的相關(guān)行為,同時對于業(yè)務(wù)重點單獨強調(diào),沒有遺漏;“強延展性”意味著結(jié)構(gòu)全面的同時也有一定的抽象概括能力,保證新增的標(biāo)簽可以很好的找到對應(yīng)的分類,整個體系不會過于收斂局限。
按照這個原則,畫像通常從八個維度組織標(biāo)簽,分別為:基本屬性、平臺屬性、行為屬性、產(chǎn)品偏好、興趣偏好、敏感度、消費屬性、用戶生命周期及用戶價值。
下圖所示為用戶整體架構(gòu)示例:

① 基本屬性
基本屬性是指一個用戶的基本社會屬性和變更頻率低的平臺特征,例如真實社會年齡、性別、婚姻狀況、昵稱、號碼、賬號、lbs等標(biāo)簽。這些標(biāo)簽類型多為直采型,可從用戶基本信息表中直接獲取,不需要統(tǒng)計或者算法挖掘。
示例:社會性別_女
② 平臺屬性
平臺屬性是用戶在平臺上表現(xiàn)出的基本屬性特征,是利用用戶行為進行算法挖掘,標(biāo)識用戶真實屬性的標(biāo)簽。
最典型的平臺屬性標(biāo)簽例如平臺年齡標(biāo)簽,這里就有一個疑問,為什么在用戶的基礎(chǔ)屬性中已經(jīng)有年齡標(biāo)簽,但在平臺屬性中重復(fù)又有一個呢,這里就涉及兩者之間的差別。設(shè)想一個真實的場景:一個用戶社會身份為20歲,但他喜歡中年人的穿衣風(fēng)格,在使用app購物的時候,表現(xiàn)出的真實偏好為30-40歲,對于這樣使用產(chǎn)品時表現(xiàn)出的用戶心智和真實年齡不相符合的用戶,如果只采用上傳的基本屬性,給他推薦年輕人喜歡的物品,是不是很難命中個體用戶的興趣呢?
兩種不同的標(biāo)簽,本質(zhì)上是用戶自己上傳信息的隨意性和挖掘信息的權(quán)威性差異,是用戶社會屬性和真實屬性差異。
我們仔細(xì)分析一下兩者在數(shù)據(jù)源、計算邏輯、標(biāo)簽格式、標(biāo)簽值和應(yīng)用場景的差異,如下:
數(shù)據(jù)源與計算邏輯:基礎(chǔ)屬性是利用用戶自行上傳的存儲在用戶基礎(chǔ)信息表里的數(shù)據(jù),平臺屬性則利用客戶端或者服務(wù)端埋點上報采集的用戶行為數(shù)據(jù)進行挖掘計算生成。基本屬性是典型的直采型標(biāo)簽,平臺屬性是典型的算法挖掘型標(biāo)簽。
末級標(biāo)簽和輸出標(biāo)簽值:以性別為例,基本屬性代表用戶真實的社會身份,是確定的事實,所以典型標(biāo)簽形式為“性別_女”,而平臺屬性則代表用戶在性別維度的偏好概率,所以典型形式為“性別_女_0.80”其中‘女’為末級標(biāo)簽,0.80則代表用戶在平臺的女性身份上表現(xiàn)出的傾向程度。
應(yīng)用場景:平臺屬性通過用戶行為進行挖掘,更能代表用戶的真實傾向,輸出結(jié)果比基本屬性準(zhǔn)確率高,在定向營銷和算法里,年齡、性別等通常采用平臺屬性。而社會屬性中電話、身份證、賬號、昵稱等使用較多。
③ 行為屬性
行為屬性記錄的是用戶的全部單點行為,用戶的單點行為包括啟動、登錄、瀏覽、點擊、加車、下單等非常多,而且跟不同的產(chǎn)品,不同的模塊交互,不同的時間窗選取,行為就更加復(fù)雜了,如何能夠全面的梳理,可以按照“產(chǎn)品*功能模塊*用戶單點行為*時間”四大要素來組織。
這里的“產(chǎn)品*功能模塊*用戶單點行為*時間”意思是一個完整的行為應(yīng)該包含“哪個產(chǎn)品”“哪個功能模塊”“哪個行為”“哪些時間要求”幾要素,例如某瀏覽器體育頻道距今最近一次訪問時間。按照這幾要素組織行為,不容易發(fā)生遺漏。
示例:產(chǎn)品初次登錄時間,最后一次啟動距今時間,30天內(nèi)搜索行為頻次,一個月內(nèi)閃屏訪問次數(shù)等。
④ 產(chǎn)品偏好
產(chǎn)品偏好是對用戶使用某些產(chǎn)品、產(chǎn)品核心功能或者其他渠道的偏好程度的刻畫,屬于挖掘型標(biāo)簽,其中產(chǎn)品的選取可以包括自家產(chǎn)品、競品;功能和渠道包括站內(nèi)產(chǎn)品功能,也包括push、短信、開屏、彈窗等幾大運營和產(chǎn)品法寶。
示例:搜索模塊偏好、直接競品_京東偏好、短信偏好。
⑤ 興趣偏好
興趣偏好是用戶畫像內(nèi)非常重要的維度,以電商產(chǎn)品為例,用戶對商品的喜愛程度是用戶最終的信息之一,興趣偏好就是對用戶和物品之間的關(guān)系進行深度刻畫的重要標(biāo)簽,其中最典型的要屬品牌偏好、類目偏好和標(biāo)簽偏好。
示例:品牌偏好_優(yōu)衣庫_0.91類目偏好_美妝_0.80、標(biāo)簽偏好_紅色_0.70?!?/span>
⑥ 敏感度
在營銷活動時,我們留意到有些用戶不需要優(yōu)惠也會下單,而有些用戶一定要通過優(yōu)惠券刺激才會轉(zhuǎn)化,優(yōu)惠券的額度也影響了用戶下單的金額,這種情況下,如何識別對優(yōu)惠敏感的用戶發(fā)放合理的券額的優(yōu)惠券,保證優(yōu)惠券不浪費,去報促銷活動的ROI最大,其中一個很重要的標(biāo)簽就是用戶的敏感度標(biāo)簽,敏感度代表用戶對平臺活動或者優(yōu)惠的敏感程度,也是典型的挖掘類標(biāo)簽。
示例:熱點敏感度、折扣敏感度。
⑦ 消費屬性
無論是電商、內(nèi)容或者其他領(lǐng)域,公司的目標(biāo)最終都是收益,所以消費屬性往往作為一個單獨的維度重點刻畫。消費屬性包括統(tǒng)計型標(biāo)簽——消費頻次、消費金額、最近一次消費時間等,也包括挖掘型標(biāo)簽——消費能力和消費意愿,同時包含敏感度標(biāo)簽——優(yōu)惠促銷敏感度、活動敏感度、新品敏感度、爆款敏感度等。
⑧ 用戶生命周期及用戶價值
用戶生命周期是用戶運營的重要法典,一個用戶從進入產(chǎn)品到離開,通常會經(jīng)歷“新手”“成長”“成熟”“衰退”“流失”5個典型階段,每個階段對用戶運營存在策略差異,畫像在其中的作用是明確標(biāo)記用戶所處生命周期的階段,便于后續(xù)業(yè)務(wù)同學(xué)落地。
用戶價值是體現(xiàn)用戶為產(chǎn)品貢獻(xiàn)價值高低的標(biāo)簽,最經(jīng)典的是RFM模型獲得交易維度標(biāo)簽,與此同時,也應(yīng)該看到用戶的其它價值,例如為產(chǎn)品貢獻(xiàn)活躍度,通過裂變拉來新用戶,這些都可設(shè)計相應(yīng)的標(biāo)簽。
示例:新手、成長、成熟、衰退、流失、高價值用戶、VIP等級等。
2. 畫像從1到100的構(gòu)建思路
在前面一節(jié),我們討論了一個用戶畫像的基礎(chǔ)框架應(yīng)該如何搭建,這一節(jié)討論一下,有了基礎(chǔ)框架,到底應(yīng)該如何著手一步一步完善畫像標(biāo)簽樹,如何從一個基于業(yè)務(wù)的需求落地為標(biāo)簽的設(shè)計,如何將標(biāo)簽應(yīng)用到具體的業(yè)務(wù)中。
要解決“如何做”“如何用”兩大問題,要從這個問題的根本入手思考,也就是我們?yōu)槭裁匆鲇脩舢嬒瘢脩舢嬒竦淖饔檬鞘裁?,了解了這個問題,便能水到渠成的根據(jù)用途合理的設(shè)計方案。
用戶畫像的主要目的有三個,具體如下:
第一用于用戶信息的統(tǒng)計,建立對產(chǎn)品對用戶的基本認(rèn)知;第二用于用戶定向營銷,利用人群圈選投放物料;第三用于算法,沉淀用戶特征,供模型使用。所以標(biāo)簽的完善也可以按照這三個維度不斷豐富,以下分別舉例說明標(biāo)簽建設(shè)的思路。
① 用于統(tǒng)計,對產(chǎn)品對用戶的基本認(rèn)知
每個產(chǎn)品功能策略完善,都需要建立在對產(chǎn)品對用戶的充分認(rèn)知基礎(chǔ)上,也就是說,用戶是誰,有何特點,基本情況如何,這些是用戶畫像需要回答的重要問題。
思路拆解:既然要了解用戶的基礎(chǔ)信息,就需要將用戶基本屬性進行拆解:年齡、性別、居住城市(幾線)、家庭結(jié)構(gòu)(婚否、孩否)等。為了盈利考慮,還需要了解基本的收入水平、消費能力等。將拆解的維度抽象,構(gòu)建對應(yīng)標(biāo)簽,然后進行分布統(tǒng)計,便能生成一份基本的用戶認(rèn)知報告。
標(biāo)簽結(jié)果:年齡、性別等。
② 用于定向營銷和精細(xì)化運營
運營同學(xué)作為畫像的重要業(yè)務(wù)使用方,每天都會通過標(biāo)簽圈選人群,做定向的用戶、活動、內(nèi)容精細(xì)化運營,以及各app每天都在進行的促銷活動。這些運營和活動的場景分布在產(chǎn)品的各個渠道和各個資源位,對場景和人群的驚喜程度要求都很高。
我們舉例一個日常工作中最常見的需求:通過一次數(shù)據(jù)分析發(fā)現(xiàn),產(chǎn)品的流失用戶占比提升,通過討論,大家認(rèn)為通過一次結(jié)合利益點的push推送,召回流失用戶,是有效且快速的手段,同時push作為各個業(yè)務(wù)都在爭取的有限資源,希望可以提高使用效率,確保push這個資源渠道的整體ROI,以上需求希望畫像可以支持。
思路拆解:從這個需求背景中,我們做一次關(guān)鍵詞提取,不難發(fā)現(xiàn),關(guān)鍵詞如下是“流失用戶”、“利益點”、“push”“效率”。其中流失用戶是用戶身分識別,利益點是用戶優(yōu)惠敏感度,push是產(chǎn)品渠道資源,效率意味著要盡可能的確保全選人群精準(zhǔn),不能為了覆蓋率犧牲準(zhǔn)確率。
思路拆解完畢,具體落地就變得簡單多了,參考步驟如下:
第一步:需要流失用戶的口徑和標(biāo)簽,這里需要用到用戶生命周期的劃分,從中識別并標(biāo)識出流失用戶。
第二步:分析對流失用戶拉回效果最好的利益點,例如優(yōu)惠券、折扣、禮品或者是其他內(nèi)容。這一步需要運營和數(shù)據(jù)同學(xué)根據(jù)日常經(jīng)驗和數(shù)據(jù)分析獲得,對于畫像的要求是基于分析結(jié)論,挖掘不同用戶對于優(yōu)惠折扣的敏感程度,這一部分在標(biāo)簽架構(gòu)敏感度部分有論述,最終目的是確保每一分錢都能花在刀刃上。
第三步:確定拉回的明確目標(biāo),是拉回規(guī)模還是準(zhǔn)確率,通過需求分析可以確定,本次拉回在資源有限的情況下,需要提升人群識別的準(zhǔn)確率,畫像實現(xiàn)準(zhǔn)確率的方法有兩條路徑,一是提升畫像算法的準(zhǔn)確率,這部分主要依賴算法本身,無法一蹴而就,所以這里選擇的方法是增加人群全選的條件,可就是新增標(biāo)簽,供圈選求交
根據(jù)背景分析,我們可以增加流失用戶關(guān)于push渠道的打開意愿的標(biāo)簽,提高push資源的使用效率。
經(jīng)過上述分析,需要生產(chǎn)的標(biāo)簽如下:
用戶生命周期_流失。
用戶折扣優(yōu)惠敏感度。
push使用標(biāo)簽:這里可用統(tǒng)計型標(biāo)簽,例如push最近一次訪問時間,在使用時設(shè)置條件為“最近3天,最近7天”;也可用綜合的算法挖掘型標(biāo)簽,即push渠道偏好。
通過以上需求分析和思路拆解,畫像的建設(shè)過程應(yīng)該比較明確,這里再留一個思考的case,可以嘗試如何分析如何落地:平臺新上一款商品,初期需要在某模塊展示給目標(biāo)用戶做推廣,同時盡量不打擾其他非目標(biāo)用戶,不降低該資源位的整體轉(zhuǎn)化效率。
思路拆解提示:商品的目標(biāo)用戶——商品可以按照哪些維度拆分關(guān)鍵信息?模塊位置——用戶的模塊功能使用偏好是什么?準(zhǔn)確率的要求——如何提升畫像應(yīng)用的準(zhǔn)確率?
回答好以上問題,這個需求的標(biāo)簽便能順利獲得。
③ 用于算法,主要應(yīng)用于搜索推薦、風(fēng)控廣告等策略方向,標(biāo)簽可以直接作為用戶特征使用
標(biāo)簽除了用于基本的用戶群體描述,定向營銷和精細(xì)化運營,還有一個相對來說新穎又廣泛的用途,用于各算法的各個環(huán)節(jié),在召回和排序兩大經(jīng)典策略流程中,都可以用到用戶畫像,這里我們舉例畫像在推薦系統(tǒng)的召回層應(yīng)用案例。
需求背景:推薦系統(tǒng)的本質(zhì)是從海量信息中計算用戶最感興趣的部分,對應(yīng)推薦系統(tǒng)的“召回-粗排-精排”,是一個“層層精選”的過程。其中召回層是精選的第一道流程,為后續(xù)計算打分準(zhǔn)備初步的興趣候選集,這里候選集的生成方法之一就是用戶畫像法。仍然以電商業(yè)務(wù)為例,講述如何用用戶畫像做興趣召回。
思路拆解:召回的作用是粗篩,幫助推薦系統(tǒng)計算第一道用戶興趣池,這里用戶對物品的興趣興趣可拆解為對商品品牌、類目和商品標(biāo)簽的興趣,這部分就已經(jīng)轉(zhuǎn)化為上述文章中的已知內(nèi)容,用戶標(biāo)簽中是有品牌偏好標(biāo)簽、類目偏好標(biāo)簽和標(biāo)簽偏好標(biāo)簽的,只需要在所有品牌、類目、標(biāo)簽下維護一個按照商品質(zhì)量或者熱度倒敘的列表,這樣只要獲取到用戶標(biāo)識,邊能從用戶畫像中獲取偏好的品牌、類目和標(biāo)簽,再從品牌、類目和標(biāo)簽下的商品列表中召回相應(yīng)的商品,根據(jù)候選集大小的設(shè)計,做top k截斷召回。這部分商品完成了初步的召回,為進入下一個流程進行粗排和精排做準(zhǔn)備。
以上章節(jié),選自:《數(shù)據(jù)產(chǎn)品經(jīng)理:實戰(zhàn)進階》
特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:
長按訂閱更多精彩▼
如有收獲,點個在看,誠摯感謝
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!