愛奇藝效果廣告的個(gè)性化探索與實(shí)踐
掃描二維碼
隨時(shí)隨地手機(jī)看文章

導(dǎo)讀:隨著大數(shù)據(jù)和人工智能的技術(shù)進(jìn)步,數(shù)字營(yíng)銷行業(yè)也在不斷變化。得益于雄厚技術(shù)實(shí)力,愛奇藝效果廣告得到蓬勃發(fā)展,實(shí)現(xiàn)了海量觸達(dá)、定向精準(zhǔn)、效果顯著的廣告投放,為廣告主提供跨平臺(tái)、多終端的網(wǎng)絡(luò)推廣服務(wù)。本次我將分享愛奇藝效果廣告?zhèn)€性化方面的思考與實(shí)踐,聚焦廣告排序算法,希望能為大家?guī)硪恍﹩l(fā)。
包括以下三部分:
愛奇藝效果廣告算法 - 背景&架構(gòu)
點(diǎn)擊&轉(zhuǎn)化率預(yù)估 - 核心問題
智能出價(jià) - 博弈&共贏
▌愛奇藝效果廣告算法-背景&架構(gòu)
1. 廣告資源位
如上圖所示,愛奇藝主要的資源位可以用雙引擎來概括,即信息流和框內(nèi):
信息流:信息流廣告位由準(zhǔn)信息流和純信息流共同構(gòu)成的。其中,打開 App 顯示的推薦頁,由于是非原生信息,但是以信息流形式推送,所以我們稱之為準(zhǔn)信息流廣告位。同時(shí),愛奇藝平臺(tái)提供了很多原生頻道,比如熱點(diǎn)頻道,在這些頻道下插入的廣告稱為純信息流。
框內(nèi):對(duì)于框內(nèi)資源,效果廣告主要投放在框內(nèi)中插的位置上,同時(shí)也會(huì)做一些前貼和后貼的框內(nèi)廣告投放。
其他:除上述兩大引擎,還有猜你喜歡和視頻關(guān)聯(lián)位等資源位。
2. 計(jì)費(fèi)方式
oCPX ( optimized CPX ) 業(yè)務(wù)是 oCPC ( optimized Cost Per Click ) 和 oCPM ( optimized Cost Per Mille ) 兩種計(jì)費(fèi)方式的統(tǒng)稱,是從 CPX 業(yè)務(wù)演進(jìn)而來,這里的 CPX 代表的是以點(diǎn)擊計(jì)費(fèi)和真實(shí)觀看計(jì)費(fèi)。
CPX 時(shí)代廣告主投放廣告是以點(diǎn)擊作為計(jì)費(fèi)方式,但廣告主的真實(shí)訴求是點(diǎn)擊后的轉(zhuǎn)化行為。例如上圖,一個(gè) App 的廣告,用戶點(diǎn)擊后的下載、安裝、付費(fèi),這些轉(zhuǎn)化行為才是廣告主真正關(guān)注的。廣告主為了提升從點(diǎn)擊到轉(zhuǎn)化的概率,會(huì)做很多離線優(yōu)化,例如定向20-30歲女性或定向喜歡《親愛的熱愛的》電視劇的用戶。但這樣做可能會(huì)產(chǎn)生很多問題,比如定向粒度過細(xì),目標(biāo)人群少,導(dǎo)致廣告放量效果不佳。
為解決上述問題,oCPX 的業(yè)務(wù)誕生了,優(yōu)化目標(biāo)從點(diǎn)擊變成了后續(xù)的轉(zhuǎn)化行為,廣告主只需在投放廣告時(shí)設(shè)置轉(zhuǎn)化目標(biāo)以及這個(gè)目標(biāo)下的出價(jià),其他的事情由算法模型來解決。
3. 算法難點(diǎn)
oCPX 業(yè)務(wù)對(duì)算法挑戰(zhàn)難題主要為上圖三點(diǎn):
轉(zhuǎn)化樣本非常高維稀疏,樣本維度高且正樣本量極少。
oCPX 業(yè)務(wù)復(fù)雜,比如需要支持安裝轉(zhuǎn)化、付費(fèi)轉(zhuǎn)化、關(guān)注公眾號(hào)轉(zhuǎn)化等類型。
平臺(tái)流量大,對(duì)計(jì)算規(guī)模時(shí)效要求高。
4. 個(gè)性化廣告推薦流程
召回:對(duì)候選廣告進(jìn)行召回,比如人群定向等。
粗排:使用輕量級(jí)但保證精度的模型對(duì)廣告做初選,避免精排階段服務(wù)壓力過大。粗排階段還有冷啟動(dòng)和隨機(jī)探索等功能模塊,主要用于解決 E&E 問題,避免馬太效應(yīng) ( 投放好廣告越來越好,差的越來越差 )
精排:使用高精度模型對(duì)點(diǎn)擊率、轉(zhuǎn)化率和智能出價(jià)進(jìn)行預(yù)估。另外精排階段還支持預(yù)算平滑功能。還有預(yù)算平攤到全時(shí)段等。
5. 排序邏輯
粗、精排的排序邏輯依照 eCPM ( effective Cost Per Mille ),也就是千次展示平臺(tái)的預(yù)期收益來排序,其計(jì)算公式如上圖所示,eCPM=點(diǎn)擊率×轉(zhuǎn)化率×出價(jià)×智能出價(jià)因子。
6. 線上訓(xùn)練推理流程
如上圖自下而上:
1. 現(xiàn)場(chǎng)特征,相較離線特征,現(xiàn)場(chǎng)特征能真實(shí)還原線上環(huán)境。
2. 第二步進(jìn)入模型訓(xùn)練,會(huì)有 FM 分天模型、FM 在線學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。
3. 完成模型離線訓(xùn)練后推送至線上,結(jié)合離線、實(shí)時(shí)特征進(jìn)行在線推理。
▌點(diǎn)擊&轉(zhuǎn)化率預(yù)估-核心問題
1. 特征工程
從周期來劃分特征可分為實(shí)時(shí)、短期和長(zhǎng)期。
實(shí)時(shí)特征主要考慮場(chǎng)景特征,即上下文特征,比如用戶在看到廣告之前看了哪些視頻;時(shí)間信息也是非常重要的實(shí)時(shí)特征,比如周末和工作日分時(shí)段的點(diǎn)擊轉(zhuǎn)化率表現(xiàn)就有很大差異;此外還有反饋特征,包括正反饋及負(fù)反饋,主要針對(duì)用戶看過哪些行業(yè)的廣告及后續(xù)轉(zhuǎn)化行為。
短期特征包含用戶觀影興趣、搜索行為、社交行為和商業(yè)興趣等。其中短期觀影興趣可能會(huì)發(fā)生變化,比如上圖,如果有位女性用戶懷孕了,她的觀影興趣可能會(huì)從長(zhǎng)期的仙俠類視頻短期切換到母嬰類視頻。
長(zhǎng)期特征有人口基礎(chǔ)屬性(性別年齡等)、觀影興趣、商業(yè)興趣、廣告基礎(chǔ)屬性(所處行業(yè)等)和素材質(zhì)量等。這里的觀影興趣,依然舉上圖例子,這位女性用戶可能喜歡參與仙俠類的討論,喜歡出現(xiàn)在仙俠劇中的偶像等等,所以針對(duì)這位用戶打得長(zhǎng)期觀影興趣的標(biāo)簽是仙俠。
2. 在線學(xué)習(xí)
天下武功唯快不破,時(shí)效性對(duì)模型來說是非常重要的。當(dāng)前線上使用的基于 FTRL 的 FM 模型,實(shí)時(shí)消費(fèi)線上 Kafka 流的數(shù)據(jù),分鐘級(jí)進(jìn)行模型更新。由于線上模型是分鐘級(jí)更新,線上要有一套監(jiān)控體系,一旦線上指標(biāo)出現(xiàn)異動(dòng),比如上圖舉例的 AUC 低于離線分天訓(xùn)練的備用的模型,會(huì)進(jìn)行線上模型與備用離線模型自動(dòng)切換。
3. 深度學(xué)習(xí)
為了提高模型準(zhǔn)確率和泛化能力,上線了深度學(xué)習(xí),當(dāng)前采用的是 Wide&Deep 的模型,并進(jìn)行了離線模型調(diào)優(yōu)和線上性能優(yōu)化,以滿足廣告場(chǎng)景下對(duì)高 QPS 以及高穩(wěn)定性需求。
4. 高維稀疏
在轉(zhuǎn)化率預(yù)估場(chǎng)景下,會(huì)遇到數(shù)據(jù)高維稀疏問題。舉個(gè)例子,在做偏差校準(zhǔn)的時(shí)候,會(huì)出現(xiàn)很多分桶里面一個(gè)正樣本都沒有,進(jìn)而導(dǎo)致這些分桶最終的預(yù)估轉(zhuǎn)化率結(jié)果為零。為解決這個(gè)問題,采用的方法是動(dòng)態(tài)分桶大小,根據(jù)當(dāng)前廣告下歷史正樣本數(shù)量,動(dòng)態(tài)決定分桶寬度以及分布。
同時(shí),轉(zhuǎn)化率預(yù)估場(chǎng)景有滯后性問題,例如以 APP 作為推廣目標(biāo)的廣告主設(shè)置轉(zhuǎn)化目標(biāo)為付費(fèi),但從用戶點(diǎn)擊廣告到最終付費(fèi)可能會(huì)經(jīng)歷很長(zhǎng)的時(shí)間。傳統(tǒng)的做法是設(shè)立時(shí)間窗口對(duì)這條樣本進(jìn)行跟蹤,窗口內(nèi)完成轉(zhuǎn)化目標(biāo)即打上正樣本標(biāo)簽,反之則當(dāng)作負(fù)樣本看待,但很明顯這么做有很多問題。為解決這個(gè)問題采用了一種替代方案,當(dāng)點(diǎn)擊產(chǎn)生時(shí),我們將樣本當(dāng)作負(fù)樣本來看,當(dāng)轉(zhuǎn)化行為完成后,這個(gè)樣本就視為正樣本,當(dāng)然這里會(huì)進(jìn)行適當(dāng)?shù)臋?quán)重調(diào)整。
此外,還有轉(zhuǎn)化率階躍的問題,即轉(zhuǎn)化數(shù)據(jù)集中到來,正樣本突然增多,轉(zhuǎn)化率預(yù)估可能從萬分之幾直接到百分之幾。這樣就會(huì)造成轉(zhuǎn)化數(shù)據(jù)到來前廣告放量不足,到來后爆量問題。為了解決這個(gè)問題引入非目標(biāo)的轉(zhuǎn)化數(shù)據(jù)作為正樣本使用,比如轉(zhuǎn)化目標(biāo)是付費(fèi),我們可以引入下載、激活等也作為加權(quán)降權(quán)后的正樣本來消費(fèi)。
▌智能出價(jià)-博弈&共贏
1. 成本控制
智能出價(jià)的基本功能是進(jìn)行成本控制,保證廣告的實(shí)際成本在目標(biāo)成本附近。并在此基礎(chǔ)上盡可能多拓量。所以這里存在成本和放量的博弈。所使用的方法是在 eCPM 上乘一個(gè)智能出價(jià)因子,這個(gè)因子是實(shí)際成本與目標(biāo)成本的函數(shù)輸出,比如上圖實(shí)際成本大于目標(biāo)成本時(shí),因子小于1,用更廉價(jià)的流量來拉低成本,反之大于1,提高競(jìng)爭(zhēng)能力獲取更多流量。
2. 流量?jī)?yōu)選
上面介紹了基礎(chǔ)版本的智能出價(jià)方案,但這樣會(huì)產(chǎn)生一些問題,比如放量過程中的訂單,可能以高價(jià)格獲得了低質(zhì)的流量而導(dǎo)致效果不佳,反之可能錯(cuò)過高質(zhì)量流量。解決方法是做流量粒度下的智能出價(jià) ,即考慮成本的同時(shí)也考慮流量質(zhì)量,就是上圖g函數(shù),考慮成本參數(shù)的同時(shí)也加入流量質(zhì)量參數(shù)。
特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長(zhǎng)按關(guān)注一下:
長(zhǎng)按訂閱更多精彩▼
如有收獲,點(diǎn)個(gè)在看,誠摯感謝
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!