摘要:賽題鏈接面向電信行業(yè)存量用戶(hù)的智能套餐個(gè)性化匹配模型賽題任務(wù)利用已有的用戶(hù)屬性如個(gè)人基本信息用戶(hù)畫(huà)像信息等終端屬性如終端品牌等業(yè)務(wù)屬性消費(fèi)習(xí)慣及偏好匹配用戶(hù)最合適的套餐,對(duì)用戶(hù)進(jìn)行推送,完成后續(xù)個(gè)性化服務(wù)。四個(gè)月的費(fèi)用分別進(jìn)行。
1、賽題鏈接:面向電信行業(yè)存量用戶(hù)的智能套餐個(gè)性化匹配模型
2、賽題任務(wù): 利用已有的用戶(hù)屬性(如個(gè)人基本信息、用戶(hù)畫(huà)像信息等)、終端屬性(如終端品牌等)、業(yè)務(wù)屬性、消費(fèi)習(xí)慣及偏好匹配用戶(hù)最合適的套餐,對(duì)用戶(hù)進(jìn)行推送,完成后續(xù)個(gè)性化服務(wù)。
3、數(shù)據(jù)解讀及預(yù)處理:
多分類(lèi)任務(wù)-->11分類(lèi);根據(jù)service_type來(lái)劃分套餐 ,一類(lèi)8個(gè),另外一類(lèi)3個(gè)(下文圖片里面的大寶卡以及騰訊王卡系列)。
11個(gè)套餐表所對(duì)應(yīng)的卡,通過(guò)對(duì)1_total_fee進(jìn)行value_counts和網(wǎng)上套餐比較可以大致推出來(lái)。
數(shù)據(jù)預(yù)處理---->清洗數(shù)據(jù)以及對(duì)1234_total_fee進(jìn)行類(lèi)似3sigma的進(jìn)行標(biāo)記。
4、特征工程:
對(duì)1-2-3-4_total_fee進(jìn)行min ,max ,std ,mean等操作;最后發(fā)現(xiàn)四個(gè)月話費(fèi)的最小值是比較強(qiáng)的特征,從EDA來(lái)看對(duì)套餐區(qū)分是比較明顯的。
本月流量以及上個(gè)月流量的差值特征;并且發(fā)現(xiàn)某些用戶(hù)上個(gè)月的流量是一個(gè)完整的數(shù)值,比方說(shuō)1024,2048,3072這種數(shù)值,對(duì)這種用戶(hù)進(jìn)行了簡(jiǎn)單的標(biāo)記。
用當(dāng)月費(fèi)用減去超出通話時(shí)長(zhǎng)的錢(qián)。1_total_fee - (service1_caller_time)*0.15
計(jì)算每個(gè)用戶(hù)的基本費(fèi)用(base_fee)
判斷四個(gè)月的話費(fèi)是否是一個(gè)整數(shù)。比方說(shuō)套餐36的用戶(hù)如果賬單里面出現(xiàn)了36和36.0的話,那么后者36.0可能是其他base_fee通過(guò)開(kāi)加油包等超出套餐費(fèi)用疊加上來(lái)的。
四個(gè)月的費(fèi)用分別groupby("complaint_fee")進(jìn)行count。
5、搭建模型:
模型: 十折的lightgbm模型 + 五折的xgboost模型
xgboost實(shí)在是太慢了,沒(méi)有GPU加成的話貌似要跑差不多一個(gè)白天,但是用上GPU精度就降低了。
6、模型融合: 通過(guò)林有夕大神分享的投票代碼進(jìn)行融合,有一點(diǎn)收益但是不大。
7、處理:
我們隊(duì)伍是失敗了,大概思路就是對(duì)模型分不開(kāi)的兩個(gè)套餐加一個(gè)權(quán)重。決賽隊(duì)伍應(yīng)該都是有分享的。
還有就是植物之前ijcai2018所用過(guò)的"食之無(wú)味,棄之可惜",惜的是我們也失敗了。
最后附上我們隊(duì)的github鏈接(記得點(diǎn)個(gè)星星哦~)
開(kāi)源代碼地址:2018_CCF_BDCI_ChinaUnicom_Package_Match_Rank6
這個(gè)比賽第一名,第二名,第四名貌似都有開(kāi)源,還有砍手豪大佬對(duì)植物嫁接的進(jìn)一步深入在知乎上都有文章,可以進(jìn)行參考。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/43538.html
摘要:目前資訊播報(bào)時(shí)區(qū)限行歷史上的今天單位換算油價(jià)日歷等技能天貓精靈上線技能觸發(fā)率,準(zhǔn)確率即對(duì)話管理,是對(duì)話系統(tǒng)的關(guān)鍵部分,負(fù)責(zé)維護(hù)對(duì)話上下文,管理對(duì)話流程,保持對(duì)話過(guò)程的流暢。 術(shù)語(yǔ)對(duì)齊 TaskBot引擎: 核心處理對(duì)象是技能,我們把技能定義成結(jié)構(gòu)化(query+content)、垂直場(chǎng)景化的任務(wù),比如實(shí)時(shí)場(chǎng)景查詢(xún)、工具類(lèi)、控制類(lèi)等QABot引擎: 包括KG-QA引擎、QAPair引擎、...
摘要:目前資訊播報(bào)時(shí)區(qū)限行歷史上的今天單位換算油價(jià)日歷等技能天貓精靈上線技能觸發(fā)率,準(zhǔn)確率即對(duì)話管理,是對(duì)話系統(tǒng)的關(guān)鍵部分,負(fù)責(zé)維護(hù)對(duì)話上下文,管理對(duì)話流程,保持對(duì)話過(guò)程的流暢。 術(shù)語(yǔ)對(duì)齊 TaskBot引擎: 核心處理對(duì)象是技能,我們把技能定義成結(jié)構(gòu)化(query+content)、垂直場(chǎng)景化的任務(wù),比如實(shí)時(shí)場(chǎng)景查詢(xún)、工具類(lèi)、控制類(lèi)等QABot引擎: 包括KG-QA引擎、QAPair引擎、...
摘要:中金易云出版發(fā)行大數(shù)據(jù)平臺(tái)正是以數(shù)字化轉(zhuǎn)型為核心思路,以大數(shù)據(jù)中臺(tái)與智能算法為基礎(chǔ)的出版業(yè)供給側(cè)結(jié)構(gòu)性改革的成果。 摘要: 以供給側(cè)結(jié)構(gòu)性改革的角度來(lái)看,出版社即是最直接的供給側(cè),出版高質(zhì)量、暢銷(xiāo)度高的圖書(shū),建立出產(chǎn)高質(zhì)量圖書(shū)及圖書(shū)IP的體系,即是提高供給體系質(zhì)量。中金易云出版發(fā)行大數(shù)據(jù)平臺(tái)正是以數(shù)字化轉(zhuǎn)型為核心思路,以大數(shù)據(jù)中臺(tái)與智能算法為基礎(chǔ)的出版業(yè)供給側(cè)結(jié)構(gòu)性改革的成果。 201...
摘要:對(duì)于這類(lèi)企業(yè)來(lái)說(shuō),邊緣計(jì)算是從云計(jì)算中心層層向外推出去的,成長(zhǎng)路徑是自頂向下,由內(nèi)而外。這是云計(jì)算公司力推邊緣計(jì)算的商業(yè)邏輯。相對(duì)于其他玩家,電信運(yùn)營(yíng)商擁有的資源優(yōu)勢(shì)和基礎(chǔ)布局,在邊緣計(jì)算的競(jìng)爭(zhēng)中贏在了起跑線上。前一篇文章(漫談邊緣計(jì)算(一):邊緣計(jì)算是大勢(shì)所趨)提到我對(duì)邊緣計(jì)算的理解,認(rèn)為邊緣計(jì)算是在一定程度上彌補(bǔ)傳統(tǒng)云計(jì)算的不足,相對(duì)于傳統(tǒng)的全集中模式的云計(jì)算中心,邊緣計(jì)算節(jié)點(diǎn)可以在現(xiàn)場(chǎng)...
閱讀 2149·2021-11-23 10:13
閱讀 2853·2021-11-09 09:47
閱讀 2803·2021-09-22 15:08
閱讀 3391·2021-09-03 10:46
閱讀 2291·2019-08-30 15:54
閱讀 988·2019-08-28 18:09
閱讀 2489·2019-08-26 18:26
閱讀 2396·2019-08-26 13:48