| 導(dǎo)語(yǔ) 數(shù)據(jù)是資產(chǎn)的概念已經(jīng)成為行業(yè)共識(shí)。然而現(xiàn)實(shí)中,對(duì)數(shù)據(jù)資產(chǎn)的管理和應(yīng)用尚處于摸索階段,企業(yè)數(shù)據(jù)資產(chǎn)管理面臨價(jià)值評(píng)估難、數(shù)據(jù)標(biāo)準(zhǔn)混亂、數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)安全威脅等諸多挑戰(zhàn)。互娛從2013年開始啟動(dòng)此項(xiàng)工作,歷經(jīng)從數(shù)據(jù)管理到治理,再到資產(chǎn)化的轉(zhuǎn)變。自年初起,我們啟動(dòng)實(shí)施大數(shù)據(jù)資產(chǎn)管理體系的建設(shè),本文分享在此過(guò)程中的一些實(shí)踐經(jīng)驗(yàn)與思路。
數(shù)據(jù)是資產(chǎn)的概念已經(jīng)成為行業(yè)共識(shí)。然而現(xiàn)實(shí)中,對(duì)數(shù)據(jù)資產(chǎn)的管理和應(yīng)用尚處于摸索階段,企業(yè)數(shù)據(jù)資產(chǎn)管理面臨價(jià)值評(píng)估難、數(shù)據(jù)標(biāo)準(zhǔn)混亂、數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)安全威脅等諸多挑戰(zhàn)。互娛從2013年開始啟動(dòng)此項(xiàng)工作,歷經(jīng)從數(shù)據(jù)管理到治理,再到資產(chǎn)化的轉(zhuǎn)變。自年初起,我們啟動(dòng)實(shí)施大數(shù)據(jù)資產(chǎn)管理體系的建設(shè),本文分享在此過(guò)程中的一些實(shí)踐經(jīng)驗(yàn)與思路。
數(shù)據(jù)資產(chǎn)管理(DAM,Data Asset Management)是指規(guī)劃、控制和提供數(shù)據(jù)及信息資產(chǎn)的一組業(yè)務(wù)職能,包括開發(fā)、執(zhí)行和監(jiān)督有關(guān)數(shù)據(jù)的計(jì)劃、政策、方案、項(xiàng)目、流程、方法和程序,從而控制、保護(hù)、交付和提高數(shù)據(jù)資產(chǎn)的價(jià)值。--來(lái)源《數(shù)據(jù)資產(chǎn)管理實(shí)踐白皮書3.0》,即通過(guò)流程、制度、技術(shù)等手段,去提升數(shù)據(jù)升值能力,助力產(chǎn)品成功,最終提升企業(yè)的競(jìng)爭(zhēng)力。
數(shù)據(jù)資產(chǎn)管理的定位及架構(gòu)如上圖所示,其處于大數(shù)據(jù)平臺(tái)(中臺(tái))與數(shù)據(jù)應(yīng)用的中間層,連接著底層的大數(shù)據(jù)平臺(tái)(中臺(tái)),覆蓋數(shù)據(jù)全生命周期管理,同時(shí)為上層數(shù)據(jù)應(yīng)用提供高質(zhì)量數(shù)據(jù)的保障能力。
一、 騰訊游戲大數(shù)據(jù)運(yùn)營(yíng)概況
目前我們互娛增值服務(wù)部服務(wù)于50+款端游,40+款頁(yè)游,還有300+多款手游,每日數(shù)據(jù)量級(jí)為17000億條,每日數(shù)據(jù)增量約為260TB,總存儲(chǔ)是80PB的規(guī)模。技術(shù)棧是使用自研結(jié)合開源的混合模式,采用了TEG數(shù)平的TDW(騰訊大數(shù)據(jù)倉(cāng)庫(kù))來(lái)構(gòu)建離線數(shù)據(jù)的計(jì)算與存儲(chǔ),結(jié)合自研的高性能分布式計(jì)算Bitmap技術(shù)實(shí)現(xiàn)多維、下鉆分析。
對(duì)于具體的數(shù)據(jù)服務(wù)場(chǎng)景,相信大家對(duì)上圖這些界面不會(huì)感到陌生。圖中只是我們數(shù)據(jù)增值服務(wù)的部分呈現(xiàn),包括玩家在游戲里面的歷程、對(duì)戰(zhàn)的戰(zhàn)績(jī)信息、個(gè)人中心、社區(qū)交友、任務(wù)系統(tǒng)等服務(wù)。其中,任務(wù)系統(tǒng)是基于我們實(shí)時(shí)能力構(gòu)建起來(lái)的一個(gè)數(shù)據(jù)應(yīng)用。
除此之外,我們還面向IEG內(nèi)部的游戲AI、游戲反外掛系統(tǒng)、鐵算盤、游戲助手、渠道管理等提供數(shù)據(jù)服務(wù)。
二、騰訊游戲數(shù)據(jù)資產(chǎn)管理體系介紹
騰訊游戲數(shù)據(jù)資產(chǎn)管理體系如上圖所示自下而上主要分為元數(shù)據(jù)管理、資產(chǎn)管理四大核心組成、資產(chǎn)管理平臺(tái)以及數(shù)據(jù)增值服務(wù)等四個(gè)層次。
最底層是元數(shù)據(jù)管理。元數(shù)據(jù)在整個(gè)資產(chǎn)管理體系中是最核心的一個(gè)部件。我們會(huì)定制實(shí)現(xiàn)整個(gè)元數(shù)據(jù)的標(biāo)準(zhǔn)化,存儲(chǔ)的數(shù)據(jù)包含業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù),提供元數(shù)據(jù)的檢索、開放等能力。
往上一層便是資產(chǎn)管理四大核心部分:
1、價(jià)值評(píng)估,我們定義出用于評(píng)估整個(gè)數(shù)據(jù)價(jià)值的評(píng)估模型以及數(shù)據(jù)度量報(bào)告,我們認(rèn)為這是資產(chǎn)管理中最核心的一個(gè)點(diǎn),可以協(xié)助決策者清楚了解數(shù)據(jù)的價(jià)值在哪里,到底有多大。
2、數(shù)據(jù)運(yùn)營(yíng),其覆蓋了整個(gè)數(shù)據(jù)生命周期管理,包含數(shù)據(jù)的安全、質(zhì)量、成本等部分,我們也采用了DevOps和AIOps這些業(yè)界先進(jìn)理念貫穿整個(gè)數(shù)據(jù)運(yùn)營(yíng)過(guò)程,參與這個(gè)職能的角色我們也叫DataOps。
3、數(shù)據(jù)治理,此概念更多強(qiáng)調(diào)的是數(shù)據(jù)標(biāo)準(zhǔn)化、制度、流程等這一系列的內(nèi)容。這里不詳細(xì)展開。
4、數(shù)據(jù)集成,從數(shù)據(jù)的采集、傳輸、整合、到落地存儲(chǔ),通過(guò)標(biāo)準(zhǔn)化去統(tǒng)一不同類型、格式的數(shù)據(jù)源,按指定規(guī)范去實(shí)施轉(zhuǎn)換,并最終落地至統(tǒng)一的大數(shù)據(jù)倉(cāng)庫(kù),且訪問(wèn)數(shù)據(jù)采用統(tǒng)一標(biāo)準(zhǔn),這里采用的是TDW提供的方案。
最上層為資產(chǎn)平臺(tái)能力。研發(fā)的思路遵循《數(shù)據(jù)資產(chǎn)管理實(shí)踐白皮書3.0》,并結(jié)合我們的服務(wù)場(chǎng)景,提供多樣及個(gè)性化的數(shù)據(jù)資產(chǎn)管理服務(wù)。最頂層則為我們提供的數(shù)據(jù)增值服務(wù),比如我們提供數(shù)據(jù)可視化與分析、營(yíng)銷活動(dòng)的支持、消息推送、渠道管理等一系列服務(wù)。以上便是我們數(shù)據(jù)資產(chǎn)管理的技術(shù)體系架構(gòu)。
針對(duì)如何去評(píng)判我們整個(gè)資產(chǎn)管理建設(shè)的能力水平這個(gè)問(wèn)題,我們總結(jié)出“三好”能力模型。首先是“用好”數(shù)據(jù)資產(chǎn),二是“管好”數(shù)據(jù)資產(chǎn),三是“看好”數(shù)據(jù)資產(chǎn)。
其中“看好” 資產(chǎn)屬于數(shù)據(jù)安全的范疇。數(shù)據(jù)是企業(yè)里面的核心資產(chǎn),也涉及了數(shù)據(jù)泄露與用戶隱私等問(wèn)題,一旦發(fā)生數(shù)據(jù)安全事件,對(duì)公司的損失是巨大的,甚至是災(zāi)難性的,所以我們認(rèn)為“看好” 資產(chǎn)是重中之重。踐行“三好”能力模型的過(guò)程中,我們會(huì)根據(jù)不同的角色去定義并提供相應(yīng)的服務(wù)能力,我們內(nèi)部資產(chǎn)管理平臺(tái)研發(fā)與設(shè)計(jì)也是基于此評(píng)估模型。
三、騰訊游戲元數(shù)據(jù)管理介紹
元數(shù)據(jù)管理在整個(gè)數(shù)據(jù)資產(chǎn)管理中占有舉足輕重的地位,接下來(lái)介紹我們是如何對(duì)其進(jìn)行設(shè)計(jì)和構(gòu)建的。首先它要具備以下幾個(gè)能力特點(diǎn):
1、數(shù)據(jù)的異構(gòu)適配和集中存儲(chǔ)。隨著公司歷經(jīng)不同的發(fā)展階段,必然會(huì)出現(xiàn)多種多樣的技術(shù)棧,則不可避免的產(chǎn)生各式各樣的數(shù)據(jù)類型,比如說(shuō)關(guān)系型、NoSQL類型,還有一些文本的,一些業(yè)務(wù)接口、業(yè)務(wù)系統(tǒng)等。怎樣去采集并且適配如此之多的數(shù)據(jù)類型,怎樣去描述和定義數(shù)據(jù),其難度是非常大的,因此我們定義了一個(gè)適配層,此做法和業(yè)界主流方案有些類似。具體我們構(gòu)建了一個(gè)模型橋接器來(lái)實(shí)現(xiàn)智能轉(zhuǎn)換,去適配異構(gòu)和集中存儲(chǔ)。
2、元數(shù)據(jù)到底存儲(chǔ)了什么數(shù)據(jù)?舉個(gè)例子,游戲行業(yè)是有很多指標(biāo)去衡量它的運(yùn)營(yíng)狀態(tài)。比如說(shuō)7日留存率,意思是說(shuō)這個(gè)玩家注冊(cè)當(dāng)天往后去推移7天有沒(méi)有流失,有些業(yè)務(wù)平臺(tái)是按注冊(cè)后第二天才開始計(jì)算,這樣同一個(gè)指標(biāo)大家就理解不一樣,自然導(dǎo)致計(jì)算結(jié)果不一致。所以我們將游戲內(nèi)部累計(jì)兩、三千個(gè)業(yè)務(wù)指標(biāo),連同它的計(jì)算邏輯等描述都存儲(chǔ)到元數(shù)據(jù)里面去,然后再開放給所有的業(yè)務(wù)平臺(tái)。比如DataMore(智能游戲運(yùn)營(yíng)方案)、圖靈(數(shù)據(jù)挖掘分析平臺(tái)),一體化(游戲指標(biāo)開發(fā)平臺(tái))等內(nèi)部平臺(tái),大家都采用一套標(biāo)準(zhǔn),包括指標(biāo)名稱及計(jì)算邏輯,這樣便可有效避免數(shù)據(jù)不一致的情況。
3、描述數(shù)據(jù),其為元數(shù)據(jù)的本質(zhì),在元數(shù)據(jù)管理中發(fā)揮核心作用。我們會(huì)定義數(shù)據(jù)的來(lái)源,包括責(zé)任人,創(chuàng)建與更新時(shí)間,分區(qū)號(hào)及數(shù)據(jù)字典等一系列的描述信息,以及表與表之間的關(guān)系等。通過(guò)數(shù)據(jù)描述模型,數(shù)據(jù)使用者可以看到整個(gè)數(shù)據(jù)的全景以及數(shù)據(jù)的描述信息,可大大降低其使用數(shù)據(jù)的成本,最大化利用數(shù)據(jù)的能力,協(xié)助產(chǎn)品做精細(xì)化的運(yùn)營(yíng),更好地完成運(yùn)營(yíng)KPI。
4、自動(dòng)構(gòu)建血緣關(guān)系鏈,這是一個(gè)非常重要的考核指標(biāo),后面會(huì)詳細(xì)講解。
5、擴(kuò)展能力,輔助運(yùn)營(yíng)。元數(shù)據(jù)不僅包括業(yè)務(wù)的元數(shù)據(jù),還包括技術(shù)的元數(shù)據(jù)、運(yùn)維日常工作過(guò)程當(dāng)產(chǎn)生的告警指標(biāo)及閥值,甚至是AIOps模型的算法等,都會(huì)統(tǒng)統(tǒng)存儲(chǔ)至元數(shù)據(jù)中,以輔助我們做好運(yùn)營(yíng),提供運(yùn)營(yíng)策略支持。
以上是我們?cè)獢?shù)據(jù)構(gòu)建的一些特點(diǎn)。
以上是某游戲元數(shù)據(jù)管理功能截圖,包含一個(gè)數(shù)據(jù)全景及數(shù)據(jù)屬性描述的功能,可以清晰看到數(shù)據(jù)責(zé)任人歸屬、創(chuàng)建時(shí)間、最后變更時(shí)間,它的表結(jié)構(gòu)、字段、信息等信息,這些信息對(duì)數(shù)據(jù)的使用者而言都是非常有用的。
四、 騰訊游戲數(shù)據(jù)質(zhì)量管理介紹
下面介紹我們構(gòu)建數(shù)據(jù)質(zhì)量體系的過(guò)程。不合格、不具備交付價(jià)值的數(shù)據(jù)則為垃圾數(shù)據(jù),所以數(shù)據(jù)質(zhì)量的保障是一個(gè)核心點(diǎn)。數(shù)據(jù)質(zhì)量體系的構(gòu)建分為以下四個(gè)步驟:
第一,定義數(shù)據(jù)的標(biāo)準(zhǔn),包括它的格式、類型以及上報(bào)模式等均需統(tǒng)一標(biāo)準(zhǔn)化。我們內(nèi)部通過(guò)制定好的標(biāo)準(zhǔn)去約束,比如定義一張數(shù)據(jù)表的描述,包含數(shù)據(jù)類型,表名稱,字段類型與長(zhǎng)度等,研發(fā)人員則根據(jù)此格式打日志,標(biāo)準(zhǔn)貫穿采集、傳輸、轉(zhuǎn)換、存儲(chǔ)全鏈路。
第二,定義質(zhì)量規(guī)則。此部分同業(yè)界一致,我們也采用完整性、一致性、準(zhǔn)確性及延時(shí)性等監(jiān)控維度。具體介紹如下:
1、“完整性”,比較好理解,即數(shù)據(jù)不能缺失,不能出現(xiàn)“采集一萬(wàn)落地八千”的不合格情況,此指標(biāo)我們采用數(shù)據(jù)對(duì)賬的方式去做數(shù)據(jù)驗(yàn)證。
2、“一致性”,相當(dāng)于數(shù)據(jù)定義的標(biāo)準(zhǔn)化,意思是怎么讓內(nèi)部所有人按照指定規(guī)則去理解數(shù)據(jù),且涵蓋各個(gè)技術(shù)平臺(tái)、業(yè)務(wù)線系統(tǒng)。比如我們定義一個(gè)ipv4的IP地址是15位,定義手機(jī)號(hào)碼為13位的或者國(guó)內(nèi)的郵編地址為6位,這個(gè)理解上大家肯定是統(tǒng)一的,我們也會(huì)將這個(gè)標(biāo)準(zhǔn)存儲(chǔ)到元數(shù)據(jù)里面去,各業(yè)務(wù)平臺(tái)一起去遵循這個(gè)標(biāo)準(zhǔn)。最終達(dá)成一致性。
3、“準(zhǔn)確性”,數(shù)據(jù)中避免出現(xiàn)亂碼或者不是預(yù)設(shè)類型的值。
4、“及時(shí)性”,從數(shù)據(jù)的采集到數(shù)據(jù)應(yīng)用,它的時(shí)效性是否滿足業(yè)務(wù)的需求,比如正常打完一個(gè)對(duì)局時(shí)會(huì)收到系統(tǒng)推送的一條消息,內(nèi)容可能是一個(gè)道具或一個(gè)金幣,這個(gè)及時(shí)性要求是非常高的,絕不允許出現(xiàn)對(duì)局完成后兩個(gè)小時(shí)再把金幣推送出去,這就沒(méi)有意義了。這是一項(xiàng)非常重要的數(shù)據(jù)質(zhì)量考核指標(biāo),對(duì)應(yīng)用層面的影響也是非常敏感的。
第三,質(zhì)量監(jiān)控。定義完這些規(guī)則和標(biāo)準(zhǔn)后,接下來(lái)便是質(zhì)量監(jiān)控,包括對(duì)帳、心跳、內(nèi)容檢查還有延遲告警等相應(yīng)的保障。
第四,質(zhì)量報(bào)告。我們會(huì)給產(chǎn)品側(cè)輸出整體數(shù)據(jù)質(zhì)量的趨勢(shì)報(bào)告,包括同比、環(huán)比及各個(gè)質(zhì)量維度的達(dá)標(biāo)率情況等,目前數(shù)據(jù)交付的質(zhì)量都維持在三個(gè)九。
總結(jié)來(lái)說(shuō)就是通過(guò)業(yè)務(wù)+流程+技術(shù)的手段來(lái)實(shí)現(xiàn)數(shù)據(jù)質(zhì)量的總體保障。
五、大數(shù)據(jù)資產(chǎn)管理之影響評(píng)估&快速定位
上圖為一個(gè)非常典型的數(shù)據(jù)實(shí)時(shí)微服務(wù)的架構(gòu),從開始的采集到傳輸,再到離線的計(jì)算和存儲(chǔ),還有一條實(shí)時(shí)分支做數(shù)據(jù)的轉(zhuǎn)發(fā)、透?jìng)鳌?huì)涉及到消息隊(duì)列以及流式計(jì)算,然后將數(shù)據(jù)的結(jié)果寫到Tredis(NoSQL)中。寫到NoSQL中的數(shù)據(jù),來(lái)源可能是實(shí)時(shí)計(jì)算或者離線計(jì)算任務(wù)。研發(fā)人員會(huì)根據(jù)業(yè)務(wù)規(guī)則開發(fā)接口邏輯,調(diào)用數(shù)據(jù)存儲(chǔ)層,接下來(lái)研發(fā)會(huì)將接口交付至運(yùn)維人員,進(jìn)入完整的DevOps全鏈路,最終完成整個(gè)數(shù)據(jù)+業(yè)務(wù)邏輯的發(fā)布。整個(gè)應(yīng)用過(guò)程會(huì)遇到幾點(diǎn)問(wèn)題:
第一點(diǎn)是整個(gè)數(shù)據(jù)服務(wù)涉及到的環(huán)節(jié)眾多,只要其中一個(gè)環(huán)節(jié)出問(wèn)題,故障的定位就非常困難。
第二點(diǎn)是業(yè)務(wù)層的數(shù)據(jù)異常回溯,難度更大。比如一個(gè)玩家看到戰(zhàn)報(bào)數(shù)據(jù),正常的話應(yīng)該是20級(jí),結(jié)果顯示8級(jí),如何快速確認(rèn)數(shù)據(jù)從哪算的,經(jīng)過(guò)哪個(gè)環(huán)節(jié),屬于哪個(gè)業(yè)務(wù)邏輯、哪個(gè)項(xiàng)目、哪個(gè)邏輯指標(biāo)以及哪個(gè)計(jì)算服務(wù)集群等。
第三點(diǎn)就是底層數(shù)據(jù)平臺(tái)故障,如何快速評(píng)估影響面。比如當(dāng)離線計(jì)算平臺(tái)其中一個(gè)集群掛了,如何確認(rèn)影響哪個(gè)項(xiàng)目、哪個(gè)接口、哪些指標(biāo)、哪些功能,也無(wú)從去判斷跟定位。這里給出的解決方案是通過(guò)“數(shù)據(jù)”加“業(yè)務(wù)”的血緣組合來(lái)解決。
見(jiàn)上圖,我們的血緣數(shù)據(jù)貫穿從數(shù)據(jù)采集開始到最終的數(shù)據(jù)服務(wù)整個(gè)鏈路。首先將采集的粒度細(xì)到IP、端口與進(jìn)程,業(yè)務(wù)表ID、計(jì)算的任務(wù)ID、透?jìng)鞯谋鞩D、計(jì)算業(yè)務(wù)指標(biāo)以及Tredis里面的Key前綴,最終交付給接口的業(yè)務(wù)ID以及集群的ID,均上報(bào)至血緣數(shù)據(jù)庫(kù)。此時(shí)整個(gè)解決問(wèn)題思路清晰可見(jiàn),無(wú)論從上往下還是從下至上,均可輕易地實(shí)現(xiàn)問(wèn)題的快速定位以及影響面的快速評(píng)估。
上圖為平臺(tái)截圖,是一張普通業(yè)務(wù)的血緣關(guān)系圖。從關(guān)系圖中我們可以快速了解數(shù)據(jù)從采集到應(yīng)用中的全部處理過(guò)程,知道其部署資源信息、接口信息以及指標(biāo)信息等。具備這些能力之后,則可運(yùn)用其有效輔助運(yùn)營(yíng)。如,當(dāng)一個(gè)計(jì)算任務(wù)出庫(kù)出現(xiàn)延遲,運(yùn)維人員通過(guò)血緣監(jiān)控可快速知悉此延遲可能會(huì)影響的項(xiàng)目、接口以及相應(yīng)具體指標(biāo),且可快速啟動(dòng)故障預(yù)案,如跟產(chǎn)品溝通,采取掛公告或補(bǔ)償性的動(dòng)作等預(yù)案策略。
六、大數(shù)據(jù)資產(chǎn)之生命周期管理
下面探討如何去做數(shù)據(jù)的生命周期管理,首先給出一個(gè)結(jié)論:數(shù)據(jù)生命周期管理的策略與數(shù)據(jù)的在線度有關(guān)。
數(shù)據(jù)在線度即為數(shù)據(jù)的活躍度,其隨時(shí)間推移,數(shù)據(jù)使用價(jià)值的降低不斷衰減,用于數(shù)據(jù)的在線程度和使用衰減情況。數(shù)據(jù)在線度主要受兩個(gè)方面因素影響:
第一, 其跟定義數(shù)據(jù)的重要級(jí)別有關(guān)系,我們共定義了“收入類”、“流水類”、“在線類”、“行為類”和“性能類”等。其中,“收入類”和“流水類”的重要級(jí)別比較高,故而打上四星或者五星的標(biāo)簽。相應(yīng)的,“行為類”或運(yùn)維監(jiān)控日志,重要級(jí)別則相對(duì)沒(méi)有那么高,為其打上一星或兩星的標(biāo)簽。數(shù)據(jù)的重要級(jí)別由運(yùn)營(yíng)人員根據(jù)運(yùn)營(yíng)經(jīng)驗(yàn)定義。
第二,數(shù)據(jù)的價(jià)值,主要參考數(shù)據(jù)的熱度和數(shù)據(jù)的廣度。
數(shù)據(jù)在線度的關(guān)聯(lián)函數(shù)我們定義為:
其中V(t)為數(shù)據(jù)訪問(wèn)熱度,W(t)為應(yīng)用廣度, I為數(shù)據(jù)重要等級(jí)。
七、數(shù)據(jù)價(jià)值評(píng)估思路“三度”模型
接下來(lái)介紹我們做資產(chǎn)價(jià)值評(píng)估的過(guò)程和方案。我們從三年前嘗試做這個(gè)事情,經(jīng)歷了兩個(gè)階段,第一階段是數(shù)據(jù)的成熟期,第二是研究的觀察期,目前處于灰度放量階段。
在數(shù)據(jù)價(jià)值評(píng)估具體實(shí)施方面,我們提出了從“熱度”、“廣度”、“收益度”等三個(gè)維度,按照價(jià)值指標(biāo)、評(píng)估模型、價(jià)值表現(xiàn)等三大評(píng)價(jià)流程進(jìn)行價(jià)值評(píng)估的架構(gòu)思路。
其中,關(guān)于數(shù)據(jù)的“熱度”,我們內(nèi)部有一個(gè)共識(shí),就是“只有當(dāng)數(shù)據(jù)被使用了才有可能產(chǎn)生價(jià)值”,當(dāng)然這是一個(gè)很籠統(tǒng)的說(shuō)法。第二就是“廣度”,舉個(gè)例子,比如我們?cè)趪?guó)際某個(gè)機(jī)構(gòu)去發(fā)布一個(gè)專利,結(jié)果發(fā)現(xiàn)谷歌也引用了、亞馬遜也引用了,F(xiàn)acebook和其他國(guó)內(nèi)的公司也引用了,我們就認(rèn)為這個(gè)專利是有價(jià)值的,這個(gè)理論相信不少人會(huì)認(rèn)同,同樣我們?cè)趦?nèi)部也是采用這樣的思路,“廣度”依賴的是我們的數(shù)據(jù)應(yīng)用及功能模塊,只要跟數(shù)據(jù)耦合程度越高,我們就認(rèn)為它的廣度就越大。第三就是“收益度”,即數(shù)據(jù)干預(yù)之后帶來(lái)多大的收益,比如帶來(lái)多少活躍用戶、UV、PV、流水等,這些數(shù)據(jù)直接上報(bào)給平臺(tái),通過(guò)平臺(tái)去做模型評(píng)估,加上每個(gè)價(jià)值點(diǎn)權(quán)重去計(jì)算。這里我們通過(guò)A/B Test方案去做整個(gè)模型的訓(xùn)練。
做資產(chǎn)管理價(jià)值評(píng)估需經(jīng)過(guò)三個(gè)階段,第一是做指標(biāo)的采集,第二階段是做評(píng)估模型的定制,最后一個(gè)階段就是價(jià)值的表現(xiàn)。我們會(huì)在平臺(tái)上看它的整個(gè)分?jǐn)?shù)區(qū)間分布。下圖為某個(gè)業(yè)務(wù)的熱度跟廣度表現(xiàn)趨勢(shì)的情況。
最后總結(jié)一下做數(shù)據(jù)資產(chǎn)評(píng)估的意義。
數(shù)據(jù)資產(chǎn)評(píng)估是衡量投入產(chǎn)出比的重要依據(jù)。通常我們希望 “價(jià)值產(chǎn)出”能做到無(wú)限放大,同時(shí)我們又希望成本能越小越好、甚至沒(méi)有。成本核算的方法主流有“成本法”和“價(jià)值法”。其中,“成本法”是以數(shù)據(jù)成本來(lái)結(jié)算數(shù)據(jù)服務(wù),“價(jià)值法”則認(rèn)為數(shù)據(jù)服務(wù)的結(jié)算定價(jià)應(yīng)該跟成本無(wú)關(guān),跟價(jià)值有關(guān)。具體選擇因場(chǎng)景而定。如我們服務(wù)的是IEG內(nèi)部用戶,數(shù)據(jù)服務(wù)結(jié)算的方式采用的是“成本法”,我們的目標(biāo)是要助力產(chǎn)品成功,應(yīng)盡可能幫助業(yè)務(wù)減少成本與支出,這樣的方式可以很好提升產(chǎn)品的競(jìng)爭(zhēng)力。對(duì)于面向toB、toC或toG的業(yè)務(wù)場(chǎng)景,這時(shí)候用價(jià)值法也是合理的,因?yàn)檫@樣的機(jī)制有益于企業(yè)利益的最大化。
掃一掃在手機(jī)上閱讀本文章