跨境電商數(shù)據(jù)化運(yùn)營(yíng)的步驟之?dāng)?shù)據(jù)清洗
有過(guò)數(shù)據(jù)分析工作經(jīng)歷的運(yùn)營(yíng)者都知道,采集到的第一手?jǐn)?shù)據(jù)一般都是無(wú)法直接進(jìn)行分析的,這時(shí)候就需要對(duì)數(shù)據(jù)進(jìn)行“清洗”。
對(duì)于人工采集的數(shù)據(jù)一般不需要清洗,因?yàn)槿斯げ杉瘯r(shí)就會(huì)主觀上對(duì)數(shù)據(jù)做一個(gè)篩選,所以數(shù)據(jù)采集后可以直接進(jìn)行分析和判斷。
對(duì)于報(bào)表采集的數(shù)據(jù)需要結(jié)合特定的分析目的進(jìn)行清洗。
初始的訂單數(shù)據(jù)為“2019-03-29T16:34:49-07:00”的格式,而如果要做用戶畫(huà)像分析,運(yùn)營(yíng)者需要的是這段數(shù)據(jù)中的訂單小時(shí)時(shí)間即“16:34:49”中的“16”,那么就需要對(duì)這些數(shù)據(jù)做數(shù)據(jù)清洗的操作。
首先打開(kāi)“數(shù)據(jù)清洗”的Excel文件(如果圖表已經(jīng)完成數(shù)據(jù)清洗工作,讀者只需要將清洗內(nèi)容刪除再重新操作一遍即可)。
然后使用Excel軟件中自帶的“RIGHT”函數(shù),將“2019-03-29T16:34:49-07:00”數(shù)據(jù)中的“2019-03-29T”去除。
緊接著使用Excel軟件中自帶的“LEFT”函數(shù)將“16:34:49-07:00”中的“-07:00”去除。
最后再使用一次“LEFT”函數(shù)將“16:34:49”一類數(shù)據(jù)簡(jiǎn)化為“16”的小時(shí)數(shù)據(jù)。
除了對(duì)于時(shí)間數(shù)據(jù)的清洗外,運(yùn)營(yíng)者還可能涉及地理數(shù)據(jù)或者其他訂單數(shù)據(jù)的清洗,其處理方式和上文提及的操作大同小異。
自動(dòng)化抓取采集的數(shù)據(jù)需要結(jié)合相關(guān)編程語(yǔ)言進(jìn)行清洗,因此屬于IT領(lǐng)域的知識(shí),有興趣的賣(mài)家可以自行查閱相關(guān)資料進(jìn)行學(xué)習(xí)。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。