亞馬遜運營之數(shù)據(jù)“清洗”
有數(shù)據(jù)分析經(jīng)驗的運營者都知道,獲取的第一手數(shù)據(jù)一般是無法直接進行分析的,這時就需要對數(shù)據(jù)進行“清洗”。
人工采集的數(shù)據(jù)一般不需要“清洗”,因為運營者在人工采集時會對數(shù)據(jù)做一個篩選,數(shù)據(jù)采集結束以后可以直接對獲取的數(shù)據(jù)進行分析和判斷。
運營者需要結合特定的分析目的對報表采集的數(shù)據(jù)進行“清洗”。
例如,在運營者進行用戶購物習慣分析時,最關鍵的數(shù)據(jù)就是訂單報表中的訂單時間數(shù)據(jù)。
初始的訂單數(shù)據(jù)為“2019-03-29T16:34:49-07:00”T之前的數(shù)據(jù)是日期, T之后的數(shù)據(jù)是下單時間。
如果要做用戶畫像分析,運營者需要的是數(shù)據(jù)中的訂單小時時間即“16:34:49”中的“16”那么就需要對這些數(shù)據(jù)進行“清洗”。
我們首先打開電子文檔中的“4.2.3數(shù)據(jù)清洗”Excel文件,然后使用Excel軟件中自帶的“MID”函數(shù)在“2019-03-29T16:34:49-07:00”數(shù)據(jù)中從第12位起取2個數(shù)字,就是最終需要的時間“16”。
已經(jīng)完成了數(shù)據(jù)“清洗”工作,讀者只需要將“清洗”內(nèi)容刪除再重新操作一遍即可。
除了對時間數(shù)據(jù)進行“清洗”,運營者還可能對地理數(shù)據(jù)或其他訂單數(shù)據(jù)進行“清洗”其處理方式和時間數(shù)據(jù)處理方式大同小異。
本文內(nèi)容根據(jù)網(wǎng)絡資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權,聯(lián)系刪除。