亞馬遜賣家如何對(duì)數(shù)據(jù)清洗
在第三方采集器完成抓取后,對(duì)原有數(shù)據(jù)進(jìn)行下載,得到表格,最終需要的數(shù)據(jù)是鏈接父ASIN、鏈接上架時(shí)間、大類目排名這3列數(shù)據(jù)。
此時(shí)需要提取字段6中的大類目排名,即#之后的內(nèi)容,可以使用 Excel的分列功能完成該操作。
首先將排名后的大類目替換為#,此處為服裝類目,即“in Clothing,Shoes &Jewelry”。
其次,選擇Excel中的數(shù)據(jù),單擊“分列”按鈕,選中“分隔符號(hào)”單選按鈕,單擊下一步按鈕。
在“文本分列向?qū)б坏?步,共3步”對(duì)話框中設(shè)置分隔符號(hào),勾選“其他”復(fù)選框,并輸入#,可以看到在數(shù)據(jù)預(yù)覽中,排名數(shù)據(jù)已經(jīng)被單獨(dú)分隔出來。
單擊“下一步”按鈕并完成分列,刪除其他列的數(shù)據(jù)即可。
此時(shí)仍有少數(shù)數(shù)據(jù)處于“Sports & Outdoors”戶外類目中未被分列,為確保數(shù)據(jù)對(duì)比的一致性,可刪除此類鏈接,或在新表格中進(jìn)行分析。
新建表格(對(duì)應(yīng)名為“A關(guān)鍵詞選品”的Excel表格,請(qǐng)根據(jù)學(xué)習(xí)需求下載查看),前三列分別登記抓取日期、ASIN、上架時(shí)間,第一行為抓取日期的鏈接排名。
將每天抓取到的數(shù)據(jù)對(duì)應(yīng)填入該表格中,即可整理出“tunic tops folwomen”關(guān)鍵詞搜索下多數(shù)產(chǎn)品的排名變化趨勢(shì)。
由于數(shù)據(jù)量可達(dá)到上萬條,普通手動(dòng)查找將十分煩瑣,因此可以使用vlookup函數(shù),將每天抓取的數(shù)據(jù)匹配至表格中。
具體操作如下:首先在對(duì)應(yīng)日期的單元格中輸入“=vlookup(”,Excel將提示4個(gè)參數(shù)。
第一個(gè)參數(shù)為要引用的數(shù)據(jù),此處可直接選中對(duì)應(yīng)的ASIN,也可輸入“B2”,并輸入“,”,注意,這是英文逗號(hào)而非中文輸入法的逗號(hào)。
第二個(gè)參數(shù)為查找的范圍,打開抓取到的數(shù)據(jù),選中ASIN和排名列,函數(shù)查找時(shí)將按照ASIN列進(jìn)行匹配。
第三個(gè)參數(shù)為查找數(shù)據(jù)的序號(hào),注意,這里的列數(shù)不是Bxcel默認(rèn)的列數(shù),而是查找范圍的第幾列。
此處排名是選中區(qū)域的第2列,故輸入“2”,最終查找時(shí)即可匹配到排名列數(shù)據(jù)。
第四個(gè)參數(shù)是選擇匹配類型,因?yàn)樾枰_查找排名,所以輸入“FALSE”或者“0”。
模糊查找輸入“TURE”或“1”。
最后補(bǔ)全右括號(hào)“)”,得到公式“=VLOOKUP(B2,部分抓取數(shù)據(jù)!E:F,2,0)”。
向下填充其他單元格,最終即可獲得表格。
1 鏈接排名存在周期性波動(dòng),周三周四高峰,周末低谷,與運(yùn)營經(jīng)驗(yàn)相符合。
2 即使是排名較前的鏈接,也不一定每天都出現(xiàn)在關(guān)鍵詞搜索排名下。
考慮到鏈接周期性變化以及數(shù)據(jù)抓取延遲的因素,可以以7天為周期,取2個(gè)周期內(nèi)的數(shù)據(jù)進(jìn)行對(duì)比分析,后期運(yùn)營者也可以選取多個(gè)周期進(jìn)行綜合對(duì)比。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。