柚子快報邀請碼778899分享:萬能爬蟲-爬取嗶哩嗶哩數(shù)據
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from time import sleep
service = Service('./chromedriver.exe')
browser = webdriver.Chrome(service=service)
#變量browser是瀏覽器
#框架(固定格式)
'''
關鍵詞:黑客,python,c++ 的視頻名稱和點贊數(shù)等信息
'''
url='https://search.bilibili.com/all?keyword=c%2B%2B&from_source=webtop_search&spm_id_from=333.1007&search_source=5'
browser.get(url) #browser.get(url) 用瀏覽器打開鏈接
browser.find_element(By.XPATH,'/html/body/div[3]/div/div[2]/div[1]/div[2]/div/nav/ul/li[2]/span/span[1]').click()
#代表查找結點
sleep(2) #暫停2s
for ix in range(1,3):
for i in range(1,4):
sleep(2)
xpath=f'/html/body/div[3]/div/div[2]/div[2]/div/div/div[1]/div[{i}]/div/div[2]/div/div/a/h3'
title=browser.find_element(By.XPATH,xpath).text
print(title)
browser.find_element(By.XPATH,xpath).click()
browser.switch_to.window(
browser.window_handles[1]
)
res=browser.find_element(By.XPATH,'/html/body/div[2]/div[2]/div[1]/div[3]/div[1]/div[1]/div[1]/div/span').text
print(res)
browser.close() #關閉當前選項卡
browser.switch_to.window(
browser.window_handles[0]
)
browser.find_element(By.XPATH,f'/html/body/div[3]/div/div[2]/div[2]/div/div/div[2]/div/div/button[{ix}]')
#/html/body/div[3]/div/div[2]/div[2]/div/div/div[2]/div/div/button[2]
#/html/body/div[3]/div/div[2]/div[2]/div/div/div[2]/div/div/button[8]
#browser.get('鏈接') #https://search.bilibili.com/video?keyword=c%2B%2B&from_source=webtop_search&spm_id_from=333.1007&search_source=5
'''
選項卡:0
程序選項卡還在0
切換選項卡到1
browser.current_window_handle 當前選項卡
browser.window_handles 所有選項卡
browser.switch_to.window()切換選項卡
'''
browser.quit() #關閉瀏覽器
柚子快報邀請碼778899分享:萬能爬蟲-爬取嗶哩嗶哩數(shù)據
相關鏈接
本文內容根據網絡資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉載請注明,如有侵權,聯(lián)系刪除。