摘要:但是在使用過程中發(fā)現(xiàn)一個(gè)問題,竟然無法像一樣很方便的去篩選節(jié)點(diǎn)。經(jīng)過一番排查發(fā)現(xiàn)對(duì)于類名,依然可以方便的獲取節(jié)點(diǎn),但是當(dāng)使用如,,等原生標(biāo)簽時(shí),無論如何都獲取不到節(jié)點(diǎn)。
前言
作為一位正經(jīng)的前端開發(fā)人員,在學(xué)習(xí)python的過程中,自然而然選擇了pyquery這款解析器,畢竟和前端的jquery一樣省去了很多學(xué)習(xí)的時(shí)間。
但是在使用過程中發(fā)現(xiàn)一個(gè)問題,pyquery竟然無法像jquery一樣很方便的去篩選dom節(jié)點(diǎn)。
經(jīng)過一番排查發(fā)現(xiàn):對(duì)于class類名,pyquery依然可以方便的獲取節(jié)點(diǎn),但是當(dāng)使用如:a,div,img...等原生標(biāo)簽時(shí),無論如何都獲取不到節(jié)點(diǎn)。
一度讓我很奔潰...
其實(shí)問題就出在xmlns="http://www.w3.org/1999/xhtml"這里,pyquery默認(rèn)解析后的文檔是xmlns格式,而這種格式就是造成無法獲取原生標(biāo)簽的原因。
doc = pq(browser.page_source,parser="html")
解決方法就是在解析時(shí)配置parser="html",問題迎刃而解。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/42534.html
摘要:如果傳遞的參數(shù)是,將遞歸復(fù)制當(dāng)前節(jié)點(diǎn)的所有子孫節(jié)點(diǎn)。的話只復(fù)制當(dāng)前節(jié)點(diǎn)。設(shè)置內(nèi)容時(shí),能將里面的標(biāo)簽渲染成正常的標(biāo)簽。 DOM由節(jié)點(diǎn)組成 在 HTML DOM (文檔對(duì)象模型)中,每個(gè)部分都是節(jié)點(diǎn):文檔本身是文檔節(jié)點(diǎn)所有 HTML 元素是元素節(jié)點(diǎn)所有 HTML 屬性是屬性節(jié)點(diǎn)HTML 元素內(nèi)的文本是文本節(jié)點(diǎn)注釋是注釋節(jié)點(diǎn) 1.重要節(jié)點(diǎn)類型:標(biāo)簽(元素)節(jié)點(diǎn),屬性節(jié)點(diǎn),文本節(jié)點(diǎn)。 2.重要...
摘要:如果傳遞的參數(shù)是,將遞歸復(fù)制當(dāng)前節(jié)點(diǎn)的所有子孫節(jié)點(diǎn)。的話只復(fù)制當(dāng)前節(jié)點(diǎn)。設(shè)置內(nèi)容時(shí),能將里面的標(biāo)簽渲染成正常的標(biāo)簽。 DOM由節(jié)點(diǎn)組成 在 HTML DOM (文檔對(duì)象模型)中,每個(gè)部分都是節(jié)點(diǎn):文檔本身是文檔節(jié)點(diǎn)所有 HTML 元素是元素節(jié)點(diǎn)所有 HTML 屬性是屬性節(jié)點(diǎn)HTML 元素內(nèi)的文本是文本節(jié)點(diǎn)注釋是注釋節(jié)點(diǎn) 1.重要節(jié)點(diǎn)類型:標(biāo)簽(元素)節(jié)點(diǎn),屬性節(jié)點(diǎn),文本節(jié)點(diǎn)。 2.重要...
摘要:前端知識(shí)點(diǎn)總結(jié)什么是什么是專門操作網(wǎng)頁內(nèi)容的標(biāo)準(zhǔn)為什么統(tǒng)一不同瀏覽器操作網(wǎng)頁內(nèi)容的標(biāo)準(zhǔn)優(yōu)點(diǎn)幾乎所有瀏覽器兼容什么是網(wǎng)頁中所有內(nèi)容在內(nèi)存中都是保存在一棵樹形結(jié)構(gòu)中網(wǎng)頁中每項(xiàng)內(nèi)容元素文本屬性注釋,都是樹上的一個(gè)節(jié)點(diǎn)對(duì)象。 前端知識(shí)點(diǎn)總結(jié)——DOM 1.什么是DOM: Document Object Model 什么是: 專門操作網(wǎng)頁內(nèi)容的API標(biāo)準(zhǔn)——w3c 為什么: 統(tǒng)一不同瀏覽器操作網(wǎng)...
摘要:父節(jié)點(diǎn)我們可以用方法來獲取某個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn),我們用一個(gè)實(shí)例來感受一下運(yùn)行結(jié)果在這里我們首先用選取了為的節(jié)點(diǎn),然后調(diào)用了方法,得到其父節(jié)點(diǎn),類型依然是類型。 上一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---29、解析庫的使用:BeautifulSoup下一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---31、數(shù)據(jù)存儲(chǔ):文件存儲(chǔ) 在上一節(jié)我們介紹了 BeautifulSoup 的使用,它是一個(gè)非常強(qiáng)...
摘要:在瀏覽器中,對(duì)象是繼承自類型的一個(gè)實(shí)例,表示整個(gè)頁面。一致性檢測(cè)屬性提供相應(yīng)信息和功能的對(duì)象,與瀏覽器對(duì)的實(shí)現(xiàn)直接對(duì)應(yīng)。在中,標(biāo)簽名始終都以全部大寫表示而在有時(shí)包括,標(biāo)簽名始終與源代碼中的保持一致。設(shè)置的特性名統(tǒng)一轉(zhuǎn)為小寫。 簡(jiǎn)介 DOM描述了一個(gè)層次化的節(jié)點(diǎn)樹,允許開發(fā)人員添加、移除和修改頁面。 節(jié)點(diǎn) 根據(jù) W3C 的 HTML DOM 標(biāo)準(zhǔn),HTML 文檔中的所有內(nèi)容都是節(jié)點(diǎn): ...
閱讀 3461·2023-04-25 19:39
閱讀 3814·2021-11-18 13:12
閱讀 3641·2021-09-22 15:45
閱讀 2439·2021-09-22 15:32
閱讀 724·2021-09-04 16:40
閱讀 3734·2019-08-30 14:11
閱讀 1892·2019-08-30 13:46
閱讀 1569·2019-08-29 15:43