分享一个python的解析html的库—-pyquery
pyquery: a jquery-like library for python
看第一句就知道,只要是会用jquery的用起它来就不会存在啥问题。
库地址
pyquery再来看下官方的例子
>>> from pyquery import PyQuery as pq>>> from lxml import etree>>> import urllib>>> d = pq("<html></html>")>>> d = pq(etree.fromstring("<html></html>"))>>> d = pq(url='http://google.com/')>>> d = pq(url='http://google.com/', opener=lambda url: urllib.urlopen(url).read())>>> d = pq(filename=path_to_html_file) >> d("#hello")[<p#hello.hello>]>>> p = d("#hello")>>> p.html()'Hello world !'>>> p.html("you know <a href='http://python.org/'>Python</a> rocks")[<p#hello.hello>]>>> p.html()u'you know <a href="http://python.org/">Python</a> rocks'>>> p.text()'you know Python rocks' >>> d('p:first')[<p#hello.hello>]
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。