這篇文章主要介紹了python分析網頁上所有超鏈接的方法,涉及Python使用urllib模塊操作頁面超鏈接的技巧,需要的朋友可以參考下
本文實例講述了python分析網頁上所有超鏈接的方法。分享給大家供大家參考。具體實現方法如下:
- import urllib, htmllib, formatter
- website = urllib.urlopen("http://yourweb.com")
- data = website.read()
- website.close()
- format = formatter.AbstractFormatter(formatter.NullWriter())
- ptext = htmllib.HTMLParser(format)
- ptext.feed(data)
- for link in ptext.anchorlist:
- print(link)
希望本文所述對大家的Python程序設計有所幫助。
新聞熱點
疑難解答