身思乐,人事爱,稳恒不言败!

python 几种网页解析器

正则表达式——字符串形式的模糊匹配
html.parser——结构化解析
Beautiful Soup——结构化解析
lxml——结构化解析

python的网页解析器:正则表达式(文档复杂,比较复杂)、HTML.parser、Beautiful Soup(第三方插件)可使用parser和lxml作为解析器、lxml(第三方插件)
正则表达式是模糊匹配,其他三种是结构化解析
结构化解析:DOM(Document Object Model)树