Python编程-urllib.parse的用法
urllib.parse 在爬虫开发过程中使用地频率非常高,这里总结了一些常用用法
urlparse(url解析)123456In [16]: from urllib.parse import urlparseIn [17]: u = urlparse(url)In [18]: uOut[18]: ParseResult(scheme='http', netloc='example.com', path='/cxs', params='', query='name=cxs', fragment='age')
补充一下 query 和 params 的区别:
query方式生成的url为 /xx?id=id,params方式生成的url为 xx/id
当path不为空时只能使用query方式
parse_qs(query解析)123456In [19]: from urllib.parse import parse_qsIn [20]: query= ...