Python爬虫中的中文网址转译

2024-10-22 03:20:49

、Python不支持中文, 它是解释性语言;解析器只支持 ascii 0 - 127爬取带有中文的网址, 会报错UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-11: ordinal not in range(128)

工具/原料

python3.x

报错信息

1、执行代码

Python爬虫中的中文网址转译

3、网址里面包含了汉字ascii是没有汉字的需要进行url转译将包含汉字的网址进行转译

urllib.parse, string

1、在python3中, 用到2个转译模块: urllib.parse, string珑廛躬儆导入新的模块, 然后对网址进行转译, 这样才能正确识别

Python爬虫中的中文网址转译
猜你喜欢