相思资源网 Design By www.200059.com

1. 问题  抓取某个网站,发现请求参数是乱码格式,

python爬虫把url链接编码成gbk2312格式过程解析

这是点击 TextView,发现请求参数如下图所示

python爬虫把url链接编码成gbk2312格式过程解析

3. 那么=%B9%FA%CE%F1%D4%BA%B7%A2%D5%B9%D1%D0%BE%BF%D6%D0%D0%C4是什么东西啊

python爬虫把url链接编码成gbk2312格式过程解析

解码后是 =国务院发展研究中心

代码实现:  

content = "我爱中国"
import urllib
res = urllib.quote(content.encode('gb2312'))
print res
print "11111111", type(res)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

标签:
python,爬虫,url,编码,gbk2312

相思资源网 Design By www.200059.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
相思资源网 Design By www.200059.com

评论“python爬虫把url链接编码成gbk2312格式过程解析”

暂无python爬虫把url链接编码成gbk2312格式过程解析的评论...