温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

URL编码解码实例分析

发布时间:2022-02-25 10:36:56 来源:亿速云 阅读:147 作者:iii 栏目:开发技术

这篇文章主要介绍了URL编码解码实例分析的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇URL编码解码实例分析文章都会有所收获,下面我们一起来看看吧。

案例

思路

很多情况出现乱码的原因其实还是用户(开发者)本身造成的。使用了错误的方式打开了一个文件,就会出现乱码。比如说文本文件的UTF-8格式的文件被错误地使用GBK方式打开等。而上面的案例中实际上也是一种错误的打开方式(或者说,没有完全打开)。实际上,看到上面的代码我们第一反应是应该去查找这是什么代码。根据小编的经验(没有经验的也可以百度),这应该是URL编码,然后小编找了站长工具进行测试后也确定了该编码方式是URL编码。

什么是URL编码?

URL编码是一种特殊的编码形式,因为最开始应用于URL中所以得名URL编码。我们知道URL中是不能出现中文还有其他非英文字符的(也可以理解为不能出现非ASCII码表的字符),但我们又确实需要在URL中输入一些非ASCII码表字符(我们知道,GET方式传参是将参数添加到URL后面的,如果不能在URL中输入非ASCII字符,那么就意味着GET传参不能实现其他文字的传参),于是就出现了URL编码的标准。URL编码的方式是把非ASCII码字符用%和可用的ASCII字符表示出来,这样就能用这些ASCII字符去表示非ASCII字符了。

 小伙伴们会说,你看这地址栏不是也出现了中文了吗?其实这是浏览器的优化,为了让你清楚这个链接,浏览器在地址栏会将URL编码进行解码,所以你看到的会是中文

如何解URL编码

在前端开发中对于这种数据一般是用JavaScript编写一个解编码的程序去进行解编码(现在有很多现成的解编码的js代码段),小型的数据我们可以去站长工具里面解编码(这种方式通常用来验证是否是URL编码)。但是我们是在爬虫爬取数据的时候需要对这些URL代码进行解编码,所以我们要用python的方式去解决。

在python中有一个自带的urllib库,我们知道这个库的request模块可以进行请求,parse模块可以对html代码进行解析。实际上它也可对URL编码进行解编码,以下是解编码的代码示例,各位小伙伴可以拿去做参考。

import requests
import urllib.parse

url = "https://www.yisu.com/article"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Safari/537.36'}
data = requests.get(url, headers)
data = data.text
data =urllib.parse.unquote(data)
print(data)

关于“URL编码解码实例分析”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“URL编码解码实例分析”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

url
AI