抓网页数据个别乱码的问题~求解决-开发问题-UiBot RPA技术开发交流社区 - RPA机器人流程自动化

抓网页数据个别乱码的问题~求解决

西枫浪客 2019-11-26 990

要抓取ip138网站页面的手机号归属地，这个网站设置的好恶心，无法用Get获取源码，只能是打开网页的形式，但是打开网页获取省市时，中间有个空格，用split切割不了，于是用ASCII转换了下那个空格看下是个什么东西，结果是194，输出Chr(194)，成了一个utf-8的变异�号，用这个变异�切割还是无法实现，按键精灵里面可以直接用普通?来切，于是用Chr(194)来当切割的参数，于是提示：“'utf-8' codec can't decode byte 0xc2 in position 0: invalid continuation byte”，于是不知道怎么继续了~~我是想UiBot居然能显示这个空格或者�，为何不能拿来切呢，这个我想着应该是属于一个小BUG吧.

问题总结四点：

1、它在输出界面一直显示的是空格

2、用Asc()获取这个空格值的话就是194，然后用Chr(194)输出就是�

3、用空格和�都无法用split来切，切了没有任何反应

4、直接用Chr(194)这个来当切的参数的话，就会报错 'utf-8' codec can't decode byte 0xc2 in position 0: invalid continuation byte

最新回复 (1)

林墨晗 2019-11-26

2楼

编码不对，所以取的数据是错了的，用获取元素文本试试

发新帖

西枫浪客

主题数
24

帖子数
23

精华数
0

注册排名
22486