抓网页数据个别乱码的问题~求解决

西枫浪客 2019-11-26 990

要抓取ip138网站页面的手机号归属地,这个网站设置的好恶心,无法用Get获取源码,只能是打开网页的形式,但是打开网页获取省市时,中间有个空格,用split切割不了,于是用ASCII转换了下那个空格看下是个什么东西,结果是194,输出Chr(194),成了一个utf-8的变异�号,用这个变异�切割还是无法实现,按键精灵里面可以直接用普通?来切,于是用Chr(194)来当切割的参数,于是提示:“'utf-8' codec can't decode byte 0xc2 in position 0: invalid continuation byte”,于是不知道怎么继续了~~我是想UiBot居然能显示这个空格或者�,为何不能拿来切呢,这个我想着应该是属于一个小BUG吧.


问题总结四点:

1、它在输出界面一直显示的是 空格

2、用Asc()获取这个空格值的话就是194,然后用Chr(194)输出就是�

3、用空格和�都无法用split来切,切了没有任何反应

4、直接用Chr(194)这个来当切的参数的话,就会报错 'utf-8' codec can't decode byte 0xc2 in position 0: invalid continuation byte

最新回复 (1)
  • 林墨晗 2019-11-26
    2
    编码不对,所以取的数据是错了的,用获取元素文本试试
返回
发新帖