如何解决利用Jsoup解析网页偶然出现问号乱码的问题?
澳门新葡京
澳门新葡京
当前位置 : 澳门新葡京 > 澳门新葡京官方网站

如何解决利用Jsoup解析网页偶然出现问号乱码的问题?

利用Jsoup解析网页文章,有时获取结果中部分文章的标题会出现问号乱码???的问题,试过指定编码解析,还是不能解决?

另外还有一个奇怪的地方,将含有乱码的字符串在android上的控件setText,乱码会自动消失,恢复正常,谁有遇到过这种问题不?

采取Document document = Jsoup.parsenew URLurl.openStream, "UTF-8", url;的方式获取,不要先获取网页html的文本,采用Jsoup.parsehtml的方式(即使在读html时设置了UTF-8,sb.appendnew Stringbuf, 0, len, "UTF-8"; 这样也无效的)

Jsoup 采集回来的信息出现乱码
注:设置为UTF-8不是GBK

在这里可以解决这些问题:JSOUP教程

广告位

澳门新葡京