今天在用爬虫抓取网页数据时,最终抓取得到的字符串是带空格的,很神奇的是这个时候用java.lang.String.trim()方法没有能把空格去掉。折腾了很久才发现是因为抓取的网页上表格数据中的每一个单元格后都带有 

最后发现,空格对应的ASCII竟然有两个,一个是最常见的 0x20(十进制32),另一个是 0xA0(十进制160),Java中String的trim()方法只能去掉ASCII码为32的空格,对 转换而成的空格是无效的。

解决方法:

String newStr = str.replaceAll("[\\s\\u00A0]+$", "");

附:ASCII码表