Java的substring方法可以用来截取一个字符串的一部分。substring()方法的语法如下:
public String substring(int startIndex) public String substring(int startIndex,int endIndex)
其中,startIndex指定了子字符串的起始位置,从0开始计数;endIndex指定了子字符串的结束位置(不包括这个位置对应的字符)。如果省略第二个参数,则子字符串一直截取到原始字符串的末尾。
一、基本用法
使用substring方法截取一个字符串很简单,只需要传入起始位置和结束位置即可:
String str = "Hello, world!"; String subStr = str.substring(0, 5); // 截取Hello
如果只想截取字符串的一部分,可以省略第二个参数:
String str = "Hello, world!"; String subStr = str.substring(7); // 截取world!
需要注意的是,起始位置和结束位置都必须在字符串的边界内。如果超出范围,会抛出IndexOutOfBoundsException异常:
String str = "Hello, world!"; String subStr = str.substring(-1, 10); // 抛出异常
二、与 String.length()方法的结合使用
如果只知道要截取的字符串的长度,可以通过startIndex和字符串长度来计算出endIndex:
String str = "Hello, world!"; int len = 5; String subStr = str.substring(0, len); // 截取Hello
如果只知道要截取的字符串的结尾位置,可以先计算出字符串的长度,再结合endIndex来截取字符串:
String str = "Hello, world!"; int endIndex = 5; String subStr = str.substring(0, endIndex); // 截取Hello
三、中英文混合字符串的截取
当字符串中包含中文字符时,如果直接使用substring方法,可能会截取出乱码或者不完整的中文字符。原因是Java中的字符串是基于Unicode编码的,一个中文字符被编码成了两个16位的Unicode字符(也就是UTF-16编码),而substring方法不考虑这个编码方式,在截取中文字符的时候可能会将一个中文字符的两个Unicode字符分别截取出来。
解决这个问题的方法有多种,其中一种比较简单粗暴的方式是,直接按照字节数来截取字符串。因为一个中文字符占用两个字节,而一个英文字符只占用一个字节,所以按照字节数来截取字符串就可以保证中文字符不被截断了。代码示例如下:
String str = "Hello,世界!"; int len = 7; byte[] bytes = str.getBytes("Unicode"); String subStr = new String(bytes, 2, len, "Unicode"); // 截取Hello,世
需要注意的是,这种方式虽然可以解决中文截断的问题,但也有一定的副作用。如果要截取的字符串中既包含中文字符,又包含其他非ASCII字符(如日文、韩文等),则按照字节数来截取可能无法得到正确的结果。
四、substring与StringBuilder/StringBuffer相结合使用
StringBuilder和StringBuffer是两个Java中比较常用的可变字符串类,它们提供了append()方法来在末尾追加字符串。当需要截取字符串的一部分,并将其与其他字符串拼接时,就需要使用substring方法与StringBuilder/StringBuffer相结合使用。
代码示例如下:
StringBuilder sb = new StringBuilder(); sb.append("Hello, "); sb.append("world!"); String str = sb.toString(); // str为"Hello, world!" String subStr = str.substring(0, 5); // 截取Hello sb = new StringBuilder(); sb.append(subStr); sb.append(" Java"); String result = sb.toString(); // result为"Hello Java"
同样的,如果要将截取的字符串放到StringBuilder/StringBuffer的开头,可以使用insert()方法:
StringBuilder sb = new StringBuilder(); sb.append("Hello, "); sb.append("world!"); String str = sb.toString(); // str为"Hello, world!" String subStr = str.substring(7); // 截取world! sb = new StringBuilder(); sb.append("Java "); sb.insert(0, subStr); String result = sb.toString(); // result为"world! Java"