您的位置:

Java的substring截取字符串

Java的substring方法可以用来截取一个字符串的一部分。substring()方法的语法如下:

public String substring(int startIndex)
public String substring(int startIndex,int endIndex)

其中,startIndex指定了子字符串的起始位置,从0开始计数;endIndex指定了子字符串的结束位置(不包括这个位置对应的字符)。如果省略第二个参数,则子字符串一直截取到原始字符串的末尾。

一、基本用法

使用substring方法截取一个字符串很简单,只需要传入起始位置和结束位置即可:

String str = "Hello, world!";
String subStr = str.substring(0, 5); // 截取Hello

如果只想截取字符串的一部分,可以省略第二个参数:

String str = "Hello, world!";
String subStr = str.substring(7); // 截取world!

需要注意的是,起始位置和结束位置都必须在字符串的边界内。如果超出范围,会抛出IndexOutOfBoundsException异常:

String str = "Hello, world!";
String subStr = str.substring(-1, 10); // 抛出异常

二、与 String.length()方法的结合使用

如果只知道要截取的字符串的长度,可以通过startIndex和字符串长度来计算出endIndex:

String str = "Hello, world!";
int len = 5;
String subStr = str.substring(0, len); // 截取Hello

如果只知道要截取的字符串的结尾位置,可以先计算出字符串的长度,再结合endIndex来截取字符串:

String str = "Hello, world!";
int endIndex = 5;
String subStr = str.substring(0, endIndex); // 截取Hello

三、中英文混合字符串的截取

当字符串中包含中文字符时,如果直接使用substring方法,可能会截取出乱码或者不完整的中文字符。原因是Java中的字符串是基于Unicode编码的,一个中文字符被编码成了两个16位的Unicode字符(也就是UTF-16编码),而substring方法不考虑这个编码方式,在截取中文字符的时候可能会将一个中文字符的两个Unicode字符分别截取出来。

解决这个问题的方法有多种,其中一种比较简单粗暴的方式是,直接按照字节数来截取字符串。因为一个中文字符占用两个字节,而一个英文字符只占用一个字节,所以按照字节数来截取字符串就可以保证中文字符不被截断了。代码示例如下:

String str = "Hello,世界!";
int len = 7;
byte[] bytes = str.getBytes("Unicode");
String subStr = new String(bytes, 2, len, "Unicode"); // 截取Hello,世

需要注意的是,这种方式虽然可以解决中文截断的问题,但也有一定的副作用。如果要截取的字符串中既包含中文字符,又包含其他非ASCII字符(如日文、韩文等),则按照字节数来截取可能无法得到正确的结果。

四、substring与StringBuilder/StringBuffer相结合使用

StringBuilder和StringBuffer是两个Java中比较常用的可变字符串类,它们提供了append()方法来在末尾追加字符串。当需要截取字符串的一部分,并将其与其他字符串拼接时,就需要使用substring方法与StringBuilder/StringBuffer相结合使用。

代码示例如下:

StringBuilder sb = new StringBuilder();
sb.append("Hello, ");
sb.append("world!");
String str = sb.toString(); // str为"Hello, world!"
String subStr = str.substring(0, 5); // 截取Hello
sb = new StringBuilder();
sb.append(subStr);
sb.append(" Java");
String result = sb.toString(); // result为"Hello Java"

同样的,如果要将截取的字符串放到StringBuilder/StringBuffer的开头,可以使用insert()方法:

StringBuilder sb = new StringBuilder();
sb.append("Hello, ");
sb.append("world!");
String str = sb.toString(); // str为"Hello, world!"
String subStr = str.substring(7); // 截取world!
sb = new StringBuilder();
sb.append("Java ");
sb.insert(0, subStr);
String result = sb.toString(); // result为"world! Java"