您的位置:

java怎么读取中文(java汉语怎么读)

本文目录一览:

如何java读取海量中文文本

使用Boyer-Moore算法

或者使用KMP算法

建议使用后者

KMP算法(java)

public class KMP {

/**

* @param args

*/

//计算模式串的next值

public static void getNext(String strModel, int dNext[]){

int i = 0,j = 1;

dNext[1] = 0;

while(j strModel.length()){

while(i 0 strModel.charAt(i) != strModel.charAt(j))//递推

i = dNext[i];

i++;

j++;

if(j == strModel.length())

break;

if(strModel.charAt(j) == strModel.charAt(i))//得出next值

dNext[j] = dNext[i] + 1;

else

dNext[j] = i;

}

}

//利用next值查询子串

public static int getSubString(String strMain, String strModel, int dStart){

int dPos = -1;

int i = dStart;

int j = 1;

int dNext[] = new int[200];

getNext(strModel, dNext);

while(istrMain.length()){

if(strMain.charAt(i) == strModel.charAt(j)){//当前字符匹配

if(j == (strModel.length()-1)){//查找成功

dPos = i - j + 1;

break;

}

i++;

j++;

}

else{//当前字符不匹配

if(dNext[j] == 0){

i++;

j = 1;

}

else{

j = dNext[j];

}

}

}

return dPos;

}

public static void main(String[] args) {

// TODO Auto-generated method stub

String strModel = " jlsdjflskjdm";

int[] dNext = new int[20];

getNext(strModel, dNext);

for(int i = 1; istrModel.length(); i++)

System.out.print(dNext[i] + " ");

String strMain = " aaaaaaaaaaabbbcdabbksfjlsdjflskjd";

System.out.println();

System.out.println(getSubString(strMain, strModel, 1));

}

}

java怎么把字符串中的的汉字取出来

1.判断字符串是否全是汉字。

String str1 = "java判断是否为汉字"

String str2 = "全为汉字"

String reg = "[\\u4e00-\\u9fa5]+"

boolean result1 = str1.matches(reg)//false

boolean result2 = str2.matches(reg)//true

2.提取字符串中的汉字。

String str = "java怎么把asdasd字符串中的asdasd的汉字取出来"

String reg = "[^\u4e00-\u9fa5]"

str = str.replaceAll(reg, " ")

System.out.println(str)

3.判断字符串中是否含有汉字。

boolean result = (str.length() == str.getBytes().length)//true:无汉字  false:有汉字

4.获取字符串中汉字的个数。

int count = 0

String reg = "[\\u4e00-\\u9fa5]"

String str = "java获取汉字Chinese的个数"

Pattern p = Pattern.compile(reg)

Matcher m = p.matcher(str)

while (m.find()) {for (int i = 0; i = m.groupCount(); i++) {count = count + 1}}

System.out.println("共有汉字 " + count + "个 ")

java怎么把字符串中的的汉字取出来?

1.判断字符串是否全是汉字。

String str1 = "java判断是否为汉字"

String str2 = "全为汉字"

String reg = "[\\u4e00-\\u9fa5]+"

boolean result1 = str1.matches(reg)//false

boolean result2 = str2.matches(reg)//true

2.提取字符串中的汉字。

String str = "java怎么把asdasd字符串中的asdasd的汉字取出来"

String reg = "[^\u4e00-\u9fa5]"

str = str.replaceAll(reg, " ")

System.out.println(str)

3.判断字符串中是否含有汉字。

boolean result = (str.length() == str.getBytes().length)//true:无汉字  false:有汉字

4.获取字符串中汉字的个数。

int count = 0

String reg = "[\\u4e00-\\u9fa5]"

String str = "java获取汉字Chinese的个数"

Pattern p = Pattern.compile(reg)

Matcher m = p.matcher(str)

while (m.find()) {for (int i = 0; i = m.groupCount(); i++) {count = count + 1}}

System.out.println("共有汉字 " + count + "个 ")