如何从字符串中删除非ASCII字符
Posix字符类\p{ASCII} 与ASCII字符匹配,而元字符^用作负数。
即以下表达式匹配所有非ASCII字符。
"[^\\p{ASCII}]"replaceAll()String类的方法接受正则表达式和替换字符串,并用指定的替换字符串替换当前字符串的字符(匹配给定的模式)。
因此,您可以使用replaceAll()方法通过将匹配的字符替换为空字符串“来删除匹配的字符。
例子1
import java.util.Scanner;
public class Exp {
public static void main( String args[] ) {
Scanner sc = new Scanner(System.in);
String regex = "[^\\p{ASCII}]";
System.out.println("输入输入数据:");
String input = sc.nextLine();
String result = input.replaceAll(regex, "");
System.out.println("Result: "+result);
}
}输出结果
输入输入数据: whÿ do we fall Result: wh do we fall
例子2
import java.util.Scanner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Example {
public static void main( String args[] ) {
Scanner sc = new Scanner(System.in);
System.out.println("Enter input string: ");
String input = sc.nextLine();
String regex = "[^\\p{ASCII}]";
//创建一个模式对象
Pattern pattern = Pattern.compile(regex);
//匹配字符串中的已编译模式
Matcher matcher = pattern.matcher(input);
//创建一个空的字符串缓冲区
StringBuffer sb = new StringBuffer();
while (matcher.find()) {
matcher.appendReplacement(sb, "");
}
matcher.appendTail(sb);
System.out.println("Result: \n"+ sb.toString() );
}
}输出结果
Enter input string: whÿ do we fall Result: wh do we fall