JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数
引言
可以根据各种字符在Unicode字符编码表中的区间来进行判断,如数字为'0'~'9'之间,英文字母为'a'~'z'或'A'~'Z'等,Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 但通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。所以通过Character.UnicodeBlock来进行判断。代码如下:
package cn.csrc.base.count; public class CountCharacter { public static void main(String[] args) { String str ="我爱你abcd123中国 #!"; CountCharacter countCharacter = new CountCharacter(); countCharacter.count(str); } /**中文字符 */ private int chCharacter = 0; /**英文字符 */ private int enCharacter = 0; /**空格 */ private int spaceCharacter = 0; /**数字 */ private int numberCharacter = 0; /**其他字符 */ private int otherCharacter = 0; //记录中文字符 private StringBuilder sb1=new StringBuilder(); //记录英文字符 private StringBuilder sb2=new StringBuilder(); //记录数字 private StringBuilder sb3=new StringBuilder(); //记录特殊字符 private StringBuilder sb4=new StringBuilder(); /*** * 统计字符串中中文,英文,数字,空格等字符个数 * @param str 需要统计的字符串 */ public void count(String str) { if(str.equals("") || str==null){ System.out.println("字符串为空"); return; } for (int i = 0; i < str.length(); i++) { char tmp = str.charAt(i); if ((tmp >= 'A' && tmp <= 'Z') || (tmp >= 'a' && tmp <= 'z')) { enCharacter ++; sb2.append(tmp+" "); } else if ((tmp >= '0') && (tmp <= '9')) { numberCharacter ++; sb3.append(tmp +" "); } else if (tmp ==' ') { spaceCharacter ++; } else if (isChinese(tmp)) { chCharacter ++; sb1.append(tmp+" "); } else { otherCharacter ++; sb4.append(tmp +" "); } } System.out.println("字符串:" + str + " \r\n"); System.out.println("中文字符有:" + chCharacter +"个 ("+sb1.toString()+")"); System.out.println("英文字符有:" + enCharacter +"个 ("+sb2.toString()+")"); System.out.println("数字有:" + numberCharacter+"个 ("+sb3.toString()+")"); System.out.println("空格有:" + spaceCharacter+"个"); System.out.println("其他字符有:" + otherCharacter+"个 ("+sb4.toString()+")"); } /*** * 判断字符是否为中文 * @param ch 需要判断的字符 * @return 中文返回true,非中文返回false */ private boolean isChinese(char ch) { //获取此字符的UniCodeBlock Character.UnicodeBlock ub = Character.UnicodeBlock.of(ch); // GENERAL_PUNCTUATION 判断中文的“号 // CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号 if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOG RAPHS_EXTENSION_B || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) { System.out.println(ch + " 是中文"); //sb1.append(ch+" "); return true; } return false; } }
结果如下:
总结
以上所述是小编给大家介绍的JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
相关文章
Spring IOC容器Bean管理的完全注解开发放弃配置文件
这篇文章主要为大家介绍了Spring IOC容器的Bean管理完全注解开发放弃配置文件,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2022-05-05Java与Node.js利用AES加密解密出相同结果的方法示例
这篇文章主要介绍了Java与Node.js利用AES加密解密出相同结果的方法,文中给出了详细的示例代码,相信对大家的学习或者工作能带来一定的帮助,需要的朋友们下面来一起看看吧。2017-02-02idea自带database连接mysql失败问题的解决办法
在IDEA⾃带的数据库连接⼯具中,可以连接MySQL数据库,但是有的时候连接出现错误,连接不上数据库,下面这篇文章主要给大家介绍了关于idea自带database连接mysql失败问题的解决办法,需要的朋友可以参考下2023-06-06
最新评论