当前位置: 首页 > news >正文

Android识别字符串中的简体和繁体字

标准编码格式

编码别名语言
ascii646、us-ascii英语
big5big5-tw、csbig5繁体中文
big5hkscsbig5-hkscs、hkscs繁体中文
cp037IBM037、IBM039英语
cp273273、IBM273、csIBM273德语
cp424EBCDIC-CP-HE、IBM424希伯来语
cp437437、IBM437英语
cp500EBCDIC-CP-BE、EBCDIC-CP-CH、IBM500西欧
cp720阿拉伯语
cp737希腊语
cp775IBM775
cp850850、IBM850西欧
cp852852、IBM852中欧和东欧
cp855855、IBM855保加利亚语、白俄罗斯语、马其顿语、俄语、塞尔维亚语
cp856希伯来语
cp857857、IBM857土耳其语
cp858858、IBM858西欧
cp860860、IBM860葡萄牙语
cp861861、CP-IS、IBM861冰岛语
cp862862、IBM862希伯来语
cp863863、IBM863加拿大语
cp864IBM864阿拉伯语
cp865865、IBM865丹麦语/挪威语
cp866866、IBM866俄语
cp869869、CP-GR、IBM869希腊语
cp874泰语
cp875希腊语
cp932932、ms932、mskanji、ms-kanji日语
cp949949、ms949、uhc韩语
cp950950、ms950繁体中文
cp1006乌尔都语
cp1026ibm1026土耳其语
cp11251125、ibm1125、cp866u、ruscii乌克兰语
cp1140ibm1140西欧
cp1250windows-1250中欧和东欧
cp1251windows-1251保加利亚语、白俄罗斯语、马其顿语、俄语,塞尔维亚语
cp1252windows-1252西欧
cp1253windows-1253希腊语
cp1254windows-1254土耳其语
cp1255windows-1255希伯来语
cp1256windows-1256阿拉伯语
cp1257windows-1257波罗的海语言
cp1258windows-1258越南语
cp65001仅支持Windows:Windows UTF-8 (CP_UTF8)
euc_jpeucjp、ujis、u-jis日语
euc_jis_2004jisx0213、eucjis2004日语
euc_jisx0213eucjisx0213日语
euc_kreuckr、korean、ksc5601、ks_c-5601、ks_c-5601-1987、ksx1001、ks_x-1001韩语
gb2312chinese、csiso58gb231280、euc-cn、euccn、eucgb2312-cn、gb2312-1980、gb2312-80、iso-ir-58简体中文
gbk936、cp936、ms936统一汉语
gb18030gb18030-2000统一汉语
hzhzgb、hz-gb、hz-gb-2312简体中文
iso2022_jpcsiso2022jp、iso2022jp、iso-2022-jp日语
iso2022_jp_1iso2022jp-1、iso-2022-jp-1日语
iso2022_jp_2iso2022jp-2、iso-2022-jp-2日语、韩语、简体中文、西欧、希腊语
iso2022_jp_2004iso2022jp-2004、iso-2022-jp-2004日语
iso2022_jp_3iso2022jp-3、iso-2022-jp-3日语
iso2022_jp_extiso2022jp-ext、iso-2022-jp-ext日语
iso2022_krcsiso2022kr、iso2022kr、iso-2022-kr韩语
latin_1iso-8859-1、iso8859-1、8859、cp819、latin、latin1、L1西欧
iso8859_2iso-8859-2、latin2、L2中欧和东欧
iso8859_3iso-8859-3、latin3、L3世界语、马耳他语
iso8859_4iso-8859-4、latin4、L4波罗的海语言
iso8859_5iso-8859-5、cyrillic保加利亚语、白俄罗斯语、马其顿语、俄语、塞尔维亚语
iso8859_6iso-8859-6、arabic阿拉伯语
iso8859_7iso-8859-7、greek、greek8希腊语
iso8859_8iso-8859-8、hebrew希伯来语
iso8859_9iso-8859-9、latin5、L5土耳其语
iso8859_10iso-8859-10、latin6、L6北欧语言
iso8859_11iso-8859-11、thai泰语
iso8859_13iso-8859-13、latin7、L7波罗的海语言
iso8859_14iso-8859-14、latin8、L8凯尔特语
iso8859_15iso-8859-15、latin9、L9西欧
iso8859_16iso-8859-16、latin10、L10东南欧
johabcp1361、ms1361韩语
koi8_r俄语
koi8_t塔吉克
koi8_u乌克兰语
kz1048kz_1048、strk1048_2002、rk1048哈萨克语
mac_cyrillicmaccyrillic保加利亚语、白俄罗斯语、马其顿语、俄语、塞尔维亚语
mac_greekmacgreek希腊语
mac_icelandmaciceland冰岛语
mac_latin2maclatin2、maccentraleurope中欧和东欧
mac_romanmacroman、macintosh西欧
mac_turkishmacturkish土耳其语
ptcp154csptcp154、pt154、cp154、cyrillic-asian哈萨克语
shift_jiscsshiftjis、shiftjis、sjis、s_jis日语
shift_jis_2004shiftjis2004、sjis_2004、sjis2004日语
shift_jisx0213shiftjisx0213、sjisx0213、s_jisx0213日语
utf_32U32、utf32所有语言
utf_32_beUTF-32BE所有语言
utf_32_leUTF-32LE所有语言
utf_16U16、utf16所有语言
utf_16_beUTF-16BE所有语言
utf_16_leUTF-16LE所有语言
utf_7U7、unicode-1-1-utf-7所有语言
utf_8U8、UTF、utf8所有语言
utf_8_sig所有语言

MS950是繁体字编码格式

public static void isSimpleOrComplex(String txt) {
    for (int i = 0; i < txt.length(); i++) {
        try {
            Charset charset = Charset.forName("MS950");
            ByteBuffer byteBuffer = charset.encode(String.valueOf(txt.charAt(i)));
            byte[] bytes = byteBuffer.array();
            String bytesStr = bytes2HexString(bytes);
            if (bytesStr.compareTo("B0 A1") >= 0 && bytesStr.compareTo("F7 FE") <= 0) {
                Log.e("TAG", "(" + txt + ")" + "包含繁体字");
                return;
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    Log.e("TAG", "(" + txt + ")" + "不包含繁体字");
}

public static String bytes2HexString(byte[] b) {
	StringBuilder r = new StringBuilder();
	for (byte value : b) {
		String hex = Integer.toHexString(value & 0xFF);
		if (hex.length() == 1) {
			hex = '0' + hex;
		}
		r.append(hex.toUpperCase()).append(" ");
	}
	return r.toString();
}
isSimpleOrComplex("专业開發者社区");
isSimpleOrComplex("专业开发者社区");

相关文章:

  • ie11浏览器兼容性报错app.js script1003 缺少:
  • 资源管理器占用CPU过高的解决方法
  • (附源码)ssm高校实验室 毕业设计 800008
  • [CISCN2019 华东南赛区]Web4
  • 聚苯乙烯微球载金属纳米粒子/中空结构聚苯乙烯纳米微球/间隔臂羧化聚苯乙烯微球的研究
  • 软硬件一体,利尔达芯智行创新智能电摩解决方案
  • 【元宇宙欧米说】个人创作者的NFT探索之路
  • Kaggle官方·数据科学比赛经验集;百度开源·飞桨图像数据标注高效工具;C++并发编程实践第2版·笔记;前沿论文 | ShowMeAI资讯日报
  • JavaScript常用数组元素搜索或过滤的四种方法
  • java计算机毕业设计无极服装出租管理系统源码+系统+数据库+lw文档+mybatis+运行部署
  • 【算法题解】Codeforces Round #817 (Div. 4)题解
  • 【打工人摸鱼系列】python做皮卡丘桌宠,工作都有效率了呢
  • 手写模拟spring扫描底层实现
  • 照片拼图软件哪个好?快来看看这几个软件
  • 力扣打卡之合并两个有序数组
  • 实现windows 窗体的自己画,网上摘抄的,学习了
  • (ckeditor+ckfinder用法)Jquery,js获取ckeditor值
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • Bytom交易说明(账户管理模式)
  • C++类的相互关联
  • CentOS6 编译安装 redis-3.2.3
  • CSS3 变换
  • java第三方包学习之lombok
  • mongodb--安装和初步使用教程
  • php中curl和soap方式请求服务超时问题
  • UMLCHINA 首席专家潘加宇鼎力推荐
  • vue中实现单选
  • 阿里云ubuntu14.04 Nginx反向代理Nodejs
  • 给github项目添加CI badge
  • 快速构建spring-cloud+sleuth+rabbit+ zipkin+es+kibana+grafana日志跟踪平台
  • 目录与文件属性:编写ls
  • 前端学习笔记之原型——一张图说明`prototype`和`__proto__`的区别
  • 使用docker-compose进行多节点部署
  • 阿里云IoT边缘计算助力企业零改造实现远程运维 ...
  • ​如何防止网络攻击?
  • $(document).ready(function(){}), $().ready(function(){})和$(function(){})三者区别
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (zt)最盛行的警世狂言(爆笑)
  • (安全基本功)磁盘MBR,分区表,活动分区,引导扇区。。。详解与区别
  • (第61天)多租户架构(CDB/PDB)
  • (附源码)php新闻发布平台 毕业设计 141646
  • (附源码)基于SSM多源异构数据关联技术构建智能校园-计算机毕设 64366
  • (黑马C++)L06 重载与继承
  • (剑指Offer)面试题41:和为s的连续正数序列
  • (理论篇)httpmoudle和httphandler一览
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (生成器)yield与(迭代器)generator
  • (四)TensorRT | 基于 GPU 端的 Python 推理
  • (转)EOS中账户、钱包和密钥的关系
  • (转)程序员疫苗:代码注入
  • ..thread“main“ com.fasterxml.jackson.databind.JsonMappingException: Jackson version is too old 2.3.1
  • .net mvc 获取url中controller和action
  • .net redis定时_一场由fork引发的超时,让我们重新探讨了Redis的抖动问题
  • .net 获取url的方法
  • .NET 中什么样的类是可使用 await 异步等待的?