常用字符编码

在程序中如果没有处理好字符的编码,就有可能出现乱码问题。下面我们一起为大家介绍在开 发中常见的编码有 哪些。
在计算机世界里,任何的文字都是以指定的编码方式存在的。 常见编码有: |S08859-1、GBK/GB2312、 unicode、 UTF。

iso8859-1: 编码属于单字节编码,最多只能表示0- -- -255的字符范围,主要在英文上应用。 GBK/GB2312: 中文的国际编码,专门
门用来表示汉字,是双字节编码

unicode:I java中就是使用此编码方式,也是最标准的一种编码,是使用16进制表示的编码。但此编码不兼容iso8859- 1编码。 UTF:
由于unicode不支持iso8859- 1编码,而且容易占用更多的空间,而且对于英文母也需要使用两个字节编码,这样使
用unicode不便于传输和储存,因此产生了utf编码,utt编码兼容了iso8859- 1编码,也可以用来表示所有语言字符,
不过utf是不定长编码,每个字符的长度从1- 6个字节不等,-般在中文网页中使用此编码,因为这样可以节省空 间。 造成乱码的根本原因:
1、程序使用的编码与本机的编码不统一 2、在网络中,客户端与服务端编码不统一
package IODemo; ​ import java.io.UnsupportedEncodingException; ​ public class
CodeDemo {    //通常产生乱码的情况是,两个不兼容的编码互相转换;    public static void main(String[]
args) {        String info = "天命不可违";//GB2312        try {            String
newInfo = new String(info.getBytes("gb2312"),"iso8859-1");          
 System.out.println(newInfo);            String newInfo2 = new
String(newInfo.getBytes("iso8859-1"),"gb2312");          
 System.out.println(newInfo2);       } catch (UnsupportedEncodingException e) {
           e.printStackTrace();       }   } }

技术
下载桌面版
GitHub
Gitee
SourceForge
百度网盘(提取码:draw)
云服务器优惠
华为云优惠券
腾讯云优惠券
阿里云优惠券
Vultr优惠券
站点信息
问题反馈
邮箱:[email protected]
吐槽一下
QQ群:766591547
关注微信