设置mysql数据库字符集-mysql 声明字符串变量
character-set-server/default-character-set:服务器字符集,默认使用。
character-set-database:数据库字符集。
character-set-table:数据库表字符集。
优先级按顺序增加。 所以一般情况下只需要设置character-set-server即可,创建数据库和表时不指定字符集,统一使用character-set-server字符集。
character-set-client:客户端的字符集。 客户端默认字符集。 当客户端向服务器发送请求时,该请求将使用此字符集进行编码。
character-set-results:结果字符集。 当服务器向客户端返回结果或信息时,结果将使用此字符集进行编码。
在客户端,如果未定义character-set-results,则使用character-set-client 字符集作为默认字符集。 所以只需要设置character-set-client字符集即可。
处理中文可以把character-set-server和character-set-client都设置成GB2312,如果要同时处理多种语言,就设置成UTF8。
关于MySQL的中文问题
解决乱码的方法是在执行SQL语句之前,将以下三个MySQL系统参数设置为与服务器字符集character-set-server相同的字符集。
character_set_client:客户端的字符集。
character_set_results:结果字符集。
character_set_connection:连接字符集。
通过向 MySQL 发送语句来设置这三个系统参数:set names gb2312
关于GBK、GB2312、UTF8
UTF-8:Unicode Transformation Format-8bit,允许有BOM,但通常不包含BOM。 它是一种用于解决国际字符的多字节编码。 它对英文使用 8 位(一个字节),对中文使用 24 位(三个字节)。 UTF-8 包含了世界上所有国家都需要使用的字符。 是国际编码,通用性强。 UTF-8编码的文本可以在各国支持UTF8字符集的浏览器上显示。 比如UTF8编码,老外的英文IE也能显示中文,不需要下载IE的中文支持包。
GBK是在国家标准GB2312的基础上扩展后兼容GB2312的标准。 GBK的文字编码是用双字节表示的,即中英文字符都是用双字节表示的。 为了区分中文,最高位设置为1。GBK包含所有汉字,是国家编码,通用性不如UTF8,但UTF8占用的数据库比GBD大。
GBK、GB2312等与UTF8必须通过Unicode编码才能相互转换:
GBK、GB2312 - Unicode - UTF8
UTF8 - 统一码 - GBK, GB2312
对于一个网站或者论坛,如果英文字符比较多,建议使用UTF-8来节省空间。 但是现在很多论坛插件一般只支持GBK。
GB2312是GBK的子集,GBK是GB18030的子集
GBK 是一个包含中文、日文和韩文字符的大字符集
如果是中文网站推荐GB2312 GBK,有时候还是有问题
为了避免所有乱码,应该使用UTF-8,以后支持国际化会很方便
UTF-8 可以看作是一个大字符集,它包含了大多数文本的编码。
使用UTF-8的一个好处就是其他地区(比如港台)的用户不用安装简体中文支持就可以看到你的文字没有乱码。
gb2312是简体中文代码
gbk 支持简体中文和繁体中文
big5支持繁体中文
utf-8 几乎支持所有字符
先分析一下乱码情况
1.写入数据库时,写成乱码
2.查询结果返回乱码
出现乱码是什么情况?
我们首先在mysql命令行中输入
显示像 '%char%' 这样的变量;
查看mysql字符集设置:
mysql> show variables like '%char%';
+------------------------+-------------------- ------------------+
| 变量名 | 价值 |
+------------------------+-------------------- ------------------+
| 字符集客户端 | 国标 |
| 字符集连接 | 国标 |
| 字符集数据库 | 国标 |
| 字符集文件系统 | 二进制 |
| 字符集结果 | 国标 |
| 字符集服务器 | 国标 |
| 字符集系统 | 编码器 |
| 字符集目录 | /usr/local/mysql/share/mysql/字符集/ |
+------------------------+-------------------- ------------------+
在查询结果中可以看到mysql数据库系统中的客户端、数据库连接、数据库、文件系统、查询
结果、服务器、系统字符集设置
这里文件系统的字符集是固定的,系统和服务器的字符集是在安装时确定的,与乱码问题无关
乱码问题与客户端、数据库连接、数据库、查询结果的字符集设置有关
*注:客户端是访问mysql数据库的方式。 它是通过命令行访问的。 命令行窗口是客户端。
通过JDBC等连接访问,程序为客户端
我们在向mysql写入中文数据时,在连接客户端、连接数据库、写入数据库时都需要进行编码转换。
改变
执行查询时,分别对返回结果、数据库连接、客户端进行代码转换
现在我们应该清楚了,乱码出现在数据库、客户端、查询结果、数据库连接中的一个或多个。
关联
接下来我们来解决这个问题
在登录数据库的时候,我们使用mysql --default-character-set=character set -u root -p 进行连接,然后我们
然后使用 show variables like '%char%'; 命令查看字符集设置设置mysql数据库字符集,可以找到客户端,数据库连接,
查询结果的字符集已设置为登录时选择的字符集
如果已经登录,可以使用set names字符集; 命令实现上面的效果,相当于下面的命令:
set character_set_client = 字符集
set character_set_cOnnection= 字符集
set character_set_results = 字符集
如果你是通过JDBC连接数据库,你可以这样写URL:
URL=jdbc:mysql://localhost:3306/abs?useUnicode=true&characterEncoding=字符集
JSP页面等终端也要设置相应的字符集
数据库的字符集可以修改mysql的启动配置指定字符集,也可以在创建数据库时添加
默认字符集字符集强制数据库字符集
通过这个设置,字符集在整个数据写入和读取过程中是统一的,不会出现乱码。
为什么不设置直接在命令行写中文就没有乱码?
从命令行可以看出,客户端的字符集设置、数据库连接、查询结果都没有改变
输入的中文经过一系列的转码转换回原来的字符集,当然我们看到的不是乱码
但这并不意味着中文在数据库中正确存储为汉字
比如现在有一个utf8编码的数据库,客户端连接使用GBK编码,连接使用默认
ISO8859-1(也就是mysql中的latin1),我们在客户端发送字符串“Chinese”,客户端
将一串GBK格式的二进制码发送给连接层,连接层将此字符串以ISO8859-1格式发送
二进制编码发送到数据库,数据库以utf8格式存储这个编码,我们把这个字段存储为utf8
读取格式的时候肯定是乱码,也就是说中文数据写入数据库的时候是以乱码的形式存储的。
在同一个客户端执行查询操作时,执行了一组与写操作相反的操作,错误的utf8格式二进制
编码转换为正确的GBK编码并正确显示。
/****************在java和jsp中设置编码***************************/
首先java中那些地方可以设置encoding
以下两种设置编码格式的方法适用于jsp页面(*.jsp)
以下方法适用于jsp、servlet和action(*.java)
request.setCharacterEncoding("UTF-8");
response.setCharacterEncoding("UTF-8");
以下适合html页面(*.htm;*.html)
Tomcate 设置编码(server.xml)
mysql设置编码命令
SET character_set_client = utf8;
SET character_set_cOnnection= utf8;
SET character_set_database = utf8;
SET character_set_results = utf8; /*注意这里很有用*/
SET character_set_server = utf8;
SET collation_cOnnection = utf8_bin;
SET collation_database = utf8_bin;
SET collation_server = utf8_bin;
在my.ini中配置默认编码
默认字符集=utf8
连接数据库并设置编码
jdbc:mysql://192.168.0.5:3306/test?characterEncoding=utf8
代码如下:
/**************************************************** ******************* ******************************* **********/
java中常用编码 UTF-8;GBK;GB2312;ISO-8859-1;
对应mysql数据库中的编码utf8;gbk;gb2312;latin1
/**************************************************** ************* ************************************* **********/
//过滤器设置编码过滤器(SetCharacterEncodingFilter.java)
包com.sorc;
导入java.io.*;
导入 javax.servlet.*;
导入 javax.servlet.http.*;
公共类 SetCharacterEncodingFilter 扩展 HttpServlet 实现 Filter{
私有过滤器配置过滤器配置;
私人字符串编码=空;
//处理传入的FilterConfig
public void init(FilterConfig filterConfig){
this.filterCONfig = filterConfig;
encoding=filterConfig.getInitParameter("编码");
}
//处理请求/响应对
public void doFilter(ServletRequest 请求设置mysql数据库字符集,ServletResponse 响应,FilterChain filterChain){
尝试 {
request.setCharacterEncoding(编码);
filterChain.doFilter(请求,响应);
} 赶上(ServletException sx){
filterConfig.getServletContext().log(sx.getMessage());
} 赶上(IOException iox){
filterConfig.getServletContext().log(iox.getMessage());
}
}
//清理资源
公共无效销毁(){
}
}
//web.xml配置过滤方法(web.xmd)
设置字符编码过滤器
com.sorc.SetCharacterEncodingFilter
编码
utf8
设置字符编码过滤器
/*
/***************有了上面的基础,接下来的面试就是一个完美的解决方案************************ * **********************/
1.使用GBK编码的解决方案
最容易遇到设置编码的地方就是用GBK数据库gbk,然后用过滤器过滤编码为gbk就万事大吉了。
效果是添加数据无乱码,读出无乱码。 数据库管理工具没有乱码。 sql结构和数据处处没有乱码。
2.使用UTF-8编码方案
所有编码都设置为UTF-8
数据库编码utf8
设置过滤器编码utf8
数据库连接?characterEncoding=utf8
然后在数据库管理工具或mysql命令行中运行SET character_set_results = gbk;
效果是在数据库管理工具中添加数据无乱码,读出乱码无乱码,sql结构和数据无处不乱码。
3.页面使用UTF8,数据库使用latin1解决方案
jap java tomcat设置为UTF-8
过滤utf8
数据库连接?characterEncoding=latin1
其他 latin1 数据库
然后在数据库管理工具或mysql命令行中运行SET character_set_results = gbk;
效果是在数据库管理工具中添加数据无乱码,读出乱码无乱码,sql结构和数据无处不乱码。
以上都不需要在页面或java代码中手动转码