当前位置: 主页 > 数据库

设置mysql数据库字符集-mysql 声明字符串变量

发布时间:2023-02-08 22:18   浏览次数:次   作者:佚名

character-set-server/default-character-set:服务器字符集,默认使用。

character-set-database:数据库字符集。

character-set-table:数据库表字符集。

优先级按顺序增加。 所以一般情况下只需要设置character-set-server即可,创建数据库和表时不指定字符集,统一使用character-set-server字符集。

character-set-client:客户端的字符集。 客户端默认字符集。 当客户端向服务器发送请求时,该请求将使用此字符集进行编码。

character-set-results:结果字符集。 当服务器向客户端返回结果或信息时,结果将使用此字符集进行编码。

在客户端,如果未定义character-set-results,则使用character-set-client 字符集作为默认字符集。 所以只需要设置character-set-client字符集即可。

处理中文可以把character-set-server和character-set-client都设置成GB2312,如果要同时处理多种语言,就设置成UTF8。

关于MySQL的中文问题

解决乱码的方法是在执行SQL语句之前,将以下三个MySQL系统参数设置为与服务器字符集character-set-server相同的字符集。

character_set_client:客户端的字符集。

character_set_results:结果字符集。

character_set_connection:连接字符集。

通过向 MySQL 发送语句来设置这三个系统参数:set names gb2312

关于GBK、GB2312、UTF8

UTF-8:Unicode Transformation Format-8bit,允许有BOM,但通常不包含BOM。 它是一种用于解决国际字符的多字节编码。 它对英文使用 8 位(一个字节),对中文使用 24 位(三个字节)。 UTF-8 包含了世界上所有国家都需要使用的字符。 是国际编码,通用性强。 UTF-8编码的文本可以在各国支持UTF8字符集的浏览器上显示。 比如UTF8编码,老外的英文IE也能显示中文,不需要下载IE的中文支持包。

GBK是在国家标准GB2312的基础上扩展后兼容GB2312的标准。 GBK的文字编码是用双字节表示的,即中英文字符都是用双字节表示的。 为了区分中文,最高位设置为1。GBK包含所有汉字,是国家编码,通用性不如UTF8,但UTF8占用的数据库比GBD大。

GBK、GB2312等与UTF8必须通过Unicode编码才能相互转换:

GBK、GB2312 - Unicode - UTF8

UTF8 - 统一码 - GBK, GB2312

对于一个网站或者论坛,如果英文字符比较多,建议使用UTF-8来节省空间。 但是现在很多论坛插件一般只支持GBK。

GB2312是GBK的子集,GBK是GB18030的子集

GBK 是一个包含中文、日文和韩文字符的大字符集

如果是中文网站推荐GB2312 GBK,有时候还是有问题

为了避免所有乱码,应该使用UTF-8,以后支持国际化会很方便

UTF-8 可以看作是一个大字符集,它包含了大多数文本的编码。

使用UTF-8的一个好处就是其他地区(比如港台)的用户不用安装简体中文支持就可以看到你的文字没有乱码。

gb2312是简体中文代码

gbk 支持简体中文和繁体中文

big5支持繁体中文

utf-8 几乎支持所有字符

先分析一下乱码情况

1.写入数据库时​​,写成乱码

2.查询结果返回乱码

出现乱码是什么情况?

我们首先在mysql命令行中输入

显示像 '%char%' 这样的变量;

查看mysql字符集设置:

mysql> show variables like '%char%';

+------------------------+-------------------- ------------------+

| 变量名 | 价值 |

+------------------------+-------------------- ------------------+

| 字符集客户端 | 国标 |

| 字符集连接 | 国标 |

| 字符集数据库 | 国标 |

| 字符集文件系统 | 二进制 |

| 字符集结果 | 国标 |

| 字符集服务器 | 国标 |

| 字符集系统 | 编码器 |

| 字符集目录 | /usr/local/mysql/share/mysql/字符集/ |

+------------------------+-------------------- ------------------+

在查询结果中可以看到mysql数据库系统中的客户端、数据库连接、数据库、文件系统、查询

结果、服务器、系统字符集设置

这里文件系统的字符集是固定的,系统和服务器的字符集是在安装时确定的,与乱码问题无关

乱码问题与客户端、数据库连接、数据库、查询结果的字符集设置有关

*注:客户端是访问mysql数据库的方式。 它是通过命令行访问的。 命令行窗口是客户端。

通过JDBC等连接访问,程序为客户端

我们在向mysql写入中文数据时,在连接客户端、连接数据库、写入数据库时​​都需要进行编码转换。

改变

执行查询时,分别对返回结果、数据库连接、客户端进行代码转换

现在我们应该清楚了,乱码出现在数据库、客户端、查询结果、数据库连接中的一个或多个。

关联

接下来我们来解决这个问题

在登录数据库的时候,我们使用mysql --default-character-set=character set -u root -p 进行连接,然后我们

然后使用 show variables like '%char%'; 命令查看字符集设置设置mysql数据库字符集,可以找到客户端,数据库连接,

查询结果的字符集已设置为登录时选择的字符集

如果已经登录,可以使用set names字符集; 命令实现上面的效果,相当于下面的命令:

set character_set_client = 字符集

set character_set_cOnnection= 字符集

set character_set_results = 字符集

如果你是通过JDBC连接数据库,你可以这样写URL:

URL=jdbc:mysql://localhost:3306/abs?useUnicode=true&characterEncoding=字符集

JSP页面等终端也要设置相应的字符集

数据库的字符集可以修改mysql的启动配置指定字符集,也可以在创建数据库时添加

默认字符集字符集强制数据库字符集

通过这个设置,字符集在整个数据写入和读取过程中是统一的,不会出现乱码。

为什么不设置直接在命令行写中文就没有乱码?

从命令行可以看出,客户端的字符集设置、数据库连接、查询结果都没有改变

输入的中文经过一系列的转码转换回原来的字符集,当然我们看到的不是乱码

但这并不意味着中文在数据库中正确存储为汉字

比如现在有一个utf8编码的数据库,客户端连接使用GBK编码,连接使用默认

ISO8859-1(也就是mysql中的latin1),我们在客户端发送字符串“Chinese”,客户端

将一串GBK格式的二进制码发送给连接层,连接层将此字符串以ISO8859-1格式发送

二进制编码发送到数据库,数据库以utf8格式存储这个编码,我们把这个字段存储为utf8

读取格式的时候肯定是乱码,也就是说中文数据写入数据库的时候是以乱码的形式存储的。

在同一个客户端执行查询操作时,执行了一组与写操作相反的操作,错误的utf8格式二进制

编码转换为正确的GBK编码并正确显示。

/****************在java和jsp中设置编码***************************/

首先java中那些地方可以设置encoding

以下两种设置编码格式的方法适用于jsp页面(*.jsp)

以下方法适用于jsp、servlet和action(*.java)

request.setCharacterEncoding("UTF-8");

response.setCharacterEncoding("UTF-8");

以下适合html页面(*.htm;*.html)

Tomcate 设置编码(server.xml)

mysql设置编码命令

SET character_set_client = utf8;

SET character_set_cOnnection= utf8;

SET character_set_database = utf8;

SET character_set_results = utf8; /*注意这里很有用*/

SET character_set_server = utf8;

SET collat​​ion_cOnnection = utf8_bin;

SET collat​​ion_database = utf8_bin;

SET collat​​ion_server = utf8_bin;

在my.ini中配置默认​​编码

默认字符集=utf8

连接数据库并设置编码

jdbc:mysql://192.168.0.5:3306/test?characterEncoding=utf8

代码如下:

/**************************************************** ******************* ******************************* **********/

java中常用编码 UTF-8;GBK;GB2312;ISO-8859-1;

对应mysql数据库中的编码utf8;gbk;gb2312;latin1

/**************************************************** ************* ************************************* **********/

//过滤器设置编码过滤器(SetCharacterEncodingFilter.java)

包com.sorc;

导入java.io.*;

导入 javax.servlet.*;

导入 javax.servlet.http.*;

公共类 SetCharacterEncodingFilter 扩展 HttpServlet 实现 Filter{

私有过滤器配置过滤器配置;

私人字符串编码=空;

//处理传入的FilterConfig

public void init(FilterConfig filterConfig){

this.filterCONfig = filterConfig;

encoding=filterConfig.getInitParameter("编码");

}

//处理请求/响应对

public void doFilter(ServletRequest 请求设置mysql数据库字符集,ServletResponse 响应,FilterChain filterChain){

尝试 {

request.setCharacterEncoding(编码);

filterChain.doFilter(请求,响应);

} 赶上(ServletException sx){

filterConfig.getServletContext().log(sx.getMessage());

} 赶上(IOException iox){

filterConfig.getServletContext().log(iox.getMessage());

}

}

//清理资源

公共无效销毁(){

}

}

//web.xml配置过滤方法(web.xmd)

设置字符编码过滤器

com.sorc.SetCharacterEncodingFilter

编码

utf8

设置字符编码过滤器

/*

/***************有了上面的基础,接下来的面试就是一个完美的解决方案************************ * **********************/

1.使用GBK编码的解决方案

最容易遇到设置编码的地方就是用GBK数据库gbk,然后用过滤器过滤编码为gbk就万事大吉了。

效果是添加数据无乱码,读出无乱码。 数据库管理工具没有乱码。 sql结构和数据处处没有乱码。

2.使用UTF-8编码方案

所有编码都设置为UTF-8

数据库编码utf8

设置过滤器编码utf8

数据库连接?characterEncoding=utf8

然后在数据库管理工具或mysql命令行中运行SET character_set_results = gbk;

效果是在数据库管理工具中添加数据无乱码,读出乱码无乱码,sql结构和数据无处不乱码。

3.页面使用UTF8,数据库使用latin1解决方案

jap java tomcat设置为UTF-8

过滤utf8

数据库连接?characterEncoding=latin1

其他 latin1 数据库

然后在数据库管理工具或mysql命令行中运行SET character_set_results = gbk;

效果是在数据库管理工具中添加数据无乱码,读出乱码无乱码,sql结构和数据无处不乱码。

以上都不需要在页面或java代码中手动转码