设为首页 加入收藏

TOP

mysql 乱码产生探讨(一)
2014-11-24 03:26:07 来源: 作者: 【 】 浏览:0
Tags:mysql 乱码 产生 探讨

实验一

1。首先,在下面情况下:

mysql> show variables like 'character_set_%';

+--------------------------+---------------------------------------+

| Variable_name | Value |

+--------------------------+---------------------------------------+

| character_set_client | latin1 |

| character_set_connection | latin1 |

| character_set_database | latin1 |

| character_set_filesystem | binary |

| character_set_results | latin1 |

| character_set_server | latin1 |

| character_set_system | utf8 |

| character_sets_dir | D:\Programs\mysql5045\share\charsets\ |

+--------------------------+---------------------------------------+

建表,并加入3个记录:大,阿,爱

2。set character_set_results=utf8;

则显示:(cmd窗口中,cmd窗口代码页936)

大->麓贸

阿->掳垄

爱->掳庐

分析编码:

大U:5927,GBK:B4F3

麓U:9E93,GBK:C2B4

贸U:8D38,GBK:C3B3

阿U:963F,GBK:B0A2

掳U:63B3,GBK:C2B0

垄U:5784,GBK:C2A2

爱U:7231,GBK:B0AE

掳U:63B3,GBK:C2B0

庐U:5E90,GBK:C2AE

3。改成set character_set_results=gb2312;

一样是乱码

4。结论:

乱码的产生,是由于单字节向多字节扩展引起的。B0A2 如果作为单字节存储(虽然表示的是1个汉字,但是因为是latin1单字节,所以认为B0A2是不相关的两个字符),此时如果把character_set_results变成utf8多字节,那么数据库mysql 会试图把每个单字节扩展成近似的(不知道具体的算法)双字节。所以乱码

反之,多字节向单字节转换时,不会有变动,仅仅是原来2各字节表示的一个字符‘B0A2’变成了表示两个字符而已。---- 这个说法经验证是错误的。

数据库存储的内容(磁盘上,内存里)不会受character_set_的影响,只是提交,查询的过程中,受到字符集转换的影响。

实验二

1。

create table y (id int, name char(4)) default charset gb2312;

2。在不改变默认character_set_ 是latin1的情况下,如果插入一个汉字,则显示乱码

3。改成set names gb2312,显示没问题(cmd窗口中,cmd窗口代码页936)

4。我原以为如上述实验1种的结论2,“多字节向单字节转换时,不会有变动”。所以我开始以为,set names gb2312 后,把character_set_results 改成latin1,显示不会出问题。结果,

一个汉字,则显示一个问号;两个汉字,则显示两个问号的乱码(估计一个问号代表一个字符)。也就是说,改成character_set_results = latin1后,多字节的数据存储,在向单字节表示转换时,mysql把提出的信息“缩水了”,把两个字节,换算成了一个字节。

5。如何,不让mysql缩水呢,我想到了character_set_results = binary;结果,果然显示正常。

PS

开发的使用mysql的应用程序,是对应作为独立的使用自己的character_set_client的字符集的

cmd 窗口登陆mysql,也是作为一个独立的,拥有自己character_set_client变量的应用

同理,打开不同的cmd窗口,都拥有独自的character_set_client变量

实验三07/16/2010

1。建一个默认字符集utf8的表(用navicat ,在utf8的界面下 代码页65001),并且插入utf8编码的汉字‘大学’

2。切换到mysql console(代码页936)

3。set names gbk; 然后显示刚才所建立的表,能正确现实吗?---- 能!当然,只把character_set_results 成gbk,也能正常显示

实验四

1。mysql console(代码页936)建立一个表x3 ( name char(32) ),默认字符集default charset gbk;

2。默认环境变量

| character_set_client | latin1

| character_set_connection | latin1

| character_set_database | latin1

| character_set_filesystem | binary

| character_set_results | latin1

| character_set_server | latin1

| character_set_system |utf8 //不知道对以下过程、分析是否有影响

character_set_client character_set_connection character_set_results 是latin1的情况下,插入数据:insert x3 values('大');

显示:ERROR 1406 (22001): Data too long for column 'name' at row 1

3。set character_set_client=gbk;然后insert x3 values('大');插入没有问题,但显然,数据经过 (character_set_connection=latin1)的转换,已经是有损了

4。不管character_set_results 设不设成gbk,都不能正常显示结果

5。set names gbk;则插入现实都没问题。并且此时,一个uf8字符集的表的显示也没问题(实验三)。而且进行连接查询,亦没问题。

6。当然,set names utf8,如

首页 上一页 1 2 下一页 尾页 1/2/2
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇mysql添加用户、更改密码 下一篇Redhat5下MySql遇到的乱码问题

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容:

·用 C 语言或者限制使 (2025-12-25 08:50:05)
·C++构造shared_ptr为 (2025-12-25 08:50:01)
·既然引用计数在做 GC (2025-12-25 08:49:59)
·Java 编程和 c 语言 (2025-12-25 08:19:48)
·. net内存管理宝典这 (2025-12-25 08:19:46)