今天研究了一下QFtp这个类,发现访问得到的文件名称中一旦出现中文,不管怎么转换编码格式,最终显示出来的始终都是乱码。于是我深入地对这一现象进行了研究。这里先简单介绍一下我的分析过程:
FTP服务器在收到List指令后,会把当前文件夹的所有项目(包括文件夹和文件的名称,大小,时间,所有者等相关信息)列举出来并返回给FTP客户端。曾经在网上看到有人说过这样一句话:“ftp 在编码问题上相当笨,笨到对编码一无所知”。确实,多数FTP服务器在返回这些名称时采用的文字编码格式为ANSI。这是一个不太好的格式,英文字符占用一个字节存储空间,非英文字符占用两个字节存储空间,长度不一致。而Qt的默认文本编码采用的UTF-16(是么?这里不太肯定,反正从实验得到的数据来看至少是这样的)。即每个字符占据两个字节的存储空间。当QFtp从FTP服务器获取到当前目录下的项目信息时,名称部分直接粗暴地一个个地拆分成了UTF-16格式,并认为这些数据就是UTF-16格式的数据。那么当然不管你如何对其进行转换,数据本身都是错的,又怎么会得到正确的中文显示呢?所以,我们需要对这些数据进行特别的整理。
今天先写到这里,做个记号。过两天会写出详细的解决办法。
项目忙完了,下面贴出解决方法。
由于编码错误,我写了两个函数用于互相转换编码。
一个是由正常编码转为QFTP上所谓的“乱码”的:QString _ToSpecialEncoding(const QString &InputStr);
另一个是由QFTP乱码转换为正常编码的:QString _FromSpecialEncoding(const QString &InputStr);
需要注意的是,使用这个函数之前,你的应用程序应该在界面上能正常显示中文。我是这样来实现的:
在main函数中,QApplication app...下一行写如下代码:
QTextCodec::setCodecForTr(QTextCodec::codecForName("GBK"));
QTextCodec::setCodecForLocale(QTextCodec::codecForName("GBK"));
QTextCodec::setCodecForCStrings(QTextCodec::codecForName("GBK"));
转换函数实现:
当使用QFTP的put方法上传的时候,目标文件名参数的位置使用_ToSpecialEncoding(正常编码的字符串);
当使用QFTP的get方法下载的时候,目标文件名参数位置也使用上述函数
当使用QFTP遍历到的文件作为本地文件名时须使用_FromSpecialEncoding(错误编码的字符串);
以上代码在Windows XP SP3 + IIS 测试通过。FTP服务器设置使用ASCII编码的也可通过。