一、TCHAR.h
TCHAR.h是Windows系统中编译Unicode和Ansi字符集的过程中高度重用、借助于宏定义实现的一个C/C++头文件。如果使用TCHAR.h中的宏定义,那么当应用程序目标使用Unicode字符时,宏会被自动转码使用UTF-16字符集,而如果应用程序目标使用Ansi字符时,宏则会自动使用原始的Ansi字符集。 在Windows平台下使用TCHAR.h是十分便利的,因为Windows系统中广泛使用Unicode字符编码,可以认为TCHAR.h是将Unicode和Ansi字符集进行无缝转换的过程。在编写Windows API的调用代码时,通常可以使用宽字符接口(如MessageBoxW),而在代码编写时使用TCHAR字符串可以方便地决定使用TCHAR.h宏的方式,不管是使用Unicode还是Ansi字符集都可以编写一套代码,而不用为字符集的选择进行大量的定制工作。
二、TCHAR.h, Linux, tchar和char的区别
TCHAR.h通常只用于Windows平台,Linux下使用不太常见。实际上,在Linux平台下不需要使用TCHAR.h。在Linux下,char和wchar_t被定义为8位和16位字符类型,分别对应于8位的ANSI字符和16位的Unicode字符。 因此,在Linux平台下使用char和wchar_t类型,可以直接操作任何被支持的编码。而在Windows平台下,由于使用的是TCHAR.h,所以只需要在编写代码时用“_T”、_TEXT,或TCHAR宏修饰字符串即可。如果Windows应用程序有一个使用Unicode的字符串,可以使用“L”前缀,就像这样: TCHAR wstr[10]; LPCWSTR lstr = L"Unicode string"; lstr.CopyTo(wstr, 10);
三、TCHAR和WCHAR
TCHAR和WCHAR均为Windows系统中处理Unicode字符串的类型,但是用法略有不同。 TCHAR是一种宏定义,先根据当前编译设置文件的Unicode或ANSI编码,然后将所有TCHAR类型替换为相应的类型名称。如果编译处于Unicode模式,则TCHAR类型被替换为wchar_t;如果编译处于ANSI模式,则TCHAR类型被替换为char。 WCHAR是一种数据类型,用于存储Unicode字符,即2字节大小的字符。与char不同,WCHAR的长度是16位字符。 示例代码:
#include执行结果:#include int main() { TCHAR a = 'A'; TCHAR *b = _T("Hello World!"); WCHAR c = L'B'; WCHAR *d = L"!dlroW olleH"; _tprintf(_T("%c %s\n"), a, b); wprintf(L"%c %ls\n", c, d); return 0; }
A Hello World! B !dlroW olleH在上面的代码中,我们用TCHAR定义了一个单个字符,以及一个指向TCHAR的指针。在赋值时,我们使用了_T前缀,这意味着 如果当前编译是Unicode,则我们创建了一个16位的WCHAR类型,否则我们创建了一个8位的char类型。 在第二个定义中,我们使用了WCHAR类型,它依然是一种16位的字符类型。在最后两行中,我们分别用_tprintf和wprintf分别输出TCHAR和WCHAR类型的字符串。