如何将汉字转换为10位unicode编码

本文目录

如何将汉字转换为10位unicode编码
Word将汉字转换成为Unicode码
怎么把汉字转换成unicode编码
请问如何用C语言实现汉字，和Unicode编码的转换
C++把一汉字转换成Unicode怎么计算
汉字转Unicode怎么用，如何配合CE使用
如何将中文转为unicode和GB2312
如何在vb中将汉字转化成unicode
VB中如何将汉字转换为Unicode代码
如何把中文转换为UNICODE

如何将汉字转换为10位unicode编码

unicode编码不需要转换成汉字，因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联，也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030)，日文系统就是JIS，不同语言版本的windows都有不同的默认内码，这是每个国家的标准化管理局规定的。
然后就是页码表的概念，所谓页码表就是把一个用系统默认编码（比如gbk，gb2312）表示的字符映射到对应unicode编码，而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板-》区域和语言选择-》高级，里面可以看到window提供的所有页码表。

Word将汉字转换成为Unicode码

　　①汉字转换成为Unicode字符编码
　　首先选择汉字，然后切换到英文输入法状态，按下下列组合键即可。
　　Alt+X
　　青山的“青”字，选中该“青”字以后，按下Alt+X，即可得到9752，这就是该字所对应的Unicode字符编码
　　②将Unicode字符编码转换为汉字
　　同样，按下下列组合键即可。
　　Alt+X
　　比如，选中Unicode字符编码9752，按下Alt+X，即可得到汉字“青”字。

怎么把汉字转换成unicode编码

请问如何用C语言实现汉字，和Unicode编码的转换

字转换：wctomb、mbtowc，wc 指 Wide charactor，mb 指 Multi-byte。
字符串转换：wcstombs、mbstowcs，wcs 和 mbs 的 s 指 string。
这 4 个函数是 C 标准函数库函数中的。如果只是在 Windows 平台下编程，可直接调用 Windows API 函数 WideCharToMultiByte 和 MultiByteToWideChar 实现。但是如果调用标准库函数的话，在 Linux 下也是有效的。调用标准库函数，首先必须包含 locale.h 并调用 setlocale(LC_ALL, ““) 后才能正确转换。Windows 下的 Multi-byte 是 ANSI 编码的，Wide charactor 是 Unicode (UTF-16) 编码，而 Linux 下的 Multi-byte 是 UTF-8 编码的，Wide charactor 是 Unicode (UTF-32) 编码。
#include 《stdio.h》
#include 《stdlib.h》
#include 《locale.h》
int main(void)
{
char str;
wchar_t wstr = { 0x52B3, 0x788C, 0 };
setlocale(LC_ALL, ““);
wcstombs(str, wstr, sizeof(str)/sizeof(char));
printf(“%s“, str);
return 0;
}

C++把一汉字转换成Unicode怎么计算

已知一个汉字的unicode码（例如－２０３１９），可以通过以下方法得到该unicode码对应的汉字：１，声明一个３字节长的字符数组，例如char a；２，对该数组赋值为char a={unsigned(-20319)/256,unsigned(-20319)%256,0}; ３，输出直接为cout《《a《《endl;即可；４，也可以把字符数组直接赋值给字符串string，例如string str(a);。下面对步骤２进行解释，unicode码为１６位（unsigned short），而字符char类型仅有８位，步骤２完成的功能就是把unicode前８位和后８位分别存放在一个字符数组不同的２字节中，由此可以想像，char型的字符串存储汉字时也应该是这样的。结尾的０表示数组的结束。查一个汉字的unicode码更简单，声明一个wchar_t变量，并直接赋值一个汉字，例如wchar_t ch=’阿’;，显示时直接cout《《ch《《endl;即可。不过编译时可能给警告。输出的文件中和普通操作一样。

汉字转Unicode怎么用，如何配合CE使用

汉字转Unicode，有一个简单的办法，就是利用记事本的功能，先将汉字拷贝到记事本上，然后【文件】→【另存为】→【文件名】取新文件名→【编码】选“Unicode”→【保存】即完成转换。

如何将中文转为unicode和GB2312

榫涂梢允迪至恕R?迪肿狦B2312要借助iconv-lite模块。转Uincode:var unicode = new Buffer(msg, ’uCS2’); var unicodeHex = ; for (var i = 0; i 《 unicode.length; i = i + 2) { unicodeHex += utils.toHex(unicode[i]) + utils.toHex(unicode[i + 1]);}转为GB2312: //将中文转化为GB2312 function chinese2Gb2312(data) { var gb2312 = iconv.encode(data.toString(’UCS2’), ’GB2312’); var gb2312Hex = ; 不然结果是不对的

如何在vb中将汉字转化成unicode

VB本身就是使用Unicode编码格式的，只要能在VB中正常显示出来的字符串都肯定是Unicode编码的。如果要把ANSI格式的字符串（在VB直接显示会出现乱码）转化为Unicode，可以这样（假定变量s储存的就是要转换的字符串）：
s = StrConv(s, vbUnicode)

VB中如何将汉字转换为Unicode代码

回答补充：用Chr()函数把ascii码转化成汉字
用ChrW()函数把Unicode码转化成汉字
（还有之前说的
AscW()函数返回值为负的时候，应加上65536 才得到汉字实际的Unicode码）
----------------------------------------------------------------------------------------
求汉字的Unicode代码用AscW()函数
AscW(“汉“)=27721
求汉字的ASCII码用Asc()函数返回一个负数值
如Asc(“汉“)=-17734
PS:PS:改进了下可转化多个汉字
在窗体上建三个text控件，
功能：text1中按个输入汉字后 text2中按个显示汉字的Unicode代码 text3中显示汉字的ASCII码
原代码如下：
Private Function change(s As String) As String
change = AscW(s)
If change 《 0 Then
change = change + 65536
End If
End Function
Private Function change2(s As String) As String
change2 = Asc(s)
End Function
Private Sub Text1_Change()
For i = 1 To Len(Text1.Text)
s = s & change(Mid(Text1.Text, i, 1)) & “ “
Next
Text2.Text = s
s = ““
For i = 1 To Len(Text1.Text)
s = s & change2(Mid(Text1.Text, i, 1)) & “ “
Next
Text3.Text = s
End Sub
补充：a 的ASCII码是97
Asc函数返回的是字符串首字母的ASCII码（如字符串只一个字符，即返回该字符的ASCII码）
Asc 函数
返回一个 Integer，代表字符串中首字母的字符代码。
语法
Asc(string)
必要的 string 参数可以是任何有效的字符串表达式。如果 string 中没有包含任何字符，则会产生运行时错误。
PSPS: VB里目前我还没找到能将之转换成把汉字转换成西欧文编码的函数不敢断言没有（有估计也很难找我搜了好多关键字都没找到）
还有不只是遨游浏览器，一般的IE浏览器也有此功能
查看——编码——其他——最下面那小三角号——西欧(ISO)

如何把中文转换为UNICODE

loads取出后是unicode?我怀疑你用的是python3

通常python2时所有IO读写都是byte方式。也就是编码后的。java也是这样子。只有python3还有某些特定的模块才会自动将byte重新转换成unicode

在python2里的确可以使用s.decode(’gbk’,’ignore’)之类的变成unicode。不过在python3里应该是这样子, s.encode(’gbk’,’ignore’)这样就变成了byte

如果你喜欢 utf-8，可以s.encode(‘utf-8’,’ignore’)和s.decode(‘utf-8’,’ignore’)

多试试就可以了。 console和文件只支持编码过的字符串。

标签：编码汉字转换为如何将资讯

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。