如何将汉字转换为10位unicode编码

如何将汉字转换为10位unicode编码

本文目录

  • 如何将汉字转换为10位unicode编码
  • Word将汉字转换成为Unicode码
  • 怎么把汉字转换成unicode编码
  • 请问如何用C语言实现汉字,和Unicode编码的转换
  • C++把一汉字转换成Unicode怎么计算
  • 汉字转Unicode怎么用,如何配合CE使用
  • 如何将中文转为unicode和GB2312
  • 如何在vb中将汉字转化成unicode
  • VB中如何将汉字转换为Unicode代码
  • 如何把中文转换为UNICODE

如何将汉字转换为10位unicode编码


unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个国家的标准化管理局规定的。
然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
控制面板-》区域和语言选择-》高级,里面可以看到window提供的所有页码表。

Word将汉字转换成为Unicode码


  ①汉字转换成为Unicode字符编码
  首先选择汉字,然后切换到英文输入法状态,按下下列组合键即可。
  Alt+X
  青山的“青”字,选中该“青”字以后,按下Alt+X,即可得到9752,这就是该字所对应的Unicode字符编码
  ②将Unicode字符编码转换为汉字
  同样,按下下列组合键即可。
  Alt+X
  比如,选中Unicode字符编码9752,按下Alt+X,即可得到汉字“青”字。

怎么把汉字转换成unicode编码


unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个国家的标准化管理局规定的。
然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板-》区域和语言选择-》高级,里面可以看到window提供的所有页码表。

请问如何用C语言实现汉字,和Unicode编码的转换


字转换:wctomb、mbtowc,wc 指 Wide charactor,mb 指 Multi-byte。
字符串转换:wcstombs、mbstowcs,wcs 和 mbs 的 s 指 string。
这 4 个函数是 C 标准函数库函数中的。如果只是在 Windows 平台下编程,可直接调用 Windows API 函数 WideCharToMultiByte 和 MultiByteToWideChar 实现。但是如果调用标准库函数的话,在 Linux 下也是有效的。调用标准库函数,首先必须包含 locale.h 并调用 setlocale(LC_ALL, ““) 后才能正确转换。Windows 下的 Multi-byte 是 ANSI 编码的,Wide charactor 是 Unicode (UTF-16) 编码,而 Linux 下的 Multi-byte 是 UTF-8 编码的,Wide charactor 是 Unicode (UTF-32) 编码。
#include 《stdio.h》
#include 《stdlib.h》
#include 《locale.h》
int main(void)
{
char str;
wchar_t wstr = { 0x52B3, 0x788C, 0 };
setlocale(LC_ALL, ““);
wcstombs(str, wstr, sizeof(str)/sizeof(char));
printf(“%s“, str);
return 0;
}

C++把一汉字转换成Unicode怎么计算


已知一个汉字的unicode码(例如-20319),可以通过以下方法得到该unicode码对应的汉字: 1,声明一个3字节长的字符数组,例如char a; 2,对该数组赋值为char a={unsigned(-20319)/256,unsigned(-20319)%256,0}; 3,输出直接为cout《《a《《endl;即可; 4,也可以把字符数组直接赋值给字符串string,例如string str(a);。 下面对步骤2进行解释,unicode码为16位(unsigned short),而字符char类型仅有8位,步骤2完成的功能就是把unicode前8位和后8位分别存放在一个字符数组不同的2字节中,由此可以想像,char型的字符串存储汉字时也应该是这样的。结尾的0表示数组的结束。 查一个汉字的unicode码更简单,声明一个wchar_t变量,并直接赋值一个汉字,例如wchar_t ch=’阿’;,显示时直接cout《《ch《《endl;即可。不过编译时可能给警告。输出的文件中和普通操作一样。

汉字转Unicode怎么用,如何配合CE使用


汉字转Unicode,有一个简单的办法,就是利用记事本的功能,先将汉字拷贝到记事本上,然后【文件】→【另存为】→【文件名】取新文件名→【编码】选“Unicode”→【保存】即完成转换。

如何将中文转为unicode和GB2312


榫涂梢允迪至恕R?迪肿狦B2312要借助iconv-lite模块。 转Uincode:var unicode = new Buffer(msg, ’uCS2’); var unicodeHex = ; for (var i = 0; i 《 unicode.length; i = i + 2) { unicodeHex += utils.toHex(unicode[i]) + utils.toHex(unicode[i + 1]);}转为GB2312: //将中文转化为GB2312 function chinese2Gb2312(data) { var gb2312 = iconv.encode(data.toString(’UCS2’), ’GB2312’); var gb2312Hex = ; 不然结果是不对的

如何在vb中将汉字转化成unicode


VB本身就是使用Unicode编码格式的,只要能在VB中正常显示出来的字符串都肯定是Unicode编码的。如果要把ANSI格式的字符串(在VB直接显示会出现乱码)转化为Unicode,可以这样(假定变量s储存的就是要转换的字符串):
s = StrConv(s, vbUnicode)

VB中如何将汉字转换为Unicode代码


回答补充: 用Chr()函数把ascii码转化成汉字
用ChrW()函数把Unicode码转化成汉字
(还有之前说的
AscW()函数返回值为负的时候,应加上65536 才得到汉字实际的Unicode码)
----------------------------------------------------------------------------------------
求汉字的Unicode代码 用AscW()函数
AscW(“汉“)=27721
求汉字的ASCII码 用Asc()函数 返回一个负数值
如Asc(“汉“)=-17734
PS:PS:改进了下 可转化多个汉字
在窗体上建三个text控件,
功能:text1中按个输入汉字后 text2中按个显示汉字的Unicode代码 text3中显示汉字的ASCII码
原代码如下:
Private Function change(s As String) As String
change = AscW(s)
If change 《 0 Then
change = change + 65536
End If
End Function
Private Function change2(s As String) As String
change2 = Asc(s)
End Function
Private Sub Text1_Change()
For i = 1 To Len(Text1.Text)
s = s & change(Mid(Text1.Text, i, 1)) & “ “
Next
Text2.Text = s
s = ““
For i = 1 To Len(Text1.Text)
s = s & change2(Mid(Text1.Text, i, 1)) & “ “
Next
Text3.Text = s
End Sub
补充:a 的ASCII码是97
Asc函数返回的是字符串首字母的ASCII码(如字符串只一个字符,即返回该字符的ASCII码)
Asc 函数
返回一个 Integer,代表字符串中首字母的字符代码。
语法
Asc(string)
必要的 string 参数可以是任何有效的字符串表达式。如果 string 中没有包含任何字符,则会产生运行错误
PSPS: VB里 目前我还没找到能将之转换成 把汉字转换成西欧文编码的函数 不敢断言没有(有估计也很难找 我搜了好多关键字都没找到)
还有 不只是遨游浏览器,一般的IE浏览器 也有此功能
查看——编码——其他——最下面那小三角号——西欧(ISO)

如何把中文转换为UNICODE


loads取出后是unicode?我怀疑你用的是python3

通常python2时所有IO读写都是byte方式。也就是编码后的。java也是这样子。只有python3还有某些特定的模块才会自动将byte重新转换成unicode

在python2里的确可以使用s.decode(’gbk’,’ignore’)之类的变成unicode。不过在python3里应该是这样子, s.encode(’gbk’,’ignore’)这样就变成了byte

如果你喜欢 utf-8,可以s.encode(‘utf-8’,’ignore’)和s.decode(‘utf-8’,’ignore’)

多试试就可以了。 console和文件只支持编码过的字符串。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
相关文章
返回顶部