URN Logo
UNIX Resources » Linux » China Linux Forum » C/C++编程版 » 49 » Unicode 到底用了几个字节?
announcement 声明: 本页内容为中国Linux论坛的内容镜像,文章的版权以及其他所有的相关权利属于中国Linux论坛和相应文章的作者,如果转载,请注明文章来源及相关版权信息。
Resources
China Linux Forum(finished)
Linux Forum(finished)
FreeBSD China(finished)
linuxforum.net
  业界新闻与评论
  自由软件杂谈
  IT 人生
  Linux软件快递
  翻译作坊
  Linux图书与评论
  GNU Emacs/XEmacs
  Linux 中文环境和中文化
  Linux桌面与办公软件
  Linux 多媒体与娱乐版
  自由之窗Mozilla
  笔记本电脑上的Linux
  Gentoo
  Debian 一族
  网络管理技术
  Linux 安装与入门
  WEB服务器和FTP服务器
  域名服务器和邮件服务器
  Linux防火墙和代理服务器应用
  文件及打印服务器
  技术培训与认证
  TI专版
  Linux内核技术
  Linux 嵌入技术
  Linux设备驱动程序
  Linux 集群技术
  LINUX平台数据库
  系统和网络安全
  CPU 与 编译器
  系统计算研究所专栏
  Linux下的GUI软件开发
  C/C++编程版
  PHP 技 术
  Java&jsp技术
  Shell编程技术
  Perl 编 程
  Python 编 程
  XML/Web Service 技术
  永远的Unix
  FreeBSD世界
   
Unicode 到底用了几个字节?
Unicode 到底用了几个字节? - henry1025 [2004-09-19 19:55 | 332 byte(s)]
 
Re: Unicode 到底用了几个字节? - lang2 [2004-09-22 00:15 | 320 byte(s)]
 
Re: Unicode 到底用了几个字节? - komtas [2004-09-20 00:58 | 283 byte(s)]
 
Re: Unicode 到底用了几个字节? - zhangxp [2004-09-21 08:29 | 286 byte(s)]
 
Re: Unicode 到底用了几个字节? - unix [2004-09-21 12:37 | 724 byte(s)]
 
Re: Unicode 到底用了几个字节? - henry1025 [2004-09-27 20:40 | 34 byte(s)]
 
Re: Unicode 到底用了几个字节? - henry1025 [2004-09-21 00:35 | 19 byte(s)]
 
Re: Unicode 到底用了几个字节? - bzImage [2004-09-20 09:27 | 6 byte(s)]
 
Re: Unicode 到底用了几个字节? - mikewang [2004-09-20 00:22 | 11 byte(s)]
 
Re: Unicode 到底用了几个字节? - henry1025 [2004-09-21 00:34 | 6 byte(s)]
 
Subject: Unicode 到底用了几个字节?
Author: henry1025    Posted: 2004-09-19 19:55    Length: 332 byte(s)
[Original] [Print] [Top]
以前我一直认为Unicode是双字节的,但目前看来,Unicode好象是四字节的。

Unicode 4.0标准,目前有70207个汉字。从这点看不可能是双字节。

而网上有些(以前的)资料,说是Unicode是双字节的。且这里有些人也曾说是双字节的。

不知道这是为什么,有人知道原因吗?是不是Unicode标准变过了还是......
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: mikewang    Posted: 2004-09-20 00:22    Length: 11 byte(s)
[Original] [Print] [Top]
1~6 byte(s)
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: komtas    Posted: 2004-09-20 00:58    Length: 283 byte(s)
[Original] [Print] [Top]
unicode可以是两个字节或是4个字节
现在使用的一般是2字节的 通常叫 ucs-2


utf-8长度是1-6个字节
第一个字节的高位1的数目指明了这个utf-8的字符使用的byte数目


-----------------------
welcome to loveunix.net
----
welcome to loveunix.net
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: bzImage    Posted: 2004-09-20 09:27    Length: 6 byte(s)
[Original] [Print] [Top]
这样啊
----
自己动手,丰衣足食
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: henry1025    Posted: 2004-09-21 00:34    Length: 6 byte(s)
[Original] [Print] [Top]
谢谢~~
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: henry1025    Posted: 2004-09-21 00:35    Length: 19 byte(s)
[Original] [Print] [Top]
能否再说得具体一点!
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: zhangxp    Posted: 2004-09-21 08:29    Length: 286 byte(s)
[Original] [Print] [Top]
我也一直很疑惑,网上的一些文章都说得很糊涂。。

unicode可以是两个字节或是4个字节?

utf-8长度是1-6个字节.

unicode与utf8是什么关系?

还有utf16又是什么?

请具体说说。。谢谢。。

----
弃我去者昨日之日不可留,乱我心者今日之日多烦忧!
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: unix    Posted: 2004-09-21 12:37    Length: 724 byte(s)
[Original] [Print] [Top]
实际上只能有1-4个字节,5-6位现阶段是非法的。


80年代晚期,为了统一字符集,出现两个独立的项目,一个是ISO组织的ISO 10646,还有一个就是Unicode。不过1991年两个计划就合并了,不过还保留各自的编码表。

ISO 10646定义UCS(通用字符集).而UCS是所有字符编码的超集。用两个字节编码的UCS叫UCS-2,四个字节的叫UCS-4,UCS使用31位编码,不够21位基本就够了。由于UCS-2和UCS-4与UNIX系统有兼容问题,这样就出现了UTF-8,它理论上可以达到6个字节,它可以表示所有21位Unicode字符。如果要表示21位外的字符(如一些数学,音乐符号)就要用UTF-16。


具体看 http://www.cl.cam.ac.uk/~mgk25/unicode.html
----
Stern des Südens
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: lang2    Posted: 2004-09-22 00:15    Length: 320 byte(s)
[Original] [Print] [Top]
The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)


http://www.joelonsoftware.com/articles/Unicode.html
----
----
Vim 中文文档
http://vimcdoc.sf.net
[Original] [Print] [Top]
Subject: Re: Unicode 到底用了几个字节?
Author: henry1025    Posted: 2004-09-27 20:40    Length: 34 byte(s)
[Original] [Print] [Top]
说得还是很不清楚。能说具体一点吗?
[Original] [Print] [Top]
« Previous thread
算法求解!如何判断一个单向链表是否有环路?
C/C++编程版
49
Next thread »
Cscope问题
     

Copyright © 2007~2009 UNIX Resources Network, All Rights Reserved.      About URN | Privacy & Legal | Help | Contact us
webmaster: webmaster@unixresources.net
This page created on 2009-09-07 16:44:18, cost 0.0209109783173 ms.