URN Logo
UNIX Resources » Linux » China Linux Forum » CPU 与 编译器 » 4 » UTF-16编码会不会更适合RISC机器?
announcement 声明: 本页内容为中国Linux论坛的内容镜像,文章的版权以及其他所有的相关权利属于中国Linux论坛和相应文章的作者,如果转载,请注明文章来源及相关版权信息。
Resources
China Linux Forum(finished)
Linux Forum(finished)
FreeBSD China(finished)
linuxforum.net
  业界新闻与评论
  自由软件杂谈
  IT 人生
  Linux软件快递
  翻译作坊
  Linux图书与评论
  GNU Emacs/XEmacs
  Linux 中文环境和中文化
  Linux桌面与办公软件
  Linux 多媒体与娱乐版
  自由之窗Mozilla
  笔记本电脑上的Linux
  Gentoo
  Debian 一族
  网络管理技术
  Linux 安装与入门
  WEB服务器和FTP服务器
  域名服务器和邮件服务器
  Linux防火墙和代理服务器应用
  文件及打印服务器
  技术培训与认证
  Linux内核技术
  Linux 嵌入技术
  Linux设备驱动程序
  Linux 集群技术
  LINUX平台数据库
  系统和网络安全
  CPU 与 编译器
  系统计算研究所专栏
  Linux下的GUI软件开发
  C/C++编程版
  PHP 技 术
  Java&jsp技术
  Shell编程技术
  Perl 编 程
  Python 编 程
  XML/Web Service 技术
  永远的Unix
  FreeBSD世界
   
UTF-16编码会不会更适合RISC机器?
Author: gogoliu    Posted: 2006-08-05 12:55    Length: 851 byte(s)
[Original] [Print] [Top]
现在UNICODE编码有3种:UTF-8、UTF-16和UTF-32,各编码对UNICODE的表示所用字节数如下:

UNICODE代码点 UTF-8字节数 UTF-16字节数 UTF-32字节数
U+0000..U+007F 一个字节 两个字节 四个字节
U+0080..U+07FF 两个字节 两个字节 四个字节
U+0800..U+D7FF, U+E000..U+FFFF 三个字节 两个字节 四个字节
U+10000..U+10FFFF 四个字节 四个字节 四个字节

RISC CPU访存一般要求4字节对齐,而UTF-8表示UNICODE是变长的,一二三四个字节都有可能,
这样一来RISC CPU在处理UTF-8编码时速度必然有所降低,而UTF-16由于只采用两个或四个字节表
示UNICODE,这样对RISC CPU访存的影响会比UTF-8少,而在存储空间要求上又比UTF-32少。
因此我们是不是可以说,UTF-16更适合RISC机器呢?
----
killall 眼高手低 用心浮躁 浅尝辄止
[Original] [Print] [Top]
« Previous thread
编译文件能不能再细化到函数级别?
CPU 与 编译器
4
Next thread »
打听一下,这里有人写过汇编器没?
     

Copyright © 2007 UNIX Resources Network, All Rights Reserved.      About URN | Privacy & Legal | Help | Contact us
备案序号: 京ICP备05006143    webmaster: webmaster@unixresources.net
This page created on 2008-07-17 03:47:13, cost 0.051676034927368 ms.