V2EX  ›  英汉词典

UTF-16

释义 Definition

UTF-16(16 位 Unicode 转换格式)是一种把 Unicode 字符编码为16 位代码单元(code unit)序列的字符编码方式。它对常用字符通常用 1 个 16 位单元表示;对超出基本多文种平面(BMP)的字符(如部分表情符号、罕见文字)会用代理项对(surrogate pair)2 个 16 位单元
(注:UTF-16 还有大小端之分:UTF-16LE / UTF-16BE,常可用 BOM 标记字节序。)

发音 Pronunciation (IPA)

/ˌjuːtiːˈɛf sɪksˈtiːn/

例句 Examples

The file is encoded in UTF-16.
这个文件使用 UTF-16 编码。

If you read the text as UTF-8 but it’s actually UTF-16, you may see garbled characters or errors.
如果你把文本按 UTF-8 去读取,但它其实是 UTF-16,就可能出现乱码或报错。

词源 Etymology

UTFUnicode Transformation Format(Unicode 转换格式)的缩写;16 表示它以 16 位为基本编码单位。UTF-16 的设计目标之一是让大量常用字符能以固定宽度的 16 位单元高效表示,同时也能通过代理项机制覆盖全部 Unicode 码位。

相关词 Related Words

文献与作品 Notable Works

  • The Unicode Standard(《Unicode 标准》):对 UTF-16 的编码形式、代理项等有权威说明。
  • RFC 2781: UTF-16, an encoding of ISO 10646:描述 UTF-16 与 ISO/IEC 10646 的关系与细节。
  • W3C / WHATWG 相关规范(如 Encoding Standard):在 Web 编码处理语境中提及 UTF-16(常与 UTF-8、UTF-16LE 等一起出现)。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2052 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 7ms · UTC 10:10 · PVG 18:10 · LAX 02:10 · JFK 05:10
♥ Do have faith in what you're doing.