UTF-32 是一种 Unicode 字符编码(Unicode Transformation Format, 32-bit),用 固定 4 个字节(32 位) 来表示每个 Unicode 码点。它的优点是“定长、索引方便”,缺点是 占用空间大,因此在存储与传输中不如 UTF-8 常见,但在某些内部处理场景会用到。(也存在字节序相关变体:UTF-32LE / UTF-32BE。)
/ˌjuːtiːˈɛf ˌθɜːrti ˈtuː/
The file is encoded in UTF-32.
这个文件使用 UTF-32 编码。
Because UTF-32 uses four bytes per code point, it simplifies indexing but greatly increases storage size compared with UTF-8.
由于 UTF-32 每个码点占用四个字节,它让索引更简单,但与 UTF-8 相比会显著增加存储空间。
UTF-32 来自 Unicode Transformation Format(Unicode 转换格式)这一命名体系,后缀 “32” 表示采用 32 位 的编码单元;其设计目标之一是用定长编码减少处理复杂度,但代价是更高的空间消耗。