标签小写拉丁字母

标签小写拉丁字母(Tag Latin Small Letter)是 Unicode Tags 区块(U+E0000–U+E007F)中的一组不可见格式字符,共 26 个,对应小写拉丁字母 az。它们最初用于内嵌语言标签(现已弃用),目前主要用于构成 Emoji 标签序列(Emoji Tag Sequence, ETS),以拼写子区域标识。

基本信息

属性
Unicode 区块 Tags(U+E0000–U+E007F)
平面 第十六平面(Supplementary Special-purpose Plane, SSP)
引入版本 Unicode 3.1(2001年)
字符范围 U+E0061 – U+E007A(对应 a–z)
一般类别 Cf(Format,格式字符)
渲染效果 不可见(零宽度)
现行主要用途 Emoji 标签序列(ETS)的组成单元

码位对照表

该系列字符是 ASCII 字母 a–z(U+0061–U+007A)到标签区块的映射。部分码位如下:

码位 正式名称 对应字母
U+E0061 TAG LATIN SMALL LETTER A a
U+E0062 TAG LATIN SMALL LETTER B b
U+E0063 TAG LATIN SMALL LETTER C c
... ... ...
U+E007A TAG LATIN SMALL LETTER Z z

该区块还包含 TAG SPACE(U+E0020)、TAG DIGIT 0–9(U+E0030–U+E0039)、TAG LATIN CAPITAL LETTER A–Z(U+E0041–U+E005A)及终止符 CANCEL TAG(U+E007F)。

历史与用途演变

  • 原始设计(已弃用):Tags 区块最初用于纯文本内嵌语言标签(以 U+E0001 起始,后接标签字符拼写 BCP 47 语言代码,以 U+E007F 终止)。自 Unicode 5.1 起,此用法被正式弃用。
  • 现行用途:Unicode 8.0/9.0 重新启用该区块(除 U+E0001)用于 Emoji 标签序列。该序列以一个基础 Emoji(如 🏴 黑旗)起始,后接若干标签字母拼写子区域代码(如 gbeng 代表英格兰),最后以 U+E007F 终止。

示例(英格兰旗帜)

🏴 (U+1F3F4) + g (U+E0067) + b (U+E0062) + e (U+E0065) + n (U+E006E) + g (U+E0067) + CANCEL TAG (U+E007F)

支持的系统将渲染为 🏴󠁧󠁢󠁥󠁮󠁧󠁿,不支持的系统则回退显示为 🏴。