标签小写拉丁字母(Tag Latin Small Letter)是 Unicode Tags 区块(U+E0000–U+E007F)中的一组不可见格式字符,共 26 个,对应小写拉丁字母 a–z。它们最初用于内嵌语言标签(现已弃用),目前主要用于构成 Emoji 标签序列(Emoji Tag Sequence, ETS),以拼写子区域标识。
基本信息
| 属性 | 值 |
|---|---|
| Unicode 区块 | Tags(U+E0000–U+E007F) |
| 平面 | 第十六平面(Supplementary Special-purpose Plane, SSP) |
| 引入版本 | Unicode 3.1(2001年) |
| 字符范围 | U+E0061 – U+E007A(对应 a–z) |
| 一般类别 | Cf(Format,格式字符) |
| 渲染效果 | 不可见(零宽度) |
| 现行主要用途 | Emoji 标签序列(ETS)的组成单元 |
码位对照表
该系列字符是 ASCII 字母 a–z(U+0061–U+007A)到标签区块的映射。部分码位如下:
| 码位 | 正式名称 | 对应字母 |
|---|---|---|
| U+E0061 | TAG LATIN SMALL LETTER A | a |
| U+E0062 | TAG LATIN SMALL LETTER B | b |
| U+E0063 | TAG LATIN SMALL LETTER C | c |
| ... | ... | ... |
| U+E007A | TAG LATIN SMALL LETTER Z | z |
该区块还包含
TAG SPACE(U+E0020)、TAG DIGIT 0–9(U+E0030–U+E0039)、TAG LATIN CAPITAL LETTER A–Z(U+E0041–U+E005A)及终止符CANCEL TAG(U+E007F)。
历史与用途演变
- 原始设计(已弃用):Tags 区块最初用于纯文本内嵌语言标签(以
U+E0001起始,后接标签字符拼写 BCP 47 语言代码,以U+E007F终止)。自 Unicode 5.1 起,此用法被正式弃用。 - 现行用途:Unicode 8.0/9.0 重新启用该区块(除
U+E0001)用于 Emoji 标签序列。该序列以一个基础 Emoji(如 🏴 黑旗)起始,后接若干标签字母拼写子区域代码(如gbeng代表英格兰),最后以U+E007F终止。
示例(英格兰旗帜):
🏴 (U+1F3F4) + g (U+E0067) + b (U+E0062) + e (U+E0065) + n (U+E006E) + g (U+E0067) + CANCEL TAG (U+E007F)
支持的系统将渲染为 🏴,不支持的系统则回退显示为 🏴。