半形及全形字符 (Unicode區段)

半形及全形字符
Halfwidth and Fullwidth Forms
範圍U+FF00..U+FFEF
(240個碼位)
平面基本多文種平面BMP
文字谚文(52 个字符)
片假名(55 个字符)
拉丁文字(52 个字符)
普通(66 char.)
符號系列异体宽度字符
已分配225個碼位
未分配15個保留碼位
統一碼版本歷史
1.0.0216 (+216)
1.0.1223 (+7)
3.2225 (+2)
註釋[1][2][3]

半形及全形字符是 Unicode 基本多文种平面内的最后第二个区段,范围包括 U+FF00..U+FFEF。本区段包含全形和半形字符以便可以无损从旧编码系统转换至 Unicode。该区段于 Unicode 1.0 的旧称为 半形及全形变体(Halfwidth and Fullwidth Variants)。[4]

U+FF01..U+FF5E 编码了 ASCII 内 21 至 7E 的全形版本。U+FF00 未对应 ASCII 20 (空格)字符,该字符已经由 IDEOGRAPHIC SPACE 表意空格取代。

U+FF65..U+FF9F 编码了JIS X 0201 内的半形片假名——参见半形假名

U+FFA0..U+FFDC 编码了谚文KS C 5601 1974年版的諺文兼容字母。其对应的字符用于 IBM 的韩文编码页 933,其中包括 Shift In 和 Shift Out 的字符以对应双字节编码。[5]基于双字节编码可能包括兼容字母,本区段包含了部分半形变体以便可以无损从 KS C 5601 转码至 Unicode。[6][7]

U+FFE0..U+FFEE 编码了全形及半形符号。

码表

半形及全形字符
Halfwidth and Fullwidth Forms
[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FF0x
U+FF1x
U+FF2x
U+FF3x _
U+FF4x
U+FF5x
U+FF6x
U+FF7x ソ
U+FF8x
U+FF9x
U+FFAx  HW 
HF
U+FFBx
U+FFCx
U+FFDx
U+FFEx
注解
1.^ 依据 Unicode 13.0
2.^ 灰色区域指未分配码位

异体字选择器

本区段包含部分标点位置的异体字选择器[8][9] 其中使用了 U+FE00 VARIATION SELECTOR-1 (VS01) 及 U+FE01 VARIATION SELECTOR-2 (VS02):

标点符号位置变体
U+ FF01 FF0C FF0E FF1A FF1B FF1F 位置
基本字符
基本字符 + VS01 !︀ ,︀ .︀ :︀ ;︀ ?︀ 左下角
基本字符 + VS02 !︁ ,︁ .︁ :︁ ;︁ ?︁ 置中

该规范也定义了 U+FF10 全宽数字〇另加短斜线:U+FE00 VS1(0︀)。[10][9]

历史

以下的Unicode相關檔案記錄了本區域中出現之字符的提議及定稿。

Unicode
版本
最終碼位[a] 碼位數 L2 ID WG2 ID 文檔
1.0.0 U+FF01..FF5E, FF61..FFBE, FFC2..FFC7, FFCA..FFCF, FFD2..FFD7, FFDA..FFDC, FFE0..FFE6 216 (to be determined)
N4403 (pdf, doc (页面存档备份,存于互联网档案馆)) Umamaheswaran, V. S., Resolution M61.01, Unconfirmed minutes of WG 2 meeting 61, Holiday Inn, Vilnius, Lithuania; 2013-06-10/14, 2014-01-28 
L2/17-056 Lunde, Ken, Proposal to add standardized variation sequences, 2017-02-13 
L2/17-436 Lunde, Ken, Proposal to add standardized variation sequences for fullwidth East Asian punctuation, 2018-01-21 
L2/18-039 Anderson, Deborah; Whistler, Ken; Pournader, Roozbeh; Moore, Lisa; Liang, Hai; Cook, Richard, 24. Fullwidth East Asian Punctuation, Recommendations to UTC #154 January 2018 on Script Proposals, 2018-01-19 
L2/17-362 Moore, Lisa, B.4.1 New Proposal to add standardized variation sequence for U+FF10 FULL WIDTH DIGIT ZERO, UTC #153 Minutes, 2018-02-02 
L2/18-115 Moore, Lisa, Consensus 154-C17, UTC #155 Minutes, 2018-05-09, Add 16 standardized variation sequences based on L2/17-436R, for Unicode 12.0. 
L2/19-055 Iancu, Laurențiu, Proposed Changes in the Segmentation Property Values for Fullwidth Digits, 2019-01-14 
L2/19-008 Moore, Lisa, B.11.11.1.2 Proposed changes in the segmentation property values for fullwidth digits, UTC #158 Minutes, 2019-02-08 
1.0.1 U+FFE8..FFEE 7 (to be determined)
3.2 U+FF5F..FF60 2 L2/99-052 Freytag, Asmus, The math pieces from the symbol font, 1999-02-05 
L2/01-033 Karlsson, Kent; Freytag, Asmus, Disunify braces/brackets for math, computing science, and Z notation from similar-looking CJK braces/brackets, 2001-01-16 
L2/01-159 N2344 (页面存档备份,存于互联网档案馆 Ad-hoc report on Mathematical Symbols, 2001-04-03 
L2/01-157 N2345R (页面存档备份,存于互联网档案馆 Karlsson, Kent, Proposal to disunify certain fencing CJK punctuation marks from similar-looking Math fences, 2001-04-04 
L2/01-168 Whistler, Ken, Bracket Disunification & Normalization Hell, 2001-04-10 
L2/01-012R Moore, Lisa, Disunifying Braces and Brackets, Minutes UTC #86 in Mountain View, Jan 2001, 2001-05-21 
L2/01-223 Suignard, Michel, Discussion of Issues Regarding Bracket Disunification, 2001-05-23 
L2/01-184R Moore, Lisa, Motion 87-M21, Minutes from the UTC/L2 meeting, 2001-06-18, Reverse the decision made in motion 86-M6 not to disunify brackets. 
L2/01-317 Suignard, Michel, Bracket Disunification & Normalization, 2001-08-14 
L2/01-295R Moore, Lisa, Bracket Disunification and Normalization, Minutes from the UTC/L2 meeting #88, 2001-11-06 
L2/02-154 N2403 (页面存档备份,存于互联网档案馆 Umamaheswaran, V. S., Resolution M41.1, Draft minutes of WG 2 meeting 41, Hotel Phoenix, Singapore, 2001-10-15/19, 2002-04-22 
  1. ^ 提案中建议的码位可能与最终码位不同。

另见

參見

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始内容存档 (PDF)于2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-07-10). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29). 
  4. ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. version 1.0. Unicode Consortium. [2021-02-04]. (原始内容存档 (PDF)于2021-02-11). 
  5. ^ ICU Demonstration - Converter Explorer. demo.icu-project.org. [7 May 2018]. 
  6. ^ 存档副本. [2021-02-04]. (原始内容存档于2021-02-16). 
  7. ^ 存档副本. [2021-02-04]. (原始内容存档于2021-01-16). 
  8. ^ Lunde, Ken. L2/17-436: Proposal to add standardized variation sequences for fullwidth East Asian punctuation (PDF). 2018-01-21 [2021-02-04]. (原始内容存档 (PDF)于2020-01-31). 
  9. ^ 9.0 9.1 Unicode Character Database: Standardized Variation Sequences. The Unicode Consortium. [2021-02-04]. (原始内容存档于2021-02-09). 
  10. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray. L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set (PDF). 2015-10-30 [2021-02-04]. (原始内容存档 (PDF)于2016-10-21). 
区块名码位数已使用编码范围 平面统一化英语Han unification包含文字

20,992



6,592
42,720






4,160
224
5,776
7,488
4,944
4,192
624
128
224
16
64
48
256
256
512
32
256
544

20,992



6,592
42,720






4,154
222
5,762
7,473
4,939
4,192
622
115
214
12
64
36
255
256
472
32
64
542

4E00–62FF
6300–77FF
7800–8CFF
8D00–9FFF
3400–4DBF
20000–215FF
21600–230FF
23100–245FF
24600–260FF
26100–275FF
27600–290FF
29100–2A6DF
2A700–2B73F
2B740–2B81F
2B820–2CEAF
2CEB0–2EBEF
30000–3134F
31350–323AF
2EBF0–2EE5F
2E80–2EFF
2F00–2FDF
2FF0–2FFF
3000–303F
31C0–31EF
3200–32FF
3300–33FF
F900–FAFF
FE30–FE4F
1F200–1F2FF
2F800–2FA1F

1/4
2/4
3/4
4/4

1/7
2/7
3/7
4/7
5/7
6/7
7/7

0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
3 TIP
3 TIP
2 SIP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
1 SMP
2 SIP

已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
未统一
未统一
未统一
未统一
未统一
未统一
未统一
12个已统一
未统一
未统一
未统一

汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
通用
汉字、谚文、通用、继承
通用
片假名、谚文、通用
片假名、通用
汉字
通用
平假名、通用
汉字

总计99,42499,108   92,865 
  1. ^ 統一碼版本15.0
  2. ^ “〇”位于此区块,因而未统一化
文字
欧洲文字Ⅰ
現代文字與儀式文字
拉丁(基本 · 補充 · 擴展-A · 擴展-B · 擴展-C · 擴展-D · 擴展-E · 擴展-F · 擴展-G · 擴展附加 · 連字 · 國際音標擴展 · 音標擴展 · 音標擴展補充 · 希臘和科普特擴展 · 數字) · 科普特 · 西里爾(補充 · 擴展-A · 擴展-B · 擴展-C · 擴展-D · 格拉哥里(補充 · 亞美尼亞(連字 · 格鲁吉亚(擴展 · 補充
修飾符號(聲調 · 佔位 · 上下標 · 組合附加符號扩展 · 补充 · 符号用 · 组合半符号
欧洲文字Ⅱ
古代文字與其他文字
線形文字A · 線形文字B(音節 · 表意 · 數字) · 賽普勒斯 · 賽普勒斯-米諾斯 · 古安納托利亞(呂基亞 · 卡里亚 · 呂底亞) · 古義大利 · 盧恩 · 古匈牙利 · 哥特 · 愛爾巴桑 · 高加索阿爾巴尼亞 · 維斯庫奇 · 古彼爾姆 · 歐甘 · 蕭伯納
中东文字Ⅰ
現代文字與儀式文字
希伯來(表達形式 · 阿拉伯(補充 · 擴展-A · 擴展-B · 擴展-C · 表達形式-A · 表達形式-B · 敘利亞(補充 · 撒瑪利亞 · 曼達安 · 雅茲迪
中东文字Ⅱ
古代文字
古北阿拉伯 · 古南阿拉伯 · 腓尼基 · 帝國亞蘭英语Imperial Aramaic (Unicode block) · 摩尼 · 碑刻帕提亞英语Inscriptional Parthian (Unicode block) · 碑刻巴列維英语Inscriptional Pahlavi (Unicode block) · 詩篇巴列維英语Psalter Pahlavi (Unicode block) · 阿維斯陀 · 花剌子模 · 埃利邁 · 納巴泰 · 巴尔米拉 · 哈特拉
楔形文字與象形文字
楔形文字(數字和標點 · 早期王朝) · 烏加里特 · 古波斯 · 埃及聖書體(格式控制 · 麥羅埃文(草書體 · 聖書體) · 安納托利亞象形
南亞和中亞文字Ⅰ
印度官方文字
天城(擴展 · 擴展-A · 吠陀擴展 · 孟加拉 · 古木基 · 古吉拉特 · 奧里亞 · 泰米爾 (补充)  · 泰盧固 · 卡納達 · 馬拉雅拉姆
南亞和中亞文字II
其他現代文字
它拿 · 僧伽羅(古數字) · 尼瓦爾 · · 蒙古(補充 · 林布 · 梅泰(擴展 · 默禄 · 瓦蘭齊地 · 桑塔利 · 查克馬 · 絨巴 · 索拉什特拉 · 馬薩拉姆貢德 · 貢賈爾貢德 · 文喬 · 投投 · 唐薩 · 蒙達里
南亞和中亞文字Ⅲ
古代文字
婆羅米 · 佉盧 · 拜克舒基 · 八思巴 · 玛钦 · 札那巴札尔方形 · 索永布 · 古突厥 · 古粟特 · 粟特 · 回鶻
南亞和中亞文字Ⅳ
其他歷史文字
錫爾赫特 · 凱提 · 夏拉達 · 塔克里 · 悉曇 · 馬哈賈尼 · 科傑基 · 庫達瓦迪 · 木爾坦 · 底羅僕多 · 莫迪 · 南迪城文 · 古蘭塔 · 迪維希阿庫魯 · 阿洪姆 · 索拉僧平 · 多格拉
东南亚文字
 · 老挝 · 緬甸(擴展-A · 擴展-B · 高棉(符號 · 傣纳 · 新傣仂 · 老傣仂 · 傣越 · 克耶 · · 救世苗 · 創世紀苗 · 包钦豪 · 哈乃斐羅興亞
印尼和大洋洲文字
菲律賓(他加祿 · 哈努諾 · 布希德 · 塔格班瓦) · 卡維 · 布吉 · 巴厘 · 爪哇 · 勒姜 · 巴塔克 · 巽他(補充 · 望加錫
东亚文字
汉字(擴展-A · 擴展-B · 擴展-C · 擴展-D · 擴展-E · 擴展-F · 擴展-G · 擴展-H · 擴展-I · 兼容 · 兼容補充 · 部首 · 部首補充 · 筆畫 · 漢文訓讀 · 表意文字符號和標點 · 表意文字描述字符 · 注音(擴展) · 假名(平假名 · 片假名 · 语音擴展 · 補充 · 擴展-A · 擴展-B · 小型假名 · 半形全形 · 諺文(擴展-A · 擴展-B · 兼容 · 諺文音節 · 部首 · 女書 · 傈僳(補充 · 柏格理苗 · 西夏(部件 · 補充 · 契丹小字
非洲文字
埃塞俄比亚(補充 · 擴展 · 擴展-A · 擴展-B · 奧斯曼亞 · 提非納 · 西非 · 瓦伊 · 巴穆姆 (補充 · 巴薩 · 門地奇卡奎 · 阿德拉姆 · 梅德法伊德林
美洲文字
切羅基(補充 · 加拿大原住民(擴展 · 擴展-A · 歐塞奇 · 德瑟雷特
符号
標記系統
盲文圖案 · 音樂符號(拜占庭 · 茲納緬尼耶 · 古希臘) · 迪普卢瓦耶速记(格式控制) · 萨顿手语谱写
标点符号
一般標點(ASCII · 拉丁-1 · 補充 · 中日韓符號和標點表意文字 · CJK兼容(半形全形 · 小寫變體 · 豎排)
字母数字符号
类字母(羅馬符號) · 数学 · 阿拉伯数学 · 帶圈補充 · CJK帶圈補充 · CJK兼容
技术符号
数字
ASCII數字(全形) · 通用印度 · 科普特閏餘 · 算籌 · 楔形文字 · 印度西亞格 · 因努伊特 · 瑪雅 · 數字形式 · 奧斯曼西亞格 · 魯米 · 古僧伽羅 · 上下標
数学符号
箭頭(補充-A · 補充-B · 補充-C · 雜項和箭頭 · 数学字母数字符号(阿拉伯数学 · 字母式 · 數學運算符(補充 · 雜項數學-A · 雜項數學-B · 幾何圖形(擴展 · 製表符 · 方塊元素
绘文字与象形
什錦(裝飾符號) · 表情 · 雜項 · 雜項和圖符 · 補充和圖符 · 擴展-A · 交通地圖
其他符號
鍊金術 · 古代符號 · 貨幣 · 游戏符号(國際象棋和國際跳棋 · 棋類 · 多米諾 · 麻將 · 撲克 · 花色) · 雜項和箭頭 · 遗留計算 · 易經符號(兩儀四象八卦 · 六十四卦 · 太玄經) · 斐斯托斯圓盤
其他
特殊 · 標籤 · 变体选择符(补充 · 私用區(補充私用區-A · 補充私用區-B) · 代用區(高代用區 · 低代用區) · 非字符