DBCS
Двоба́йтовий набі́р си́мволів або DBCS (англ. double-byte character set) - стандартна таблиця для кодування символів.
Термін має два базових значення:
- В ІТ індустрії Китаю, Японії, Кореї, термін «DBCS» зазвичай означає набір символів, в якому будь-який графічний символ, не представлений в SBCS (наборі однобайтних символів), закодований у двох байтах. Під графічними символами тут розуміються, в основному, ієрогліфи.
- Термін «DBCS» також означає набір символів, в якому всі символи (включаючи керуючі), закодовані в двох байтах.
Приклади DBCS кодування
- Розширення національного стандарту GBK. Це розширення доповнює національний «Промисловий стандарт GB», доповнений стандарт включає 20902 визначених у Unicode символів Хан і додаткові символи DBCS, визначені в коді Big-5 (стандарт де-факто традиційної китайської мови для ПК). Такий стандарт GBK містить всі символи DBCS, застосовувані в КНР і на Тайвані. В даний час GBK визнаний нормативним доповненням стандарту GB13000 (КНР стандарт Unicode) і розглядається як проміжна ланка для переходу до Unicode.
- IBM- eucTW. EUC для традиційного китайського мови - це кодовий набір, що складається з одно- , двох - і чотирьохбайтових символів. Дане кодування EUC заснована на стандарті ISO2022, стандарті CNS, визначеному в Китаї, і визначеннях мультибайтних символів, унікальних для виробника.
Стандарт CNS кодує 13501 символ китайської мови і 684 додаткових знаки. IBM-eucTW містить 15 кодових таблиць по 8836 ( 94x94 ) символів кожна. Кодові значення лежать в інтервалі 0xa1a1 - 0xfefe. В даний час тільки 4 таблиці кодують символи, а решта зарезервовані для використання в майбутньому.
- Двобайтні символи набору IBM-943[1]
Див. також
- Юнікод
- JIS X 0213
Примітки
- ↑ Кодовые наборы - Обзор [Архівовано 25 травня 2013 у Wayback Machine.](рос.)
- п
- о
- р
Кодування символів
- абетка
- текст
- набір символів
- конверсія
кодування
8-бітове
подання
- символи
- ASCII
- не-ASCII
- 8-бітові код.стор.
- кирилиця
- КОІ-8
- Основне кодування
- MacCyrillic
- Windows
- 1250
- 1251 (кир.)
- 1252
- 1253
- 1254
- 1255
- 1256
- 1257
- 1258
- WGL4
- IBM & DOS
- 437
- 850
- 852
- 855
- 866 «альт.»
- МІК
- інтерфейс користувача
- розкладка клавіатури
- локаль
- новий рядок
- шрифт
- транслітерація
- нестандартні шрифти
- iconv
- recode