Вывод диапазонов Unicode для шрифтов формата TrueType

Диапазон, содержащий символы unicode, используемые некоторым шрифтом, задается битами ‘ulUnicodeRange’ таблицы ‘OS/2′ (если таковая имеется), реализующей побитовое представление диапазона. Эта таблица определена в описании формата TrueType версии 1.66, разработанном компанией Microsoft. Данный диапазон можно охарактеризовать набором определенных элементов, каждому из которых в соответствие можно поставить множество символов Unicode 1.1, а наличие некоторого элемента в наборе можно будет интерпретировать как наличие в шрифте одного или нескольких отображаемых глифов, используемых для представления хотя бы одного символа из множества, соответствующего данному элементу. Упомянутый набор состоит из 128 элементов, как описано ниже. Порядок их следования обычно заимствуется из стандарта Unicode 1.1. Эта таблица может использоваться для преобразования информации, представленной в формате TrueType, в дескрипторе ‘unicode-range’ каскадной таблицы стилей.

Мн-во Плюс Русскоязычное название множества Англоязычное название множества Диапазон Unicode
0 1 Основная латиница Basic Latin U+0-7F
1 2 Латиница-1 Latin-1 Supplement U+80-FF
2 4 A. Расширение Латиницы-1 Latin-1 Extended-A U+100-17F
3 8 B. Расширение Латиницы-1 Latin Extended-B U+180-24F
4 1 Дополнения из международного алфавита фонетических символов IPA Extensions U+250-2AF
5 2 Символы изменения пробела Spacing Modifier Letters U+2B0-2FF
6 4 Диакритические знаки Diacritical Marks U+300-36F
7 8 Основной греческий Greek U+370-3CF
8 1 Символы греческого и коптского языков Greek Symbols and Coptic U+3D0-3EF
9 2 Кириллица Cyrillic U+400-4FF
10 4 Армянский язык Armenian U+530-58F
11 8 Иврит Hebrew U+590-5FF
12 1 A. Расширение иврита Hebrew Extended-A ?? диапазон ??
B. Расширение иврита Hebrew Extended-B
13 2 Арабский язык Arabic U+600-69F
14 4 Расширенный арабский язык Arabic Extended U+670-6FF
15 8 Деванагари (Индийское слоговое письмо) Devanagari U+900-97F
16 1 Бенгальский язык Bengali U+980-9FF
17 2 Гурмукхи Gurmukhi U+A00-A7F
18 4 Гуярати Gujarati U+A80-AFF
19 8 Язык ория (Индия) Oriya U+B00-B7F
20 1 Тамильский язык Tamil U+B80-BFF
21 2 Язык телугу Telugu U+C00-C7F
22 4 Каннада (дравидийский язык Южной Индии) Kannada U+C80-CFF
23 8 Малайский язык Malayalam U+D00-D7F
24 1 Тайский язык Thai U+E00-E7F
25 2 Лаосский язык Lao U+E80-EFF
26 4 Грузинский язык Georgian U+10A0-10EF
27 8 Расширенный грузинский язык Georgian Extended U+10F0-10FF ??
28 1 Хангул (корейская азбука) Hangul Jamo U+1100-11FF
29 2 Расширенная латиница (дополнение) Latin Extended Additional -
30 4 Расширенный греческий Greek Extended U+1F00-1FFF
31 8 Знаки пунктуации нижние индексы Superscripts and Subscripts -
33 2 Денежные знаки Currency Symbols U+20A0-20CF
34 4 Элементы группировки для символов Combining Marks for Symbols U+20D0-20FF
35 8 Буквенные символы Letterlike Symbols U+2100-214F
36 1 Числовые символы Number Forms U+2150-218F
37 2 Стрелки Arrows U+2190-21FF
38 4 Математические операторы Mathematical Operators U+2200-22FF
39 8 Различные технические символы Miscellaneous Technical U+2300-23FF
40 1 Управляющая графика Control Pictures U+2400-243F
41 2 Оптически распознаваемые символы Optical Character Recognition U+2440-245F
42 4 Встроенный буквенно- цифровой индикатор Enclosed Alphanumerics U+2460-24FF
43 8 Символы рамок Box Drawing U+2500-257F
44 1 Элементы диаграмм Block Elements U+2580-259F
45 2 Геометрические фигуры Geometric Shapes U+25A0-25FF
46 4 Различные символы Miscellaneous Symbols U+2600-26FF
47 8 Символы графической разметки текста Dingbats U+2700-27BF
48 1 Символы и знаки пунктуации японского, корейского и китайского языков CJK Symbols and Punctuation U+3000-303F
49 2 Хирагана Hiragana U+3040-309F
50 4 Катакана Katakana U+30A0-30FF
51 8 Бопомофо Bopomofo U+3100-312F
52 1 Символы, совместимые с языком хангул Hangul Compatibility Jamo U+3130-318F
53 2 Различные символы японского, корейского и китайского языков CJK Miscellaneous ?? Диапазон ??
54 4 Буквы и символы месяцев японского, корейского и китайского языков Enclosed CJK Letters and Months U+3200-32FF
55 8 Символы, совместимые с грамматикой японского, корейского и китайского языков CJK compatibility U+3300-33FF
56 1 Хангул Hangul U+AC00-D7FF
59 8 Обобщенные идеографы японского, корейского и китайского языков CJK Unified Ideographs U+4E00-9FFF
60 1 Область личных символов Private Use Area U+E000-F8FF
61 2 Идеографы, совместимые с грамматикой японского, корейского и китайского языков CJK Compatibility Ideographs U+F900-FAFF
62 4 Формы для создания алфавитного списка Alphabetic Presentation Forms U+FB00-FB4F
63 8 A. Формы для представления арабских символов Arabic Presentation Forms-A U+FB50-FDFF
64 1 Неполные элементы группировки Combining Half Marks U+FE20-FE2F
65 2 Формы, совместимые с грамматикой японского, корейского и китайского языков CJK compatibility Forms U+FE30-FE4F
66 4 Разновидности мелких форм Small Form Variants U+FE50-FE6F
67 8 B. Формы для представления арабских символов Arabic Presentation Forms- U+FE70-FEFF
68 1 Специальные символы Specials U+FFF0-FFFD

Один из недостатков формата TrueType состоит в том, что его система побитового представления привязана к Unicode 1.1 и не может работать с его расширениями. Например, с ее помощью невозможно отобразить символы тибетского языка или других систем письменности, представленных в Unicode версии 2.0 и выше.

Рубрика: CSS

Добавить комментарий

Вам надо войти, чтобы написать комментарий.