Steck
написал 10 мая 2006 года в 18:32 (759 просмотров)
Ведет себя
как мужчина; открыл 125 тем в форуме, оставил 550 комментариев на сайте.
Последние комментарии
- OlegL, 17 декабря в 15:00 → Перекличка 21
- REDkiy, 8 июня 2023 года в 9:09 → Как «замокать» файл для юниттеста в Python? 2
- fhunter, 29 ноября 2022 года в 2:09 → Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt? 6
- Иванн, 9 апреля 2022 года в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
- Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1
ecobeing.ru
Экология и вегетарианство на благо всем живым существам Планеты.
UTF-8 двубайтная кодировка…
хотя странно, что 102 а не 110…
чего куримши?
UTF-8 — многобайтная кодировка. с USC-2, (Что-то вроде UTF-16) не спутал? :)
иди читай про UTF-8.
вкратце: цифры и английские буквы кодируются одним символом.
русские — двумя символами.
японские иероглифы — тремя.
что-то может и 4мя…
жаль, нельзя продемонстрировать — форум в cp1251 и потеряет другие символы
utf не двух байтная. разные символы кодируются разным числом байт. вся кириллица, например, по два байта, а ascii символы — они по одному.
попробуй сказать так:
в koi8-r терминале.
Кодируется по кол-ву старших единичных бит в 1-ом байте. Если 0xxxxxxx, то 1 байт 0..127, 10xxxxxx xxxxxxxx — 128 до 128+16384, и так далее…
/me посмотрел на это все и ушел курить man’ы