Steck
написал 10 мая 2006 года в 18:32 (848 просмотров)
Ведет себя
как мужчина; открыл 125 тем в форуме, оставил 550 комментариев на сайте.
Последние комментарии
-
OlegL, 17 декабря 2023 года в 15:00 →
Перекличка
21
-
REDkiy, 8 июня 2023 года в 9:09 →
Как «замокать» файл для юниттеста в Python?
2
-
fhunter, 29 ноября 2022 года в 2:09 →
Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt?
6
-
Иванн, 9 апреля 2022 года в 8:31 →
Ассоциация РАСПО провела первое учредительное собрание
1
-
Kiri11.ADV1, 7 марта 2021 года в 12:01 →
Логи catalina.out в TomCat 9 в формате JSON
1
DevOps as a Service from Palark
24/7 SRE & DevOps service to cover all your Kubernetes needs.

UTF-8 двубайтная кодировка…
хотя странно, что 102 а не 110…
чего куримши?
UTF-8 — многобайтная кодировка. с USC-2, (Что-то вроде UTF-16) не спутал? :)
иди читай про UTF-8.
вкратце: цифры и английские буквы кодируются одним символом.
русские — двумя символами.
японские иероглифы — тремя.
что-то может и 4мя…
жаль, нельзя продемонстрировать — форум в cp1251 и потеряет другие символы
utf не двух байтная. разные символы кодируются разным числом байт. вся кириллица, например, по два байта, а ascii символы — они по одному.
попробуй сказать так:
в koi8-r терминале.
Кодируется по кол-ву старших единичных бит в 1-ом байте. Если 0xxxxxxx, то 1 байт 0..127, 10xxxxxx xxxxxxxx — 128 до 128+16384, и так далее…
/me посмотрел на это все и ушел курить man’ы