169 похожих чатов

Ладно, как мне закодировать U+D800 и U+DC00 подряд в UTF-16

тогда?

8 ответов

15 просмотров

const cs: array [0..1] of Word = ($D800, $DC00); s, d: TBytes; begin SetLength(s, 4); Move(cs, s[0], SizeOf(cs)); Вопрос только в допустимости комбинации в UTF-16

Serg
const cs: array [0..1] of Word = ($D800, $DC00);...

она не допустима, но чтобы это понять надо парсить честно unicode

Eugene-Krasnikov (ᴊɪɴ x) Автор вопроса
Serg
const cs: array [0..1] of Word = ($D800, $DC00);...

Такая пара кодирует символ U+10000. Суть мне понятна, но повторюсь, что для меня одиночный DC00 — это такой же обломок, потому что такого символа нет, он предназначен для копирования символов U+10000+. Если UTF-8 можно его кодировать — это ни о чем не говорит. Подозреваю, что он может даже за пределы U+10FFFF выходить, но смысл? Разница лишь в том, что UTF-16 может состоять из 1 или 2 частей, а UTF-8 — из 1, 2, 3 или 4. Вот и всё. Последовательность DC00 + DB00 + 0123 такая же невалидная, как и 80 + FF + 12, по сути.

Eugene Krasnikov (ᴊɪɴ x)
Такая пара кодирует символ U+10000. Суть мне понят...

ищи варианты как строку преобразовать к максимально качественному виду

Eugene Krasnikov (ᴊɪɴ x)
Такая пара кодирует символ U+10000. Суть мне понят...

а тут уже от декодера зависит, он там не UCS2 часом?

Eugene-Krasnikov (ᴊɪɴ x) Автор вопроса
Handatros
ищи варианты как строку преобразовать к максимальн...

Да мне этого не надо. Главное, что невалидные символы не генерят исключений, а во что они будут преобразованы — неважно, т.к. их вообще не должно быть в данных. Суть — чтоб прога не падала, не негенерила неожиданных исключений.

Eugene Krasnikov (ᴊɪɴ x)
Да мне этого не надо. Главное, что невалидные симв...

если я верно понимаю это может помочь: /// <summary>Determines if a character is defined in Unicode.</summary> class function IsDefined(C: Char): Boolean; overload; inline; static;

Похожие вопросы

Обсуждают сегодня

А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
что насчет пагинга? на осдеве непонятно(
Vi Chapmann 🪙
26
Вопрос я правильно понимаю что в коде newtype ArrowMap k v = ArrowMap { getArrowMap :: k -> Maybe v } getArrowMap есть функция типа k -> Maybe v, если да, то не понимаю задач...
Fedor
64
Ребят, что лучше для реверса: гидра или ида?
En Vind Av Sorg
26
Делаю велосипед логгер. К сообщению хочу прикрутить некоторую информацию, типа, кем отправлено, какой уровень, и всякое такое. И тут подумалось мне, почему бы не хранить весь...
Serjone
24
Как Вы считаете нормально ли в двадцатых годах 21 века в ВУЗах Российской Федерации обучать студентов работе с TASM? Не слишком ли это "архаично"? (Если оффтоп или флейм для э...
Spiker01
52
Комрады, хотел уточнить. Проперть в OnDestroy юнита-хозяина по-прежнему доступна? И еще уточнение: finalization юнита наступает раньше или позже OnDestroy?
Ed Doc
48
если загрузчик efi? если сама PML4 PDPT PDT PT лежит в неудобном для меня месте?
Vi Chapmann 🪙
8
Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Карта сайта