исходный текст на Дхьяне в байт-код, а потом из байт-кода транслирует в Паскаль, который выполняется - но это уже не моя забота ни разу).
Строки в байт-коде должны быть юникодовые (utf-8), то есть латиница там будет кодироваться одним байтом, кириллца - двумя, иероглифы - еще бОльшим числом байтов.
Строки решил хранить так: двойная кавычка, потом строка побайтово, потом - опять двойная кавычка. При трансляции из байт-кода, если натыкаюсь на вторую двойную кавычку, прекращаю ползти по строке.
Гениальный план. Надежный, бл💜дь, как швейцарские часы. Действительно, и что могло пойти не так?
Скармливаю программе код на первом скрине, получаю треш, который на втором... Что за вар-вар-вар??
А вот оказывается, что кириллическая Т (это ж надо было именно на нее попасть!!) кодируется в utf-8, как $0422, а $22 - это код двойных кавычек. Ну ёп-понская дущааа...
Короче, думаю дальше, как эту проблему обойти.
Стикер
Обсуждают сегодня