посчитать длину произвольной строки в байтах?
самый правильный ответ про байты от Ивана
по дефолту utf для стдаут не включен
по пейджеру
Лучше не считать длину строки в байтах. А считать длину байтов в байтах. %) Т.е.вариант с encode от Добромира или encode_utf8 . Вариант Ивана с мутацией существующей строки - это чёрная магия.
"произвольная строка" из условия может оказаться не ютф8
Ну, вот программист и должен гарантировать. Эта же длина нужна не просто так, а для чего-то. Т.е. сначала получить из строки символов строку байтов, а затем делать с ней нужные манипуляции - искать подстроки, считать длины и т.д.
именно, там может быть и ascii и utf-8 и классическая каша из дважды сконверченного в utf8
почему черная? документированный способ
Это может сработать как action-at-distance. В общем, мутация флагов in-place это не то, что хочется видеть в продакшн коде. Разве что только в локальных переменных функций, и то надо быть внимательным. В общем, сама задача подсчёта длины юникодной строки в байтах - уже настораживает. Надо считать длины тех буферов, которые будут окончательно использоваться - для отдачи во внешний мир, криптографии и т.д - в байтах
а с чего бы это bytes мутирует строку?
Речь не про bytes, а про первый вариант у Ивана
а не надо первый, надо второй
звучит смешнее на Цэ, когда BE vs LE
есть, конечно - под неё надо выделять память, её может потребоваться подписывать...
Если ты спускаешься на такие уровни - переводи всё в байты (encode_utf8) и оперируй ими. Т.к. иначе может оказаться, что ты посчитаешь подпись строки, а потом она под капотом какой-то либы превратится в NFC/NFD, и долго будешь выяснять, почему внешний сервис твою подпись не принимает.
а если у тебя в использовании такая либа, то едва ли ты будешь озабочен вопросами подсчёта байт в строке
Сдаётся мне, что длина строки в байтах обычно как раз известна. Она конечно может меняться, но суть в том, что строку как объект в памяти было бы невозможно хранить, не зная её размер в байтах изначально. То есть нет же такой темы, что где-то у Perl лежит строка, и тут вдруг он, как старый склеротик, задаётся вопросом "а чё сколько же она в байтах-то у меня, как-то я подзабыл совсем..."
Обсуждают сегодня