169 похожих чатов

Всем доброго дня и отличного настроения! Вопрос сегодня такой: как правильно

посчитать длину произвольной строки в байтах?

18 ответов

33 просмотра

самый правильный ответ про байты от Ивана

Лучше не считать длину строки в байтах. А считать длину байтов в байтах. %) Т.е.вариант с encode от Добромира или encode_utf8 . Вариант Ивана с мутацией существующей строки - это чёрная магия.

Andrey Smirnov / 𝓪𝓵𝓵𝓽𝓮𝓻 /
Лучше не считать длину строки в байтах. А считать ...

"произвольная строка" из условия может оказаться не ютф8

Anton Petrusevich
"произвольная строка" из условия может оказаться н...

Ну, вот программист и должен гарантировать. Эта же длина нужна не просто так, а для чего-то. Т.е. сначала получить из строки символов строку байтов, а затем делать с ней нужные манипуляции - искать подстроки, считать длины и т.д.

Askar-Timirgazin Автор вопроса
Anton Petrusevich
"произвольная строка" из условия может оказаться н...

именно, там может быть и ascii и utf-8 и классическая каша из дважды сконверченного в utf8

Vadim Goncharov
почему черная? документированный способ

Это может сработать как action-at-distance. В общем, мутация флагов in-place это не то, что хочется видеть в продакшн коде. Разве что только в локальных переменных функций, и то надо быть внимательным. В общем, сама задача подсчёта длины юникодной строки в байтах - уже настораживает. Надо считать длины тех буферов, которые будут окончательно использоваться - для отдачи во внешний мир, криптографии и т.д - в байтах

Vadim Goncharov
а с чего бы это bytes мутирует строку?

Речь не про bytes, а про первый вариант у Ивана

Vadim Goncharov
а не надо первый, надо второй

звучит смешнее на Цэ, когда BE vs LE

есть, конечно - под неё надо выделять память, её может потребоваться подписывать...

Vadim Goncharov
есть, конечно - под неё надо выделять память, её м...

Если ты спускаешься на такие уровни - переводи всё в байты (encode_utf8) и оперируй ими. Т.к. иначе может оказаться, что ты посчитаешь подпись строки, а потом она под капотом какой-то либы превратится в NFC/NFD, и долго будешь выяснять, почему внешний сервис твою подпись не принимает.

Andrey Smirnov / 𝓪𝓵𝓵𝓽𝓮𝓻 /
Если ты спускаешься на такие уровни - переводи всё...

а если у тебя в использовании такая либа, то едва ли ты будешь озабочен вопросами подсчёта байт в строке

Сдаётся мне, что длина строки в байтах обычно как раз известна. Она конечно может меняться, но суть в том, что строку как объект в памяти было бы невозможно хранить, не зная её размер в байтах изначально. То есть нет же такой темы, что где-то у Perl лежит строка, и тут вдруг он, как старый склеротик, задаётся вопросом "а чё сколько же она в байтах-то у меня, как-то я подзабыл совсем..."

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта