169 похожих чатов

Всем доброго дня и отличного настроения! Вопрос сегодня такой: как правильно

посчитать длину произвольной строки в байтах?

18 ответов

30 просмотров

самый правильный ответ про байты от Ивана

Лучше не считать длину строки в байтах. А считать длину байтов в байтах. %) Т.е.вариант с encode от Добромира или encode_utf8 . Вариант Ивана с мутацией существующей строки - это чёрная магия.

Andrey Smirnov / 𝓪𝓵𝓵𝓽𝓮𝓻 /
Лучше не считать длину строки в байтах. А считать ...

"произвольная строка" из условия может оказаться не ютф8

Anton Petrusevich
"произвольная строка" из условия может оказаться н...

Ну, вот программист и должен гарантировать. Эта же длина нужна не просто так, а для чего-то. Т.е. сначала получить из строки символов строку байтов, а затем делать с ней нужные манипуляции - искать подстроки, считать длины и т.д.

Askar-Timirgazin Автор вопроса
Anton Petrusevich
"произвольная строка" из условия может оказаться н...

именно, там может быть и ascii и utf-8 и классическая каша из дважды сконверченного в utf8

Vadim Goncharov
почему черная? документированный способ

Это может сработать как action-at-distance. В общем, мутация флагов in-place это не то, что хочется видеть в продакшн коде. Разве что только в локальных переменных функций, и то надо быть внимательным. В общем, сама задача подсчёта длины юникодной строки в байтах - уже настораживает. Надо считать длины тех буферов, которые будут окончательно использоваться - для отдачи во внешний мир, криптографии и т.д - в байтах

Vadim Goncharov
а с чего бы это bytes мутирует строку?

Речь не про bytes, а про первый вариант у Ивана

Vadim Goncharov
а не надо первый, надо второй

звучит смешнее на Цэ, когда BE vs LE

есть, конечно - под неё надо выделять память, её может потребоваться подписывать...

Vadim Goncharov
есть, конечно - под неё надо выделять память, её м...

Если ты спускаешься на такие уровни - переводи всё в байты (encode_utf8) и оперируй ими. Т.к. иначе может оказаться, что ты посчитаешь подпись строки, а потом она под капотом какой-то либы превратится в NFC/NFD, и долго будешь выяснять, почему внешний сервис твою подпись не принимает.

Andrey Smirnov / 𝓪𝓵𝓵𝓽𝓮𝓻 /
Если ты спускаешься на такие уровни - переводи всё...

а если у тебя в использовании такая либа, то едва ли ты будешь озабочен вопросами подсчёта байт в строке

Сдаётся мне, что длина строки в байтах обычно как раз известна. Она конечно может меняться, но суть в том, что строку как объект в памяти было бы невозможно хранить, не зная её размер в байтах изначально. То есть нет же такой темы, что где-то у Perl лежит строка, и тут вдруг он, как старый склеротик, задаётся вопросом "а чё сколько же она в байтах-то у меня, как-то я подзабыл совсем..."

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
Ребят в СИ можно реализовать ООП?
Николай
33
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта