содежать) символы UTF8? str.length() возвращает фактически длину в байтах, что меня вполне устраивает в случае с английским текстом. А русские буквы занимают 2 байта, так что str.length() для их подсчёта не годится. Это мне нужно чтобы текст не вылезал за границы "экрана" 80 на 24 символов.
Это ты под Win всё делаешь?
https://stackoverflow.com/a/31653138/1226448 Я что-то такое использовал, смотри Solution 1
API винды (вроде), std::mblen() (опирается на текущую локаль, ЕМНИП), icu, кустарные методы.
Вообще, в C|C++ с юникодом обычно работают, нормализуя его в т.н. "широкие" строки, с "широким" символом одной длины в байтах (это wchar_t) и с работой со строками через т.н. "широкие" версии функций библиотеки С , аналогичные strcat, strstr, strchar, strlen и так далее , они начинаются с "ws" вместо "str". В С++ соответственно, испльзуется std::wstring вместо std::string
Обсуждают сегодня