Всем привет. знатоки, объясните тупому: можно получить из строки массив byte[].

т.е. латинский символ занимает 1байт, а кириллический- 2байта ? а при вызове getBytes() шестнадцатеричный юникод-код как-то превращается в число типа byte?

0

12.06.2023

Виталий Литуновский

Не совсем, это зависит от того, в какой кодировке ты попытаешься получить байты Количество байт на символ зависит от кодировки, а не от языка Шестандцатиричный юникод потому так и называется, что 16 бит на символ А 16 бит - это два байта Если у тебя будет строчка из одной буквы и ты из нее получишь getBytes(), то длина массива будет 2, а не 1, потому что один символ представляется двумя байтами Можешь прямо сейчас в IDEA попробовать)

0

12.06.2023

Maksim Novikov Автор вопроса

Виталий Литуновский
Не совсем, это зависит от того, в какой кодировке ...

да. так и есть) еще момент. есть возможность выбрать UTF-8/16/16LE/16BE. в UTF-16 один кириллический символ занимает 4 байта, а в UTF-16LE/BE - 2байта. как так?

0

12.06.2023

Виталий Литуновский

Maksim Novikov
да. так и есть) еще момент. есть возможность выбра...

Один кириллический символ занимает 4 байта в UTF-16? Насколько мне известно, должно быть все таки по 2 байта, но я видимо могу ошибаться

0

12.06.2023

Василий Михалев

Maksim Novikov
т.е. латинский символ занимает 1байт, а кирилличес...

будет массив байтов какие то символы займут один байт, какие то два. элемент массива из байтов не равен номеру элемента в строке.

0

12.06.2023