170 похожих чатов

Снова вопрос по BeautifulSoup... Чтобы работали методы find() и find_all(), у

меня должен быть <class 'bs4.BeautifulSoup'> .
Когда я добавляю .encode() и .decode() , этот тип у меня преобразуется в строку.

Как после вышеуказанных манипуляций произвести обратное преобразование (но так чтобы кодировка была "utf-8")?

24 ответов

39 просмотров

Не трогай encode и decode

garrip91- Автор вопроса
Alex
Не трогай encode и decode

А как мне быть, если я изначально имею дело с кодировкой windows-1251 , а мне нужна кодировка utf-8 ?

garrip91- Автор вопроса
Alex
Не трогай encode и decode

Как преобразовать тогда правильно?

garrip91
А как мне быть, если я изначально имею дело с коди...

Зачем тебе utf-8 и почему ты решил что она нужна?

garrip91- Автор вопроса
Tishka17
Зачем тебе utf-8 и почему ты решил что она нужна?

Потому что с utf-8 у меня данные все нормально отображаются. И вообще по мнению многих кодеров указанная кодировка считается best of the best

garrip91
Потому что с utf-8 у меня данные все нормально ото...

Давай-ка разделять входные данные (тут важна входная кодировка), данные с которыми ты работаешь (тут никаких кодировок нет) и вывод куда-то (в зависимости от способа вывода кодировка имеет смысл или нет)

garrip91- Автор вопроса
Tishka17
Зачем тебе utf-8 и почему ты решил что она нужна?

Ну подскажи тогда другой способ перевода имеющейся кодировки в другую, который по твоему мнению лучше...

garrip91
Потому что с utf-8 у меня данные все нормально ото...

Давай ты для начала расскажешь где именно и при каких условиях ты наблюдаешь проблемы с кодировкой

garrip91- Автор вопроса
Alex
Давай ты для начала расскажешь где именно и при ка...

Изначально кириллические данные у меня некорректно отображались

garrip91
Ну подскажи тогда другой способ перевода имеющейся...

Не нужно никакого перевода из одной кодировки в другую. Нужно понять где какая используется и использовать в каждом месте одну

garrip91
Потому что с utf-8 у меня данные все нормально ото...

https://t.me/ru_python/2105583 Я это для чего писал?

garrip91
Изначально кириллические данные у меня некорректно...

Ну тут возможны две проблемы: 1. Проблема на входе 2. Проблема на выходе

garrip91- Автор вопроса
Tishka17
Ну тут возможны две проблемы: 1. Проблема на входе...

Ну разумеется. Но неужели нельзя сохранить мою кодировку, но при этом, чтобы тип был таким, чтобы можно было применить к нему нужные методы и получить на выходе нужный результат?

Ничего не понял, все работает не так, а как я сказал выше

garrip91
Ну разумеется. Но неужели нельзя сохранить мою код...

Подсказка 1: в ответе сервера приходят байты, которые можно интерпретировать как душе угодно

r nurnu
Подсказка 1: в ответе сервера приходят байты, кото...

При том обычно в этих байтах содержится информация о кодировке

garrip91- Автор вопроса
Tishka17
Ничего не понял, все работает не так, а как я сказ...

Мне надо спарсить страницу. На странице кодировка windows-1251 . Мне нужно каким-то образом преобразовать эту кодировку в utf-8 , но так, чтобы конечный тип данных позволял мне применять методы find() и find_all() от BeautifulSoup

garrip91
Мне надо спарсить страницу. На странице кодировка ...

Зачем тебе её преобразовывать в utf8? Откуда ты это взял?

evle
Или не в этих, а рядом...

Ну конкретно в HTML оно содержится внутри <head>

Alex
Ну конкретно в HTML оно содержится внутри <head>

Да, но может быть в заголовках и не быть в html. Или вообще нигде.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта