Снова вопрос по BeautifulSoup... Чтобы работали методы find() и find_all(), у

Question

Снова вопрос по BeautifulSoup... Чтобы работали методы find() и find_all(), у

меня должен быть <class 'bs4.BeautifulSoup'> .
Когда я добавляю .encode() и .decode() , этот тип у меня преобразуется в строку.

Как после вышеуказанных манипуляций произвести обратное преобразование (но так чтобы кодировка была "utf-8")?

#backend #programming #python #russian

0

16.07.2023

24 ответов

65 просмотров

garrip91 Автор вопроса

Alex
Не трогай encode и decode

А как мне быть, если я изначально имею дело с кодировкой windows-1251 , а мне нужна кодировка utf-8 ?

0

16.07.2023

garrip91 Автор вопроса

Alex
Не трогай encode и decode

Как преобразовать тогда правильно?

0

16.07.2023

Tishka17

garrip91
А как мне быть, если я изначально имею дело с коди...

Зачем тебе utf-8 и почему ты решил что она нужна?

0

16.07.2023

garrip91 Автор вопроса

Tishka17
Зачем тебе utf-8 и почему ты решил что она нужна?

Потому что с utf-8 у меня данные все нормально отображаются. И вообще по мнению многих кодеров указанная кодировка считается best of the best

0

16.07.2023

Tishka17

garrip91
Потому что с utf-8 у меня данные все нормально ото...

Так, появилось какой-то о отражение

0

16.07.2023

Tishka17

garrip91
Потому что с utf-8 у меня данные все нормально ото...

Давай-ка разделять входные данные (тут важна входная кодировка), данные с которыми ты работаешь (тут никаких кодировок нет) и вывод куда-то (в зависимости от способа вывода кодировка имеет смысл или нет)

0

16.07.2023

garrip91 Автор вопроса

Tishka17
Зачем тебе utf-8 и почему ты решил что она нужна?

Ну подскажи тогда другой способ перевода имеющейся кодировки в другую, который по твоему мнению лучше...

0

16.07.2023

Alex

garrip91
Потому что с utf-8 у меня данные все нормально ото...

Давай ты для начала расскажешь где именно и при каких условиях ты наблюдаешь проблемы с кодировкой

0

16.07.2023

garrip91 Автор вопроса

Alex
Давай ты для начала расскажешь где именно и при ка...

Изначально кириллические данные у меня некорректно отображались

0

16.07.2023

Tishka17

garrip91
Ну подскажи тогда другой способ перевода имеющейся...

Не нужно никакого перевода из одной кодировки в другую. Нужно понять где какая используется и использовать в каждом месте одну

0

16.07.2023

evle

garrip91
Потому что с utf-8 у меня данные все нормально ото...

https://t.me/ru_python/2105583 Я это для чего писал?

0

16.07.2023

Alex

garrip91
Изначально кириллические данные у меня некорректно...

Где?

0

16.07.2023

Tishka17

garrip91
Изначально кириллические данные у меня некорректно...

Ну тут возможны две проблемы: 1. Проблема на входе 2. Проблема на выходе

0

16.07.2023

garrip91 Автор вопроса

Tishka17
Ну тут возможны две проблемы: 1. Проблема на входе...

Ну разумеется. Но неужели нельзя сохранить мою кодировку, но при этом, чтобы тип был таким, чтобы можно было применить к нему нужные методы и получить на выходе нужный результат?

0

16.07.2023

Tishka17

Ничего не понял, все работает не так, а как я сказал выше

0

16.07.2023

r nurnu

garrip91
Ну разумеется. Но неужели нельзя сохранить мою код...

Подсказка 1: в ответе сервера приходят байты, которые можно интерпретировать как душе угодно

0

16.07.2023

Alex

r nurnu
Подсказка 1: в ответе сервера приходят байты, кото...

При том обычно в этих байтах содержится информация о кодировке

0

16.07.2023

garrip91 Автор вопроса

Tishka17
Ничего не понял, все работает не так, а как я сказ...

Мне надо спарсить страницу. На странице кодировка windows-1251 . Мне нужно каким-то образом преобразовать эту кодировку в utf-8 , но так, чтобы конечный тип данных позволял мне применять методы find() и find_all() от BeautifulSoup

0

16.07.2023

evle

Alex
При том обычно в этих байтах содержится информация...

Или не в этих, а рядом...

0

16.07.2023

Tishka17

garrip91
Мне надо спарсить страницу. На странице кодировка ...

Зачем тебе её преобразовывать в utf8? Откуда ты это взял?

0

16.07.2023