170 похожих чатов

Снова вопрос по BeautifulSoup... Чтобы работали методы find() и find_all(), у

меня должен быть <class 'bs4.BeautifulSoup'> .
Когда я добавляю .encode() и .decode() , этот тип у меня преобразуется в строку.

Как после вышеуказанных манипуляций произвести обратное преобразование (но так чтобы кодировка была "utf-8")?

24 ответов

18 просмотров

Не трогай encode и decode

garrip91- Автор вопроса
Alex
Не трогай encode и decode

А как мне быть, если я изначально имею дело с кодировкой windows-1251 , а мне нужна кодировка utf-8 ?

garrip91- Автор вопроса
Alex
Не трогай encode и decode

Как преобразовать тогда правильно?

garrip91
А как мне быть, если я изначально имею дело с коди...

Зачем тебе utf-8 и почему ты решил что она нужна?

garrip91- Автор вопроса
Tishka17
Зачем тебе utf-8 и почему ты решил что она нужна?

Потому что с utf-8 у меня данные все нормально отображаются. И вообще по мнению многих кодеров указанная кодировка считается best of the best

garrip91
Потому что с utf-8 у меня данные все нормально ото...

Давай-ка разделять входные данные (тут важна входная кодировка), данные с которыми ты работаешь (тут никаких кодировок нет) и вывод куда-то (в зависимости от способа вывода кодировка имеет смысл или нет)

garrip91- Автор вопроса
Tishka17
Зачем тебе utf-8 и почему ты решил что она нужна?

Ну подскажи тогда другой способ перевода имеющейся кодировки в другую, который по твоему мнению лучше...

garrip91
Потому что с utf-8 у меня данные все нормально ото...

Давай ты для начала расскажешь где именно и при каких условиях ты наблюдаешь проблемы с кодировкой

garrip91- Автор вопроса
Alex
Давай ты для начала расскажешь где именно и при ка...

Изначально кириллические данные у меня некорректно отображались

garrip91
Ну подскажи тогда другой способ перевода имеющейся...

Не нужно никакого перевода из одной кодировки в другую. Нужно понять где какая используется и использовать в каждом месте одну

garrip91
Потому что с utf-8 у меня данные все нормально ото...

https://t.me/ru_python/2105583 Я это для чего писал?

garrip91
Изначально кириллические данные у меня некорректно...

Ну тут возможны две проблемы: 1. Проблема на входе 2. Проблема на выходе

garrip91- Автор вопроса
Tishka17
Ну тут возможны две проблемы: 1. Проблема на входе...

Ну разумеется. Но неужели нельзя сохранить мою кодировку, но при этом, чтобы тип был таким, чтобы можно было применить к нему нужные методы и получить на выходе нужный результат?

Ничего не понял, все работает не так, а как я сказал выше

garrip91
Ну разумеется. Но неужели нельзя сохранить мою код...

Подсказка 1: в ответе сервера приходят байты, которые можно интерпретировать как душе угодно

r nurnu
Подсказка 1: в ответе сервера приходят байты, кото...

При том обычно в этих байтах содержится информация о кодировке

garrip91- Автор вопроса
Tishka17
Ничего не понял, все работает не так, а как я сказ...

Мне надо спарсить страницу. На странице кодировка windows-1251 . Мне нужно каким-то образом преобразовать эту кодировку в utf-8 , но так, чтобы конечный тип данных позволял мне применять методы find() и find_all() от BeautifulSoup

garrip91
Мне надо спарсить страницу. На странице кодировка ...

Зачем тебе её преобразовывать в utf8? Откуда ты это взял?

evle
Или не в этих, а рядом...

Ну конкретно в HTML оно содержится внутри <head>

Alex
Ну конкретно в HTML оно содержится внутри <head>

Да, но может быть в заголовках и не быть в html. Или вообще нигде.

Похожие вопросы

Обсуждают сегодня

здравствуйте. совершаю вот такую вещь: strcpy(line, (char)current_number); где current number — неподписанный шорт, line — массив чаров. ругань следующая: main.c:29:30: error...
Roberto's Ширгозиев
13
Всем привет. Ребят подскажите пожалуйста. Вопрос по дизасемблировани. Начну с начала. У меня есть скомпилированная программа на ГО (я разработчик) - в ней есть защита лицензии...
Zloy
11
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Заметил в ghci 9.4.8: > :t (<*>) @((->)_) (<*>) @((->)_) :: (w -> (a -> b)) -> (w -> a) -> w -> b Разве не должно (w -> (a -> b)) быть записано как (w -> a -> b)? Это баг, ил...
Михаил
13
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
Any electron dev here?
Sayanth Tezro
12
Карта сайта