src = file.read()
#print(src)
soup = BeautifulSoup(src, 'lxml')
title = soup.title
print(title.text)
а есть хтмл код
кусок из кода
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Главная страница блога</title>
<link rel="stylesheet" href="style.css">
</head>
<body>
КОГДА Я ХОЧУ ПОЛУЧИТЬ ТЕКСТ ИЗ ХТМЛ КОДА "Главная страница блога"
вылетает какая то непонятная хрень: Главная страница блога
и что это за хуйня?
У тебя файл в кодировке utf-8, а ты видимо открыл в системной, так как не указал ее. Полагаю у тебя винда и там системная совсем не utf8
а как открыть в утф8 , я просто создал текст.файл вставил туда хтмл код , потом в вскоде сконвертировал этот файл в хтмл и все
Ну а как указывать кодировку при открытии файла?
я указал кодировку уже в утф8 давно , но текст неккоректный в вскоде, это надо исправить
в блокноте
А питон открыл как cp1251
Обсуждают сегодня