Есть много других либ, для решения этой задачи
Вполне годно можно выдирать контент через xpath через html agility pack, например. Но html это html - может быть битым, с косяками и тд
Да. Есть штука под названием SgmlReader, которая делает из HTML валидный XML
Обсуждают сегодня