? я правильно понимаю, что с помощью DOMDocument парсить html5 и\или невалидный html не представляется возможным и следует использовать сторонние библиотеки?
Единственная необходимая практика в парсинге HTML это повышение производительности(чисто моё мнение). Спец либы для парсинга будут твой HTML/XML обрабатывать вечность, а если там ещё и утечки памяти и не дай бог выгрузка всего документа в память, то очень быстро скрипт улетит в Fatal Error
Это большой должен хтмл, однако )
Да, проблемы с объемом файлов на XML обычно
Хз, вот, например, https://symfony.com/doc/current/components/dom_crawler.html
Обсуждают сегодня