то есть не только получить файл html, а все картинки и js тоже?
распарсить html, для всего, что является ссылками на ресурсы, качать их
а если сайт получает данные через ajax, то как получить эти данные?
интерпретировать и исполнить JS, кек.
Посмотри Selenium.
селениум вроде тебе жс не скачает
Обсуждают сегодня