виртуальной локацией переходов (навигация по страницам) - это проблема для парсинга контента, кто что думает?
Не занимаюсь парсингом проблемы не вижу))
Логично предположить, парсинг виртуального dom - это ахтунг и фэйл. Но может кто-то пробовал-делал, даже такое...
Что вы подразумеваете под парсингом?
Давайте подумаем, когда мы парсим нтмл, нам есть какая-то разница природы его возникновения? На сервере сгенерен или на клиенте? Единственное что парсинг спа будет чуть сложнее ведь нужно будет дожидаться выполнения жс в хидлес браузере и парсить документ как строку 🌚 (если так кто ещё делает) не выйдет
Хидлесс браузера - что это? Природа html не важна, главно знать, есть html на странице или не успел еще появиться на странице. (допустим он подгружается постепенно или с первоначальной задержкой), так вроде? А что скажете про вирт. навигацию по страницам, будет ли она препятствием для полноценного парсинга?
1. предполагаемая среда для получения html, по сути урезаный cli браузер 2. да 3. нет, нисколько при выполнении условия 2
Обсуждают сегодня