фоточки по ключевикам
Мой инструментарий:
protractor + ChromeWebDriver
после логина храню куки, сбрасываю их рандомно в диапазоне 10-15 дней
Lifecycle ботa:
0. протрактором открываю хром
1. иду на главную фб
2. если нету куков – логинюсь, если есть – иду в страницу профиля
3. в поиске пишу нужный ключевик
4. перехожу на вкладку "фото"
5. указываю параметры фильтра (локейшн, дата)
6. жду пока загрузится результат
7. скороллю результат в саммый низ (что бы собрать все фотки за указанную дату)
8. выгребаю ссылки
9. закрываю хром
Проблемы:
1. новые, свежие аккаунты блочит практически сразу
2. оставил свой личный аккаунт, сначала ругалось, мол "вы зашли отуда-то, вы ли это?", но это длилось не оч долго, пару раз заапрувил и прекратилось. спустя неделю поиск у меня тупо перестал работать. на любой запрос пишет "not found", думаю, мне локнули поиск, временно или не – хз. написал в саппорт, дал тикет в комьюнити, пока что жду ответа.
Идеи/мысли:
1. думаю, нужно делать бота "живым", т.е., помимо того, что он просто должен ходить по поиску, нужно его пускать гулять по ленте новостей, мб, лайкать что-то, мб, добавлять друзей и т.д.
2. мой бот работает, примерно, каждые 20 минут. т.е., в стуки он запускается примерно 24 * (60/20) = 72 раза. что важно: на каждый процесс открывается новое окно хрома (считай, новая сессия) и после сбора всего нужного – закрывается. думаю уменьшить число запросов, примерно в 2 раза, в пределах 30-40 оставить. к тому же, попробовать сделать всю работу в одном окне браузера и не закрывать его. каждый новый процесс открывать в новой вкладке, после ее закрывать.
Собственно, что я и ищу и почему пишу:
хочу обсудить моего зверька с людьми которые делали что-то подобное, мб, не обязательно для фесбука с целью получить информацию о каких-то скрытых возможностях, хаках, лучших практиках.
Предварительно, спасибо!
а из апишки типа это нельзя вытащить? зачем такие извраты
Обсуждают сегодня