170 похожих чатов

Кто-Нибудь парсил телеграм? Хочется какой нибудь скрипт, где стоит только

указать iD канала и получить все сообщения за какой-нибудь период. То что я пока пробовал из интернетов, как-то просто не взлетает

8 ответов

30 просмотров

Так в телеграме это встроенная функция

Alexander- Автор вопроса

хочется чтобы скрипт собрал сообщения за день и положил их в excel, например по crontab, без участия/с минимальным участием

Alexander
хочется чтобы скрипт собрал сообщения за день и по...

Ну вы можете экспортировать сообщения за определенный период, а потом программой в Эксель перегнать

Alexander- Автор вопроса
datascience xc
Ну вы можете экспортировать сообщения за определен...

не хочется это в ручную делать по десятку каналов(

это достаточно комплексная задача, начало которой заключается в покупке или создании сессионных файлов для подключения к TG API, причем в формате предпочитаемой библиотеки (teleton или pyrogram). Их взаимная конвертация форматов тот еще адъ. Поэтому определяться нужно на старте, помня о том, что с телетоном совсем недавно были серъезные проблемы, которые обходятся недокументированными костылями. Потом нужно просчитать возможное количество запросов (ибо банят навылет), узнать время "выдержки" сим-карт (на свежих работать не получится с вероятностью 90%). А дальше приступить к написанию асинхронных функций с get-запросами к условной history условного публичного канала. Каналы без имени aka супергруппы потребуют наличие инвайтных ссылок. Джойн в эти группы нужен автоматический без апрува админа. Наличие только id-группы без соответствующего access_hash результатов, понятное дело, не даст. Если вкратце, парсинг телеги - это своя отдельная вселенная.

публичные каналы доступны как html, например https://telegram.me/s/rian_ru и парсить их очень легко, никаких телетонов и API не нужно

Привет! Когда-то я пытался решить эту задачу, и это мне нормально не удалось, если честно. Кажется библиотеки типа teletone помимо кучи костылей и непрозрачности, имеют ограничения на "глубину" парсинга в прошлое. Типа, не более 50-100 сообщений. Если это ограничение не критично, может быть удобно воспользоваться вот таким микросервисом: https://tg.i-c-a.su/ (отдаёт json и rss, у меня до сих пор кое-что регулярно парсится оттуда). Кроме глубины у этого сервиса есть ещё один минус - иногда он падает или бывает недоступен ( Но, мне кажется, нужно забить на все эти костыли и воспользоваться советом Ильи, и парсить из html (когда я решал свою задачу, такой возможности не было).

Есть такой. Пиши в личку.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта