Есть странная задачка. Дано 2 или более источника данных. Данные

в каждом источнике одинаковые и порядок данных тоже. По сути это стрим событий. Внутри сообщения нет никаких порядковых номеров и меток времени. Источники могут отставать друг от друга. Стримы могут менять лидерство по доставке несколько раз в сек, минуту, час, день. Собственно как брать в моменте самые быстрые данные без дублирования и пропусков?

18 ответов

18 просмотров

А как предполагается узнавать, что лидерство сменилось?

Кешироватб хеш от данных и самые новые, те которые в кеш ещё не попали

а в какой предметной области такое бывает? (интересно просто)

Мб котировки какие то с бирж

Lite-Combo Автор вопроса

В этом и вопрос

Lite-Combo Автор вопроса

Это будет медленно и как чистить мапу?

Lite-Combo Автор вопроса

Интересный вариант. Пока не произошла синхронизация нужно много данных сравнить(((

Узкое горлышко качает по сети сами данные. Функция активации работает очень быстро. Реальная Система - брокер сообщений или прокси от nginx (любой другой поток), один или больше клиентов, сервер редиса для хранения и синхронизации очистка возможна через автоудаление ключей но всё зависит от самой системы.

Идея хорошая, но сравнение по всем полям структуры на каждом вызове даёт огромные накладные расходы. + Это очень жирно по памяти хранить столько данных. А в целом отличный вариант. Но как бороться с тем, что твой сервер хранит состояние, чего в идеале не должен делать

Считай hash суммы от данных сообщения и храни их последовательность.

Какие вводные – такая и идея) Мы же не знаем ничего про сообщения кроме того, что там нет порядковых номеров и меток времени. Памяти нужно на одно-два сообщения и один оффсет для каждого источника данных. А как можно сделать дедупликацию без хранения состояния, я совершенно не представляю.

Я выше это и описывал 😏

Хеш суммы и сравнение по всем полям - разные вещи

Lite-Combo Автор вопроса

Это приведёт к задержке в размер окна

да, но задержка должна быть в любом случае - нужно дождаться всех отвечающих

Зачем ждать все ?

> задача получать "самые быстрые данные"

Lite-Combo Автор вопроса

Идея в том чтобы брать самый быстрый

Похожие вопросы

Обсуждают сегодня

Ребята, всем привет. Подскажите, пожалуйста, можно ли как-то через бота понять, что этого бота добавили в группу\канал и выдали ему права администратора?
Artem Stormageddon
9
Привет всем! Почему этот код не срабатывает при добавлении или удалении пользователя из чата? bot.on('chat_member', async (ctx) => { console.log(ctx); }) bot.launch({allo...
Alexander
5
Всем привет. Не понимаю, в чём тут шутка юмора. Убирается только разрешение на send_messages. А send_media_messages остаётся. Как сделать, чтобы оба убирались? await b...
Alexander
2
Ребята привет. Telegraf 3.38 актуален ещё или лучше обновиться?
𝙊𝑙ẽ𝘨 // Rabbit Hole
2
Есть ли лимиты на кол-во вебхук по домену? Стоит в данный момент 900+ ботов и бывает бот перестает отвечать (не приходят вебхуки) 🐒 Помогает только перезапуск
ᅠ [ Кому не ответил, дублируйте ]
11
'frakturBold' => ['𝖆', '𝖇', '𝖈', '𝖉', '𝖊', '𝖋', '𝖌', '𝖍', '𝖎', '𝖏', '𝖐', '𝖑', '𝖒', '𝖓', '𝖔', '𝖕', '𝖖', '𝖗', '𝖘', '𝖙', '𝖚', '𝖛', '𝖜', '𝖝', '𝖞', '𝖟', '𝕬', '𝕭', '𝕮', '𝕯'...
Roma
4
Товарищи, я с вопросом На сколько мне известно, это, конечно, зависит от того, как программа использует процессор, но у меня всё равно остаётся вопрос Допустим, есть 2 проце...
Shen
1
Товарищи, здравствуйте Подскажите, пожалуйста, может кто-нибудь сталкивался с такой задачей Через вебапку можно сканировать qr-код, а есть ли возможность считывать nfc?
Artem Stormageddon
8
Визуальное отображение моделей таблиц sql какое посоветуете?
Shen
7
Коллеги, здравствуйте Подскажите, пожалуйста. я почему-то всегда думал, что если переходить по ссылке такого формата(t.me/bot_bot?start=1) на бота. То бот сразу прожимает кн...
Artem Stormageddon
3
Карта сайта