архитектурным особенностям относится.
Имеется ресурс в сервисе А для получения данных телеметрии. Сам сервис А ходит в другой сервис Б для получения данных.
Пакет данных по телеметрии нужно обогащать данными пользователя. Для того, чтобы это сделать нужно сопоставить timestamp в пакете с журналом привязки устройств. Записи в журнале привязки имеют дату и время начала и окончания привязки.
Сама суть в принципе сводится к тому, чтобы найти вхождение timestamp в множество периодов.
Вопроc: как это можно делать эффективно?
достаточно эффективный вариант — привести таймстемпы к одному виду, чтобы они строго возрастали со временем. Целое число ( erlang:system_time(milli_seconds). ) достаточно легко сравнить с двумя другими. Бинарь вида <<“20220217-184102”>> тоже можно сравнивать. Это чуть медленнее, чем с целочисленным таймстемпом, но зато читаемо для глаз. А вообще лучше как-то иначе пересекать источники данных. Нагенерить какой-нибудь id, например.
Здесь о другом, кажется. В журнале есть N запиcей диапазонов, нужно вычислить в какие диапазоны попадает таймстемп, не перебирая N.
Ага, по факту вот это и нужно. Только записей может быть очень много. Одно устройство в месяц производит минимум 40000 пакетов, минимально таких устройств 1000. Сами устройства в течении дня могут менять привязку и быть у нескольких сотрудников. И кажется, что налету обогащать данные не очень хорошая идея
ID это общий ключ по которому однозначно данные можно сопоставить?
очень странная задача. У тебя в каждый момент открыто 1000 подключений. Как ты собираешься угадывать, где чьё подключение?
Это не касается Erlang, это общая задача. В сервис Б прилетают сообщения телеметрии от разных устройств и разных типов устройств. Сервис А ходит в него, чтобы получить необходимые данные за определенный промежуток
Обсуждают сегодня