где не важен?
Ну для кликстрима и аналитики в широком смысле слова обычно не особо важен. У нас есть юзкейс, где пользователям конечным борды показываются, по их скажем так действиям за которые с них деньги берут, здесь конечно точность важна.
Ага, спасибо. Я вроде так же это понимаю. >Ну для кликстрима и аналитики в широком смысле слова обычно не особо важен Это потому что незначительная дубликация не критична (не 2 доллара, а 4)? Или потому что в аналитике обычно применяются какие-то стратегии дедупликации? ref: https://clickhouse.com/docs/en/guides/developer/deduplication
Если дубликаты это редкое явление связанное с аварией на инфраструктуре (а чаше всего это так в кликхаусе), то грубо говоря, они просто могут быть допустимым отклонением при анализе данных. Что то вроде потерей событий, только наоборот, т.е всё ок пока их условно 0.5 процента.
Обсуждают сегодня