найти какое по памяти эффективное решение вхождения одной строки в набор строк.
Допустим есть csv c миллионом uuid айдишками, я могу хранить это всё в что-то вроде map[string]struct{} но это тем не меннее миллион строк, мллион ссылок, нагрзука на гц и тд и тп. можно юзать https://github.com/cespare/xxhash и получать инт и делать что-то вроде map[int]struct{}, и это я и собираюсь использовать в целом, но мне вот интересно, можно ли собрать какой-то хеш от всех миллионов uuid во что-то одно компактное чтобы быстро проверять вхождение какой-то строки в этот список айдишек?
та просто двоичное дерево и все.
либо, кстати, просто огромный массив байтов, где uuid-ы прям сплошняком идут
Обсуждают сегодня