гб данных (около млрд строк), нужно получить их в файлик пошафленными случайно (в табличке лежат отсортированными по полю с таймстемпом). Рабочий вариант — добавить rand() колонку и отсортировать по ней, но кажется, что такой запрос даже на сервере с 100гб оперативкой умирает (или я как-то неправильно его готовлю). Возможно ли это вообще сделать средствами кх и если да, то куда смотреть? Про max_memory_usage знаю, может не знаю чего-то другого
В запросе экспорта укажите ORDER BY rand()
Обсуждают сегодня