векторов, и нужно выявлять среди них максимально похожие вектора. Мне нужно обнаруживать устойчивые повторяющиеся паттерны, чтобы на них обучать уже сеть. Таким образом хочу исключить из обучения случайные вбросы и признать вектора, которые не повторяются шумом.
Пример датасета выложил по ссылке: https://drive.google.com/file/d/1bVp5m852g9G3rt-VUvwhA5l-Jsrxy5wd/view?usp=sharing
(По аналогии с MNIST, первое значение в строке является целевым.)
Можно кластеризацией же заняться поделить и взять центры кластеров как мотивы и их уже использовать. Правда нужен алгоритм который сам количество кластеров находит
Обсуждают сегодня