Похожие чаты

Всем привет. Обучаю нейронную сеть для классификации на 3 класса входной

функции f(t), t€(0,tmax). Делю ее на равные промежутки tbuff так, что для каждого промежутка известен его класс. а итоге получается тензор вида [16000*1*1*250] делаю в либе pytorch.
Модель следующая:
CNN(первые 4 слоя VGG-16) --> FC --> cross_entropy_loss.
Беда в том, что модель очень быстро переобучается. За 5 эпох на одном классе 100%, на других по нулям, за 5 другие теперь такая же ситуация, но на другом классе.
Переепробовал различные оптимизаторы Adam, SGD и гиперпараметры. Не смог избавиться от данной проьлемы.
Какую архитектцру можно подобрать для решения данной задачи?
Какие идеи можно имплементировать, чтобы решить задачу классификации входного 1d вектора?

3 ответов

6 просмотров

а что ты хочешь если класс известен для любого промежутка

Если модель быстро переобучается, значит сеть имеет избыточную ёмкость. Уменьшить ёмкость сети. Следующее, что можно сделать — различные регуляризации. Хорошо от переобучения помогает dropout. Он же уменьшает эффективную ёмкость. Ещё похоже классы сильно смещены. Может помочь семплирование.

Вообще, судя по описанию проблемы, это не похоже на переобучение, больше похоже на слишком большой learning rate. Покажи график, как ведет себя loss?

Похожие вопросы

Обсуждают сегодня

Hey people, how do I unstake from the old pool and stake in the new pool??
Dyldo Baggins
24
А чем вам питонисты не угодили?😂
.
79
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
32
Hey guys, did you see the new announcement about $Fun? 🔥
Filip Murphy
55
Hello. Could you please help me with finding all coordinates within a radius using a spatial index, given that I have a table with coordinates? SET @lng = 37.57925; SET @lat ...
Rinchin G
7
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Привет, запускаю werf в dind в k8s, получаю ошибку на этапе build/beforeSetup: /.werf/stapel/embedded/bin/bash: /.werf/scripts/5898bdfe5214357d3706b879cc8d3d78460fb379607cbd...
florius0
7
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Всех приветствую. Направьте меня в нужное русло. Постепенно переписываю проект с delphi на lazarus. Приложение - обычный windows/linux клиент для бд firebird. Тут все хорошо. ...
Mishutka
8
Привет всем, подскажите, есть сайт на ево 1.4, надо сделать его мультиязычным, структура документов одинаковой останется, чисто тексты разные, свои тв для каждого языка, поддо...
Oleg
7
Карта сайта