Похожие чаты

Ребят, тут есть профессиональные тюнеры РЛ моделек?

12 ответов

12 просмотров

Походу, этим занимаются только для игровых целей), хотя конечно есть области где это будет интересно применить на практике).

Mihail Kremlev
Походу, этим занимаются только для игровых целей),...

RL для обучения чего-то реально полезного жрёт на порядок-другой больше времени/выч. мощности

Лис Электронщик
RL для обучения чего-то реально полезного жрёт на ...

Нуу, RL же может работать там где другое не может (или с чем сравнение), как время-мощности сравниваются?)

Mihail Kremlev
Нуу, RL же может работать там где другое не может ...

Минимальная полезная задача в рл вс другое требует больше ресурсов

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Походу, этим занимаются только для игровых целей),...

Значит никто мне не поможет?(((( Я попытался уменьшить энтропию, результат хуже. Могу ещё попытаться увеличить модель.

Vadim Chashechnikov
Значит никто мне не поможет?(((( Я попытался умень...

Ну, у меня в планах заюзать RL есть, но у меня этот год под лозунгом практической применимости, а это больше подпадает под экспериментальное направление)), так что хз когда

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Ну, у меня в планах заюзать RL есть, но у меня это...

Пока что слишком много подбора параметров

Vadim Chashechnikov
Пока что слишком много подбора параметров

Если ты на биржевых данных, возможно, дело в зашумленности закономерностей в данных, а не в архитектуре и т.д. Попробуй может на искусственных данных - будет ли работать.

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Если ты на биржевых данных, возможно, дело в зашум...

Да, или архитектура или данные, но я попробовал SACD на других данных и вроде норм, также в issues нашёл, что есть большие траблы с гиперпараметрами. Саму модельку немного изменил, добавил transformerencoder

Vadim-Chashechnikov Автор вопроса
Vadim Chashechnikov
Да, или архитектура или данные, но я попробовал SA...

В общем, есть параметр который считает целевую энтропию, и я вычислил, что при дефолтных значениях в моей среде, модель получает больше вознаграждения от энтропии, чем её среда ругает за случайные действия, поэтому модель просто начинает действовать рандомно)

Vadim Chashechnikov
В общем, есть параметр который считает целевую энт...

Ну можно какие-нить поправочные веса ввести? Или это и так понятно, а проблема была понять в чем затык?)

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Ну можно какие-нить поправочные веса ввести? Или э...

Вангую, проблем будет куча, это одна из них. Одна модель учится 12 часов 1_000_000 шагов.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
@Benzenoid can you tell me the easiest, and safest way to bu.y HEX now?
Živa Žena
20
This is a question from my wife who make a fortune with memes 😂😂 About the Migration and Tokens: 1. How will the old tokens be migrated to the new $LGCYX network? What is th...
🍿 °anton°
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
What is the Dex situation? Agora team started with the Pnetwork for their dex which helped them both with integration. It’s completed but as you can see from the Pnetwork ann...
Ben
1
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Anyone knows where there are some instructions or discort about failed bridge transactions ?
Jochem
21
@lozuk how do I get my phex copies of my ehex from a atomic wallet, to move to my rabby?
Justfrontin 👀
11
Карта сайта