Похожие чаты

Ребят, тут есть профессиональные тюнеры РЛ моделек?

12 ответов

10 просмотров

Походу, этим занимаются только для игровых целей), хотя конечно есть области где это будет интересно применить на практике).

Mihail Kremlev
Походу, этим занимаются только для игровых целей),...

RL для обучения чего-то реально полезного жрёт на порядок-другой больше времени/выч. мощности

Лис Электронщик
RL для обучения чего-то реально полезного жрёт на ...

Нуу, RL же может работать там где другое не может (или с чем сравнение), как время-мощности сравниваются?)

Mihail Kremlev
Нуу, RL же может работать там где другое не может ...

Минимальная полезная задача в рл вс другое требует больше ресурсов

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Походу, этим занимаются только для игровых целей),...

Значит никто мне не поможет?(((( Я попытался уменьшить энтропию, результат хуже. Могу ещё попытаться увеличить модель.

Vadim Chashechnikov
Значит никто мне не поможет?(((( Я попытался умень...

Ну, у меня в планах заюзать RL есть, но у меня этот год под лозунгом практической применимости, а это больше подпадает под экспериментальное направление)), так что хз когда

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Ну, у меня в планах заюзать RL есть, но у меня это...

Пока что слишком много подбора параметров

Vadim Chashechnikov
Пока что слишком много подбора параметров

Если ты на биржевых данных, возможно, дело в зашумленности закономерностей в данных, а не в архитектуре и т.д. Попробуй может на искусственных данных - будет ли работать.

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Если ты на биржевых данных, возможно, дело в зашум...

Да, или архитектура или данные, но я попробовал SACD на других данных и вроде норм, также в issues нашёл, что есть большие траблы с гиперпараметрами. Саму модельку немного изменил, добавил transformerencoder

Vadim-Chashechnikov Автор вопроса
Vadim Chashechnikov
Да, или архитектура или данные, но я попробовал SA...

В общем, есть параметр который считает целевую энтропию, и я вычислил, что при дефолтных значениях в моей среде, модель получает больше вознаграждения от энтропии, чем её среда ругает за случайные действия, поэтому модель просто начинает действовать рандомно)

Vadim Chashechnikov
В общем, есть параметр который считает целевую энт...

Ну можно какие-нить поправочные веса ввести? Или это и так понятно, а проблема была понять в чем затык?)

Vadim-Chashechnikov Автор вопроса
Mihail Kremlev
Ну можно какие-нить поправочные веса ввести? Или э...

Вангую, проблем будет куча, это одна из них. Одна модель учится 12 часов 1_000_000 шагов.

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Anyone knows where there are some instructions or discort about failed bridge transactions ?
Jochem
21
Also, why can’t the community have a vote/ say when it comes to initiatives like buybacks. Isn’t the point of crypto decentralisation? Don’t we deserve input as long term supp...
👨🏽‍🦰
13
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
Привет)) уже кажется эту тему перемусолили, но вот я так и не понял. Я сейчас сижу на 27дюймов 2к мониторе. На Актуальной макоси, если я куплю 27д 4к монитор: - будет ли изобр...
Vladislav Piskunov
15
any reference of this implementation?
BitBuddha
29
Hi guys, any problem with Pulsebrige? Trying to transfer from wETH to ETH. First it tells me to connect my metamask "through mobile app" not desktop. Then I did and confirmed ...
Snowflakecrypto
13
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Страшнейшая правда про списки ЦБ. С первых дней жизни P2P сферы, молодые человеки, начитавшись законодательной базы и "внутренних" документов, решили, что им противостоит сер...
Foxcool
3
Карта сайта