Maxim D

Username @mxdza

Телефон —

Как скрыть?

Измените конфиденциальность Username и Телефона в настройках Telegram на «Только контакты» или «Никому» и через некоторое время они исчезнут с сайта

104 просмотра

1 вопросов от mxdza

DL in NLP discussion group / Maxim D

Вопрос к экспертам в области RL/RLHF/PPO В реализации RLHF подхода (https://github.com/lvwerra/trl) авторы вычисляют KL-div между policy и референсной моделью вначале PPO шага...

#communication #dlinnlp #nlp #russian

02.08.2023

1 ответов

967 чатов

Maxim D

1 вопросов от mxdza