170 похожих чатов

Ещё раз попробую. После декодера у нас финальные эмбеддинги. Они

потом на что-то умножаются, потом идёт софтмакс. На что они умножаются?

7 ответов

14 просмотров

зачем softmax?

на что-то умножаются это линейный слой

Alejandro- Автор вопроса
Temirlan
на что-то умножаются это линейный слой

Интересный ответ. — На что умножаются? — На что-то умножаются.

Декодера у нас параллельно несколько голов, каждая выдает какой-то вектор Мы все эти вектора конкатенируем и перед подачей в финальный слой сжимаем-разжимаем линейными слоями (или одним просто трансформируем) Умножается этот вектор на веса линейного слоя, какие он там выучил. Ему виднее на что умножать. Если мы до софтмакса достанем результаты такого умножения, этот будут эмбеддинги текста. Если пропустим через софтмакс это будет "наиболее вероятный следующий (или маскированный) токен"

Alejandro
Интересный ответ. — На что умножаются? — На что-то...

Ну на веса линейного слоя же, это очень адекватный ответ. Реально на что-то они умножаются. На какие именно циферки мы не знаем, какие линейный слой выучил, на такие и умножаем.

Alejandro
Интересный ответ. — На что умножаются? — На что-то...

на всякий случай - под "что-то" там подразумеваются случайно инициализированный линейный слой, обученный бэкпропом

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Ребят в СИ можно реализовать ООП?
Николай
33
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Карта сайта