У меня вопрос про трансформеры. А точнее, про одну из возможных архитектур decoder-only с предсказанием следующего токена. Я правильно понимаю, что если используетс...
Ещё раз попробую. После декодера у нас финальные эмбеддинги. Они потом на что-то умножаются, потом идёт софтмакс. На что они умножаются?
Геометрический смысл у этого линейного отображения есть?
Я не понимаю. Там написано, что это полносвязная сеть, но linear layer это же просто линейное преобразование, не?
Народ, у меня есть несколько машин и виртуалок, какие-то сервисы запущены. Чем мониторить удобней? В том числе наличие обновлений, а то у вечно чувство, что я что-то забыл, и ...
Я тут ищу сам не знаю чего, хочу мониторить, какие сервисы на каких машинах апдейтить, графики по загрузке, что упало, что сломалось. Что проще всего для этого использовать? М...
Есть ли ссылка на такой приём?
привет. Как определить, какая версия js в этом tutorial? https://www.hackerrank.com/domains/tutorials/10-days-of-javascript Я посмотрел, что выводит console.log('Version: ' ...