Похожие чаты

11 ответов

13 просмотров
Vadim-Chashechnikov Автор вопроса

Какое-то отсутствие ablation study...

Vadim-Chashechnikov Автор вопроса
Evgenii Zheltonozhskii🇮🇱
М?

Почему не происходит коллапса?

Vadim Chashechnikov
Почему не происходит коллапса?

Ещё спроси почему нейросети работают)

Vadim-Chashechnikov Автор вопроса
Evgenii Zheltonozhskii🇮🇱
Ещё спроси почему нейросети работают)

Ну блин, ну можно же хотя бы запилить с проекцией и без неё. С ema и без ema.

Vadim-Chashechnikov Автор вопроса
Evgenii Zheltonozhskii🇮🇱
Ещё спроси почему нейросети работают)

Нейросети не работают так-то)))). Но я могу сказать, что нелинейная функция может апроксимировать любую функцию, а производная ведет в локальный минимум, соответственно, ожидаемо результат улучшается.

Vadim-Chashechnikov Автор вопроса
Evgenii Zheltonozhskii🇮🇱
Проекция вроде известная штука, ещё с simclr

Не, я интуитивно понимаю, что фичи для сравнения(которые должны игнорить аугментации), не равны фичам изображения, которые лучше использовать для претрейна, но ablation study, который они сделали указывает на то, что чем больше проекция, тем лучше результат, почему решили не увеличивать дальше? У меня есть два варианта, или при большей проекции у тебя происходит колапс из-за более насыщенных градиентов, или они тупо забили и не проверили.

Vadim Chashechnikov
Не, я интуитивно понимаю, что фичи для сравнения(к...

проверь)) расскажешь ) либо кстати того не требует как бы стандарт. Время то не бесконечное. Уложились в какой-то набор экспериментов, далее берите дерзайте научный мир.

Vadim-Chashechnikov Автор вопроса
Ilya
проверь)) расскажешь ) либо кстати того не требует...

Учитывая сколько они тестят различные параметры, то думаю, это было бы не сложно. Уже посмотрел, 512TPU на 8 часов стоит 3000 евро, учитывая, что там псевдокод на джаксе, то надо будет пара попыток + сравнение с начальным вариантом -> пара десятков к евро.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
@Benzenoid can you tell me the easiest, and safest way to bu.y HEX now?
Živa Žena
20
This is a question from my wife who make a fortune with memes 😂😂 About the Migration and Tokens: 1. How will the old tokens be migrated to the new $LGCYX network? What is th...
🍿 °anton°
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
What is the Dex situation? Agora team started with the Pnetwork for their dex which helped them both with integration. It’s completed but as you can see from the Pnetwork ann...
Ben
1
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Anyone knows where there are some instructions or discort about failed bridge transactions ?
Jochem
21
@lozuk how do I get my phex copies of my ehex from a atomic wallet, to move to my rabby?
Justfrontin 👀
11
Карта сайта