170 похожих чатов

@YallenGusev Илья, вопрос по Сайге: - Вы писали что это

- "адаптер", и в то же время, в названии - LoRa, но у нас вчера с GPT-4 поднялась эта тема по ходу, в другом контексте, так она утверждает, что LoRa и Адаптер - это разные вещи, хоть и близкие по сути, но два разных подхода к дообучению с целью снизить издержки и увеличить гибкость. Это так?

14 ответов

18 просмотров

А вы не пробовали гуглить? Дергаете человека зря

lora и adapter не только в контексте Сайги используются. например вот https://news.ycombinator.com/item?id=35299978

Роман, никакой агрессии, все нормально. просто в данном вопросе гугл справится быстрее и качественнее, чем Илья)

նիկիտա ki ta ~
lora и adapter не только в контексте Сайги использ...

Ну, то есть в Сайге стоит адаптер поверх Лоры, или что? 🤨

Yuriy Nazarov
Lora это аббревиатура от low rank adapters(ation)

У меня есть данные что речь идет об "Attention" - они неправильные?

Temirlan
Лора и есть адаптер своего рода

Нене, смотри как видит тему GPT: оба подхода стремятся увеличить эффективность, но делают это разными способами. LoRA уменьшает количество параметров, которые необходимо настроить, в то время как подход адаптера оставляет исходную модель неизменной и добавляет дополнительные слои для настройки. Если вам нужно быстро дообучить модель с минимальным влиянием на ее исходные веса, адаптеры могут быть хорошим решением. Однако, если вы хотите получить наилучшую производительность при минимальном количестве параметров, LoRA может быть более подходящим подходом. и далее: Да, концептуально возможно использовать LoRA и адаптеры совместно в одной модели. Например, вы можете применить LoRA для уменьшения числа параметров вашей модели, и затем добавить адаптеры для дополнительной настройки модели, сохраняя основные веса модели замороженными. Однако стоит отметить, что такой подход может повлечь за собой дополнительную сложность и потребность в ресурсах. Кроме того, насколько эффективно будет совместное использование этих двух подходов, во многом зависит от конкретной задачи и доступных ресурсов. Также следует учитывать, что на момент моего последнего обновления в сентябре 2021 года, я не видел множества примеров практического применения LoRA и адаптеров вместе. Так что, если вы решите использовать эти подходы вместе, вы, вероятно, будете на переднем крае исследований и разработки в этой области.

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
Нене, смотри как видит тему GPT: оба подхода стре...

адаптеров очень много разных. лора — один из них. в целом суть адаптера — эффективно файнтьюнить. если хочешь подробнее погрузиться, можешь из какой-нибудь статьи типа этой вытащить названия адаптеров и попросить чатгпт описать каждый и сравнить

նիկիտա ki ta ~
Роман, никакой агрессии, все нормально. просто в д...

Конечно же нет. "Комплекс эртээфэмщика" (раньше вместо гугления писали: RTFM) - это чистой воды виртуальное быдлячество, вроде как на Хабре, или типа того. ☺️ Попытка скомпенсировать внешнее давление в реальной жизни за счет иллюзии виртуального доминирования 🤷‍♀️

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
Ну, то есть в Сайге стоит адаптер поверх Лоры, или...

если по простому, то - адаптеры - это просто дополнительные веса, которые “встраиваются” в модель и которые в процессе файнтюна обновляются ( остальные веса фризятся) - лора - тип адаптера, где выбираются веса (напомню, это тензор ( для простоты матрица M*N)) и для каждой выбранной матрицы создаются две другие матрицы M*k и k*N и вот они файнтюнятся

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта