Всем привет,объясните, пожалуйста, есть ли смысл стоить embedding-ги при помощи: - TF-IDF - Word2Vec CBOW - GloVe если есть берты которые не только слова по отдельности пр...
усвоил, и еще кое что хотел бы спросить у меня есть такой конфиг для тренинга logging.set_verbosity_error() trainer = transformers.Trainer( model=model, ...
Всем, добрый день, есть вопрос по TGI Цель - выкатить модель на прод с TGI.На проде доступно всего 24 гб видео памяти. Модели нужно 60. WizardCoder-15B-V1.0 Я хотел уточнить...
Всем привет, ответьте,пожалуйста, на вопрос: У меня есть LLM на 15 миллиардов весов (17/24 гб vram занимает на карте) квантизованная до 8 бит Задача - генерация java кода...
Всем привет, стоит задача детекции красоты лица.Не ржать) Посоветуете модельку,пожалуйста?)
всем привет.Объясните,пожалуйста,правильно ли я понимаю?Допустим у нас есть две матрици:динамическая и статическая(dmatrix,smatrix).Я хочу работать с ними в функции,непосредст...
Всем привет, не подскажете где можно ознакомиться с архитектурами трансформеров?Я никак не могу понять что это. То есть существуют encoder only models, decoder only models, e...
Добрый вечер,скажите, пожалуйста, правильно ли я понимаю Есть дата сет из 130 строк 1) если поставить per_device_train_batch_size=2, gradient_accumulation_steps = 8 то у н...
что именно происходит когда я так делаю и почему происходит то,что я прокомментировал выше?)
Assuming, that the Byte-Pair Encoding training would stop at this point, the learned merge rules would then be applied to new words (as long as those new words do not include ...
можно еще уточнить пару моментов?) Если у меня модель требует некий шаблон промпта как в функции ниже, мне нужно все данные оработать с учетом этого шаблона или же это ток д...
так он для каждого слова TF-IDF считает, ну типа важность слов посмотреть да, но так то что еще он возьмет?
всем привет.скажите,пожалуйта,я здесь получаю ошбку так как сначала создал указатели,которые имеют свой адрес но при этом ни на какой адрес в памяти не указывают и потом попыт...
всем привет,скажите,пожалуйста,если я создал в функции createArray динамический массив (array) размером size и хочу его удалить в функции deleteArray то в этой функции мне ну...
Всем привет,я часто вижу в вакансиях типа c++ junior/intern/trainee,мол требуется опыт работы с линуксом,подскажите,пожалуйста,правильно ли я понимаю,здесь имеется в виду прос...
Всем утро доброе,у меня дилемма,я пару месяцев изучал DS,все шло нормально,было интересно,понимал,что ничего не понимаю и тд.Но потом до меня дошло,что нужно подтянуть знания ...
Генерация текста это по идее только LogLikelihood?Я просто через transformers.Trainer тюню, там лосс не указывается,дефолт стоит видимо какой-то
это неверно разве?
а, еще момент, посоветуйте плиз какие лучше модельки юзать? у меня такие в топе, дескать "all-mpnet-base-v2", "all-MiniLM-L6-v2", "paraphrase-multilingual-mpnet-base-v2" бы...
То есть вывести структуру-вывести значения ее объектов ?