Коллеги, проясните такую вещь. Есть например Бенчмарки для NER моделей. Я правильно понимаю что это размеченный датасет на котором каждый может запустить свою модель и посмотр...
Привет! Хочу сделать модельку на классификацию: английский язык(“compliance”), транслитерация(“perestanovka”), абракадабра(“ghftaw”). Что можно попробовать кроме как обучить F...
А можно использовать адаптеры для finetuning обычных бертов на большом количестве данных? Сейчас стандартный файн тюнинг обучение занимает 12 часов, если обучать адаптеры буде...
А где нибудь решали такую задачу: перефразировать поисковый запрос в вопрос? Например «jira доступ» -> «как получить доступ в jira”?
Или это все выгружается по каждому разметчику и обрабатывается отдельно?
Коллеги, как вы делаете в случаях, если для модели на HuggingFace в карточки нет примера кода как модель загрузить, как передать текст и получить ответ? Например хочу у себя з...
Кто-нибудь парсил телеграм? Хочется какой нибудь скрипт, где стоит только указать iD канала и получить все сообщения за какой-нибудь период. То что я пока пробовал из интернет...
Если решаю задачу классификации, но классы у меня упорядочены(приоритет заявки: низкий, средний, высокий). Есть какие-то методы для передачи знания это упорядоченности модели?...
Как можно оценить качество суммаризации текста без ChatGPt?
Есть хорошие туториалы как обучать hugging face с помощью triplet loss? Сближать эмбединги похожих текстов и отодвигать у разных.
Народ, много раз обсуждалось, но повторюсь. Какую сейчас LLM лучше всего поднимать локально для русского языка на A100 по качеству ответов? Что ближе всего к ChatGPT? Спасибо ...
Коллеги используют elasticssearch с bm25. Я с елкой никогда не работал( подскажите, можно из коробки туда запихнуть ембединги какого-нибудь Берта huggingface? Это же улучшит р...
Привет! Если я хочу сделать красивый лендинг одностраничник для своей LLM как это сделать проще всего если знаешь только python?) gradio и streamlit выглядят очень убого(
Как можно оценить качество сгенерированных к тексту вопросов и ответов без ChatGPT?
Коллеги, кто-то недавно интересовался задачей поиска вопросов и ответов в чатах. Удалось что-нибудь найти? Какие вообще есть подходы, делитесь)) знаю что можно попробовать эту...
Можно как-нибудь применять RLHF для задачи классификации(token/sentence)? Если для диалогов так хорошо зашло, может и для более простых задач можно применить? Есть что почитат...
Коллеги, а для каких практических задач можно использовать rugpt3.5 которая не обучалась на инструкциях? Генерирует текст и генерирует, где в бизнес процессах ее можно с польз...
Коллеги, как вы переводите текст в даты? Например «за последние два дня», «с 6 ноября» и так далее. dateparser такое уже не тянет. И конечно хочется без llm
Коллеги, а saiga2 влазит на а100 40GiB? Пишет cuda out of memory. Нужно параметры подкрутить или бесполезно? Запускаю как в карточке написано. Как будто 2MiB не хватает 🤬
Обновил torch до 2.1.0 и Падаю с ошибкой NVIDIA driver too old (version 11070). Надо что-то еще обновить? Что можно посмотреть еще?😞