Привет! Хочу сделать модельку на классификацию: английский язык(“compliance”), транслитерация(“perestanovka”), абракадабра(“ghftaw”). Что можно попробовать кроме как обучить F...
Коллеги, проясните такую вещь. Есть например Бенчмарки для NER моделей. Я правильно понимаю что это размеченный датасет на котором каждый может запустить свою модель и посмотр...
А где нибудь решали такую задачу: перефразировать поисковый запрос в вопрос? Например «jira доступ» -> «как получить доступ в jira”?
А можно использовать адаптеры для finetuning обычных бертов на большом количестве данных? Сейчас стандартный файн тюнинг обучение занимает 12 часов, если обучать адаптеры буде...
Или это все выгружается по каждому разметчику и обрабатывается отдельно?
Коллеги, как вы делаете в случаях, если для модели на HuggingFace в карточки нет примера кода как модель загрузить, как передать текст и получить ответ? Например хочу у себя з...
Кто-нибудь парсил телеграм? Хочется какой нибудь скрипт, где стоит только указать iD канала и получить все сообщения за какой-нибудь период. То что я пока пробовал из интернет...
Есть хорошие туториалы как обучать hugging face с помощью triplet loss? Сближать эмбединги похожих текстов и отодвигать у разных.
Как можно оценить качество суммаризации текста без ChatGPt?
Если решаю задачу классификации, но классы у меня упорядочены(приоритет заявки: низкий, средний, высокий). Есть какие-то методы для передачи знания это упорядоченности модели?...
Народ, много раз обсуждалось, но повторюсь. Какую сейчас LLM лучше всего поднимать локально для русского языка на A100 по качеству ответов? Что ближе всего к ChatGPT? Спасибо ...
Привет! Если я хочу сделать красивый лендинг одностраничник для своей LLM как это сделать проще всего если знаешь только python?) gradio и streamlit выглядят очень убого(
Коллеги, как вы переводите текст в даты? Например «за последние два дня», «с 6 ноября» и так далее. dateparser такое уже не тянет. И конечно хочется без llm
Коллеги, а для каких практических задач можно использовать rugpt3.5 которая не обучалась на инструкциях? Генерирует текст и генерирует, где в бизнес процессах ее можно с польз...
Коллеги используют elasticssearch с bm25. Я с елкой никогда не работал( подскажите, можно из коробки туда запихнуть ембединги какого-нибудь Берта huggingface? Это же улучшит р...
Коллеги, кто-то недавно интересовался задачей поиска вопросов и ответов в чатах. Удалось что-нибудь найти? Какие вообще есть подходы, делитесь)) знаю что можно попробовать эту...
Как можно оценить качество сгенерированных к тексту вопросов и ответов без ChatGPT?
Обновил torch до 2.1.0 и Падаю с ошибкой NVIDIA driver too old (version 11070). Надо что-то еще обновить? Что можно посмотреть еще?😞
Коллеги, а saiga2 влазит на а100 40GiB? Пишет cuda out of memory. Нужно параметры подкрутить или бесполезно? Запускаю как в карточке написано. Как будто 2MiB не хватает 🤬
Можно как-нибудь применять RLHF для задачи классификации(token/sentence)? Если для диалогов так хорошо зашло, может и для более простых задач можно применить? Есть что почитат...