Добрый вечер! Извините за мой, возможно, глупый вопрос, для выбора лучших гиперпараметров для модели Берта какой хороший метод?
А подскажите, пожалуйста, по вопросно-ответным системам какие успехи? Я знаю, например, что на датасете Стэнфорда топовые архитектуры превзошли человека, но как-то не особо вп...
1) Что значит хороший seed? Если алгоритм оптимизации хорош, он должен работать при любых значениях
Класс! Щас попробую.. А какая разница в _cp36-cp36m_ и пр. - это что за подверсии?
Вопрос наверное глупый, но сходу не нашёл ответа на вопрос - как дообученную NER модель от deeppavlov запустить из докера? Дообучил ner_rus_bert_torch на нижний регистр.
Наверняка, идея не новая. Может кто-то встречал реализацию/описание того, как на вход модели подавать дерево разбора?
Наверняка это работает. Я вот не успел купить, а что продавали?))
Вот вы лучше скажите, для временных рядов какая функция ошибки лучше? Mse и остальные явно не учитывают сдвиг по времени и отставание предсказанных данных.
Всем привет! Вопрос по тренировке NER: традиционно датасеты формируются таким образом, что в каждом семпле есть хотя бы одна сущность, норм ли формировать датасет, включающий...
ахаха xxl поди будет как клауди-инстант?
Можете подсказать тулу которая бы слитые слова токенезировала, что-то вроде: "приветкакдела" ---> "привет, как, дела"?
кстати 3090 поддерживает его? и как вообще использовать
Всем привет! Подскажите, а есть где-то словарь со словами, которые есть в моделях вроде GPT-3/OPT-130B/Bloom и используются для генерации?
а ты софию оптимайзер трогал?
Для чего нужно интерпретировать нейроны?
Привет, а как подойти к задаче парсинга событий? Например человек пишет в чат, "я устал, я завтра не приду на работу" из текста нужно достать дату и причину отсутствия
Здравствуйте, может ли кто-нибудь подсказать рабочую python библиотеку для конвертации запроса на естественном языке в sparql запрос?
ну типа да, но зачем?
А тi точно не бот!?
Всем привет, а кто-то знает такой ресурс, на котором можно находить не очень популярные датасеты для тестовых по нлп? (Чтобы кандидат не мог посмотреть на готовые решения)