Коллеги, похоже у меня затык с обучением gpt2 на собственных данных с валидационной выборкой прошу помочь 1. дообучить gpt2 на собственных данных без валидационной выборки я...
Коллеги, всем привет ) есть есть набор фраз, в том числе похожих, но не до степени сравнения подстрокой нужно определить наиболее часто встречающиеся сразу в лоб видится та...
Коллеги, все привет ) пришла пора выводить модельки из Colab во внешний мир, чтобы отправлять в них текст из внешнего источника, и получать результат обратно. Где рекоменду...
Коллеги, всем привет ) кто-нибудь дообучивал сети для машинного перевода собственными данными? например rut5-base-multitask Helsinki-NLP/opus-mt-mul-en facebook/nllb-200-dist...
Коллеги, всем привет ) исследую T5-small на обучение на собственных данных по задаче "translation" обучающая статья взята с huggingface https://huggingface.co/docs/transforme...
Коллеги, всем привет ) Как считаете, что теретически может дать лучше качество машинного перевода с русского на английский для перевода финансовых терминов и финансовой докум...
Коллеги, всем привет ) делаем систему автоматической поддержки пользователей другими словами - ответ на вопрос пользователя есть источник, на который нужно ориентироваться пр...
Коллеги, всем привет ) вытаскиваю короткие текстовые запросы по контекстной близости первоначальная идея заключалась в том, что нужно вытащить запросы, близкие по контексту ,...
Коллеги, всем привет? как понимаю, при сравнении объектов чаще всего применяются "расстояния", например, евклидово или блок-сити, а для сравнения текстов/эмбеддингов - косинус...
Коллеги, файнтюним потихонечку ruGPT3medium от Сбер по рекомендациям поставили мксимально большой батч, который выдерживает Colab в данном случае 16 Для сравнения 16 эпох с...
Коллеги, всем привет ) подошел к задаче кластеризации коротких текстов на русском языке идею в целом вроде уловил и первые кластеризации KMeans сделал ) что можете порекомен...
Коллеги, всем привет ) какие модели хороши сейчас для транскрибации аудио?
Коллеги, всем привет) кто реально применял few-shooting? задача: на вопрос пользователя давать ответы на собственных данных. Модели на BERT-like и Базе Данных "Вопрос-Ответ" ...
Коллеги, всем привет ) есть книга по заданной теме, нужно сделать Базу Знаний формата "Вопрос-Ответ" вариант 1. вручную по абзацам/смыслам/заголовкам так пока и делаем воп...
Коллеги, всем привет ) какие модели хороши сейчас для транскрибации аудио? первоначально русский - для понимания схемы в целом )
Коллеги, всем привет ) есть аудиофайл на 2 канала разбивать по каналам умеем (делаем обнуления поочередно). это ок. транскрибировать каждую дорожку умеем. это ок. вопрос: ...
Коллеги, вопрос про BERT Question Answering начали тестировать на маленьких текстах отвечают, но нам нужно на на маленьких, а сразу книжку загрузить. и тогда ошибка. тензор пр...
Коллеги, всем привет ) могут ли сейчас сети самостоятельно классифицировать фразы, без изначального задания классов со стороны разработчика? например, есть база высказываний...
Коллеги, что добавить в код, чтобы во время обучения видеть не только ошибку на тренировочной выборки, но и ошибку на валидационной выборки? trainer = Trainer( model=mo...
получается, два альтернативных варианта 1. разбить весь документ на фрагменты/чанки, пройтись циклом по всем фрагметам, пытаясь вытащить ответ, выбрать лучший это экстракци...