Пользователь Anatoly Belov - 72 вопросов / Telegram Questions

Natural Language Processing / Anatoly Belov

Коллеги, похоже у меня затык с обучением gpt2 на собственных данных с валидационной выборкой прошу помочь 1. дообучить gpt2 на собственных данных без валидационной выборки я...

#nlp #programming #russian

25.07.2023

0

5 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) есть есть набор фраз, в том числе похожих, но не до степени сравнения подстрокой нужно определить наиболее часто встречающиеся сразу в лоб видится та...

#nlp #programming #russian

20.07.2023

0

12 ответов

Natural Language Processing / Anatoly Belov

Коллеги, все привет ) пришла пора выводить модельки из Colab во внешний мир, чтобы отправлять в них текст из внешнего источника, и получать результат обратно. Где рекоменду...

#nlp #programming #russian

04.10.2023

0

11 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) кто-нибудь дообучивал сети для машинного перевода собственными данными? например rut5-base-multitask Helsinki-NLP/opus-mt-mul-en facebook/nllb-200-dist...

#nlp #programming #russian

31.08.2023

0

11 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) исследую T5-small на обучение на собственных данных по задаче "translation" обучающая статья взята с huggingface https://huggingface.co/docs/transforme...

#nlp #programming #russian

02.10.2023

0

8 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) Как считаете, что теретически может дать лучше качество машинного перевода с русского на английский для перевода финансовых терминов и финансовой докум...

#nlp #programming #russian

10.08.2023

0

10 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) делаем систему автоматической поддержки пользователей другими словами - ответ на вопрос пользователя есть источник, на который нужно ориентироваться пр...

#nlp #programming #russian

21.07.2023

0

2 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) вытаскиваю короткие текстовые запросы по контекстной близости первоначальная идея заключалась в том, что нужно вытащить запросы, близкие по контексту ,...

#nlp #programming #russian

05.09.2023

0

4 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет? как понимаю, при сравнении объектов чаще всего применяются "расстояния", например, евклидово или блок-сити, а для сравнения текстов/эмбеддингов - косинус...

#nlp #programming #russian

27.08.2023

0

8 ответов

Natural Language Processing / Anatoly Belov

Коллеги, файнтюним потихонечку ruGPT3medium от Сбер по рекомендациям поставили мксимально большой батч, который выдерживает Colab в данном случае 16 Для сравнения 16 эпох с...

#nlp #programming #russian

12.07.2023

0

7 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) подошел к задаче кластеризации коротких текстов на русском языке идею в целом вроде уловил и первые кластеризации KMeans сделал ) что можете порекомен...

#nlp #programming #russian

18.08.2023

0

5 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) какие модели хороши сейчас для транскрибации аудио?

#nlp #programming #russian

26.07.2023

0

10 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет) кто реально применял few-shooting? задача: на вопрос пользователя давать ответы на собственных данных. Модели на BERT-like и Базе Данных "Вопрос-Ответ" ...

#nlp #programming #russian

11.07.2023

0

2 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) есть книга по заданной теме, нужно сделать Базу Знаний формата "Вопрос-Ответ" вариант 1. вручную по абзацам/смыслам/заголовкам так пока и делаем воп...

#nlp #programming #russian

19.07.2023

0

7 ответов

Распознавание и синтез речи / Anatoly Belov

Коллеги, всем привет ) какие модели хороши сейчас для транскрибации аудио? первоначально русский - для понимания схемы в целом )

#it #russian #speech-recognition

26.07.2023

0

8 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) есть аудиофайл на 2 канала разбивать по каналам умеем (делаем обнуления поочередно). это ок. транскрибировать каждую дорожку умеем. это ок. вопрос: ...

#nlp #programming #russian

03.08.2023

0

6 ответов

Natural Language Processing / Anatoly Belov

Коллеги, вопрос про BERT Question Answering начали тестировать на маленьких текстах отвечают, но нам нужно на на маленьких, а сразу книжку загрузить. и тогда ошибка. тензор пр...

#nlp #programming #russian

12.07.2023

0

6 ответов

Natural Language Processing / Anatoly Belov

Коллеги, всем привет ) могут ли сейчас сети самостоятельно классифицировать фразы, без изначального задания классов со стороны разработчика? например, есть база высказываний...

#nlp #programming #russian

17.08.2023

0

5 ответов

Natural Language Processing / Anatoly Belov

Коллеги, что добавить в код, чтобы во время обучения видеть не только ошибку на тренировочной выборки, но и ошибку на валидационной выборки? trainer = Trainer( model=mo...

#nlp #programming #russian

26.07.2023

0

5 ответов

Natural Language Processing / Anatoly Belov

получается, два альтернативных варианта 1. разбить весь документ на фрагменты/чанки, пройтись циклом по всем фрагметам, пытаясь вытащить ответ, выбрать лучший это экстракци...

#nlp #programming #russian

22.07.2023

0

3 ответов

967 чатов

Anatoly Belov

72 вопросов от belovanatoly