Пользователь Kir L - 60 вопросов / Telegram Questions

всем доброй ночи. У кого-то есть опыт файнтюна модели, которая возвращает эмбеддинги? конкретно речь идет об этой https://huggingface.co/intfloat/multilingual-e5-base сейчас...

#nlp #programming #russian

20.09.2023

0

1 ответов

Natural Language Processing / Kir L

всем привет! есть такой эмбеддер https://huggingface.co/intfloat/multilingual-e5-large там в карточке модели есть два способа ее использовать: через торч и через sentencetran...

#nlp #programming #russian

28.09.2023

0

3 ответов

Natural Language Processing / Kir L

друзья, вернемся от ЛЛМ к "классике" немного первый раз классифицирую мало текстов - по 200 на класс, 10 классов (примерно 2к сэмплов всего) подскажите по своему опыту, пожалу...

#nlp #programming #russian

26.07.2023

0

2 ответов

Natural Language Processing / Kir L

друзья, вчера спрашивал, но ответа не было посоветуйте НЕ tiny (бошую!) модель руссского берта с ХФ для файнтюна для классификации малых данных ;( диппавлов норм? DeepPavlov/...

#nlp #programming #russian

27.07.2023

0

4 ответов

Natural Language Processing / Kir L

всем привет вопрос тем, кто съел собаку на чат-ГПТ есть миллионный диалог (примерно столько сообщений), "размечены" по задающему вопросы и отвечающему (грубо - клиент: операт...

#nlp #programming #russian

04.05.2023

0

3 ответов

Natural Language Processing / Kir L

коллеги, вернусь к своим классификационным трагедиям. напомню, тексты от 50 до 5к слов, медиана 750, текстов было 750 сэмплов, F1 0.72 (плохая точность, сносная полнота). Сег...

#nlp #programming #russian

10.08.2022

0

3 ответов

Natural Language Processing / Kir L

всем доброе утро вопрос скорее общий, но данные текстовые, решил тут спросить предсказываю 4 класса по очень коротким текстам сейчас рок 0.93, а ф1 взвешенная 0.76, начальник ...

#nlp #programming #russian

17.12.2022

0

1 ответов

Natural Language Processing / Kir L

всем привет не уверен, что тут, но недавно обсуждалась тема text2sql интересно ее следующее обобщение: кто знает, можно ли чатГПТ подсунуть в каком-то виду таблицу, например, ...

#nlp #programming #russian

01.06.2023

0

3 ответов

Natural Language Processing / Kir L

друзья, каков вообще риск получить критически разную векторизацию с помощью Е5 (large) на ЦПУ и ГПУ? вижу по гуглу, что такое у кого-то бывало. векторизую базу локально на ЦП...

#nlp #programming #russian

22.09.2023

0

1 ответов

Natural Language Processing / Kir L

друзья, простите, если не совсем по теме канала вопрос тем, кто съел собаку на всяких чат-бот платформах представьте, что вы запилили какой-то МВП прототип чат-бот-сервиса, ко...

#nlp #programming #russian

20.01.2022

0

1 ответов

Natural Language Processing / Kir L

коллеги, всем привет о классификации текстов от абзаца до страницы, медиана 750 слов, текстов мало (750 сэмплов). Бинарная, соотношение целевого класса к прочему 1:2 (примерн...

#nlp #programming #russian

09.08.2022

0

1 ответов

Data Science Chat / Kir L

коллеги, вернусь к кластеризации и снижении размерностей данных "из коробки" получилось 430к фич (ТФидф помог) что кластеринг, что РСА - вылетает кернел как правильно поступит...

#database #programming #russian #software

31.05.2023

0

1 ответов

Natural Language Processing / Kir L

удивительная история грид с одной нграммой символов 3..5 и несколькими большими (больше 100) С для логрега вешает мой мак м1 до смертельной перезагрузки. Похоже, мне пора в ко...

#nlp #programming #russian

31.10.2022

0

1 ответов

Data Science Chat / Kir L

коллеги, не совсем по ДС вопрос, но может подскажете есть тест с assert'ом, ассерт сравнивает идеальный словарь с тем, что генерит код. в словаре значения - списки. и иногда ...

#database #programming #russian #software

15.04.2022

0

1 ответов

Data Science Chat / Kir L

друзья, а можно на правах пятницы как всегда "о бане"?( вот я закрепился на работе, не самой лучше, но все же, иногда сеньорю, иногда джуню, но чаще второе. все вокруг NLP, ч...

#database #programming #russian #software

06.09.2019

0

1 ответов

Natural Language Processing / Kir L

Коллеги, может у кого-то будут идеи. Извлекаем наименования компаний из текста, который весь в нижнем регистре. Наташей. Увы, из-за нижнего регистра получается плохая полнота....

#nlp #programming #russian

07.08.2021

0

2 ответов

Natural Language Processing / Kir L

Товарищи, склоняю имена Арина, Алена с помощью пайморфи, он думает, что это мужские имена Арин и Ален, и соответственно склоняю. Есть у кого-то идеи, как принудить его думать,...

#nlp #programming #russian

25.08.2021

0

3 ответов

Data Science Chat / Kir L

получается, один эксперимент это примерно 5000 строк?

#database #programming #russian #software

19.08.2022

0

3 ответов

Распознавание и синтез речи / Kir L

привет, продублирую тут вопрос. есть яндекс спич кит, спич ту текст почему-то выписывает реплики с именами собственными и названиями с маленькой буквы, даже имена людей поулча...

#it #russian #speech-recognition

08.08.2021

0

2 ответов

Data Science Chat / Kir L

--- В связи с этой же задачей такой вопрос. Я векторизую (с помощью USE) миллион записей, кладу вектора в датафрейм в отдельный столбец. Все отрабатывает отлично (правда за 1...

#database #programming #russian #software

11.09.2020

0

2 ответов

967 чатов

Kir L

60 вопросов от dzhkn42