Ребята, подскажите, есть ли стать/исследования/анекдотичные данные))) по поводу того как длинна вектора влияет на точность СТС? Хочу переехать с 1024 на 512, а то индекс заним...
Коллеги, сейчас померил по СТСбенчмарку запруненную е5 (ну у обычной думаю результаты такие же будет) и получилось: маленькая 0,83 базовая 0,84 большая 0,85 При разнице в ра...
@cointegrated А вы случайно не выкладывали в открытый доступ скрипт обучения вашей модели rubert-base-cased-dp-paraphrase-detection на датасете merionum/ru_paraphraser ?
Коллеги, а стоит ли дообучать е5 на семантический поиск на общедоступных датасетах, типа https://huggingface.co/datasets/merionum/ru_paraphraser или она из коробки хороша и е...
Коллеги, как думает, задача поиска (типа товара в инет магазине и вот все такое подобное), это какая задача - извлечение информации (QA), схожесть текста (STS), NLI? Вопрос к ...
Коллеги, доброе утро! Подскажите по предобученным sbert для русского языка - кто чем пользуется (для классификации документов и извлечения эмбеддингов)? Я пока взял sbert_lar...