170 похожих чатов

Hello, I am currently working on an nlp project. I

have a problem with my work. Can you please help me with this problem when you have time?
Problem:
I have a large dataset of questions and answers, in the dataset where a user enters a new question, I need to get the answer of a question that is similar to his question

What I did:
I used cosine similarity but the accuracy is very low

What should I do now? I would be very grateful if you could help me #question #nlp

6 ответов

16 просмотров

Just an idea out of the blue 🤪 have you tried Euclidean distance or dot product insteaad of cosine similarity?

Shohrux Isakov- Автор вопроса
Toma Solo
Just an idea out of the blue 🤪 have you tried Eucl...

Thank you for your attention, I will try it now

1) What is the language of the questions? 2) What features did you use to compute the vectors that you later compare with cosine similarity? For English questions, one of the best encoders to get the vectors is https://huggingface.co/sentence-transformers/multi-qa-mpnet-base-dot-v1. For 50 other languages, a good model is https://huggingface.co/sentence-transformers/paraphrase-multilingual-mpnet-base-v2, but it is not optimized for questions specifically.

Shohrux Isakov
uzbek language

Uzbek is not in that list, as far as I know. But it is included, for example, in LaBSE: https://huggingface.co/sentence-transformers/LaBSE.

Shohrux Isakov- Автор вопроса

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта