там я уже не шарю, пусть лучше кто поумнее ответит
Тут наверное стоит перефразировать, насколько хорошо себя показывали эмбеддинги (руберта/сберта/ruuse, например), в задаче сопоставления вопроса и документа (ранжирования мб)
https://paperswithcode.com/sota/zero-shot-text-search-on-beir
Есть довольно хорошо себя зарекомендовавший подход Dense Passage Retrieval, там используются разные энкодеры для запроса и документов, плюс третья модель Reader. https://github.com/facebookresearch/DPR
Обсуждают сегодня