возвращает эмбеддинги? 
                  
                  
                  конкретно речь идет об этой
                  
                  
                  https://huggingface.co/intfloat/multilingual-e5-base
                  
                  
                  
                  
                  
                  сейчас работает, работает неплохо с русским (она мультилингва)
                  
                  
                  ДС сосед вкинул идею, что неплохо бы их потюнить на наших текстах
                  
                  
                  текстов у нас, грубо, не более чем 3к
                  
                  
                  у меня есть ощущение, что это будет "мертвому припарка" (хотя зря я так, е5 хорошо работает у нас из коробки). 
                  
                  
                  
                  
                  
                  подскажите, пожалуйста, если у вас был опыт файнтюна подобных моделей или знания в теории, чего ожидать.
                  
                  
                
Только что обсуждали: https://t.me/natural_language_processing/72489 ;)
Обсуждают сегодня