что выбрать мультиязычный OpenAI embedding или bge-small-en для сентенс симилярити.
Китайский BAAI/bge-small-en является SOTA сейчас на рейтинге MTEB.
Не подскажете? У кого-то был опыт?
P.S. intfloat/multilingual-e5-base на 768 мой ЦПУ не тянет(
https://huggingface.co/intfloat/multilingual-e5-small
Там, кстати, 40 минут назад кто-то выложил запруненую ru_en версию
Обсуждают сегодня