функции каких-то белков, теперь возьмём белки совершенно на них не похожие (скоры симилярити низки , е-валуе высоки, выше рандома ) , то у нас нет шансов по первым сказать что-то о вторых? То есть обучай не обучай модели , как угодно, если симилярити на нуле , то ничего не сработает? Или все же нет ? Может симилярити через выравнивание не вполне правильное и может через хитрые эмбеды , модель что-то узнает ? Типа как ворд2век женщина +король = королева , хотя не было заложено априори
В этом есть большая философская задача, и на эту тему есть литература. Но да, если модель обучить на птицах, вряд ли она что-то разумное сможет сказать о рыбах. Вопрос в возможностях генерализации
Я думаю, какие-то низкоуровневые мотивы оно все-таки может выучить на первых и распознать на вторых. Типа альфа-спиралей/бета-листов и т.п.
А скинь ссылочки , если будет возможность, плиз
Вот тут, например, задача найти, где лажа))) https://www.nature.com/articles/s41467-023-38347-2 я думаю, я нашла
Обсуждают сегодня