preprint argues, were never in the TCGA cancer samples at all.
А так можно было? В смысле, как удалось провернуть этот трюк?
Я думаю, имеется в виду, что сиквенсы (в том числе остатки человеческого генома) из образцов в базе данных были аннотированы как сиквенсы бактерий, которых в этих образцах и быть не могло... То ест сигнал есть, а идентифицированная бактерия неверная. Это один из аргументов авторов первоначальной статьи, что даже если бактерии неправильно идентифицированы, сигнал который они обнаружили все равно есть.
Да, спасибо, нашел благодаря вам этот момент в тексте: оказывается в январе 2023 авторам уже пихали и говорили, что в TCGA mislabeling. Я просто споткнулся об это утверждение: “The Nature study authors compared TCGA’s “nonhuman” sequences, as well as sequences from several dozen cancer-free people and 100 with cancer, with a database of DNA from bacteria, viruses, and other microbes.” А получается они возможно по факту и не сравнивали non-human сиквенсы с другими бактериальными БД, а сразу скармливали «левые» теги своей нейронке.
Обсуждают сегодня