Похожие чаты

Всем привет :) А кто-то работает с поиском CNV из данных

иллюмины/бги (WES и WGS).
Я хочу использовать несколько тулов, чтоб сравнивать результаты и выдавать консенсунс как результат.
Проблема в том, что коллеры основанные на глубине прочтения (CNVkit/GATK-gCNV,etc) хотят панель нормальных пациентов. В нашем случае это все больные, из нескольких разных лабораторий, с немного разными китами и весьма разными годами секвенирования.
Как можно попробовать отсортировать образцы, чтоб они были +/- в одной группе по уровню тезнических шумов и имели один кит (учитывая огромную кучу мислейблов)?
Просто по названию лабы не получается, потому что разные года = разные машины зачастую и разные покрытия.

Я думал использовать covtobed с покрытием 50, делать пересечения бед-файлов и объединять в группу те, которые сходятся, например на 90% (с потолка цифра) - это будет одна группа и из неё выбирать сколько-то образцов чтоб построить PoN.
Это рабочий метод? Может есть какие-то другие решения?
Спасибо :)

8 ответов

21 просмотр

по моему опыту, в общем случае не получится объединить разные платформы. Будут дикие перекосы. Что можно сделать - 1) поделить всех на батчи (например взять mosdepth и по покрытию локусов на PCA поделить) 2) сделать для каждой платформы свою "среднюю норму/опухоль" 3) с помощью, например, Ascat посчитать CNA

У вас раковые данные или просто экзомы крови?

Georgii-Ozhegov Автор вопроса
Georgii-Ozhegov Автор вопроса
Nikita Kotlov
по моему опыту, в общем случае не получится объеди...

Спасибо :) Я вот как раз думаю как правильней их делить на батчи :)

Из алгоритмов вообще нельзя делать консенсус - посмотрите нашу работу по их воспроизводимости в разных диапазонах длин https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8277855/ . Т.е. все тулы про разное, и в зависимости от целей вам подойдут только 1-2-3 конкретных тула. Сейчас Вероника добавила тулы в анализ - свяжитесь с ней

Georgii-Ozhegov Автор вопроса
Elena Sharova
Из алгоритмов вообще нельзя делать консенсус - пос...

Спасибо :) Надеюсь там и gatk-gcnv будет в новых тулах :) Наверное да, это разумнее оставить какой-то более подходящий. Ну точнее отдельный для wes, отдельный для wgs, которые могут совпасть)

Elena Sharova
Из алгоритмов вообще нельзя делать консенсус - пос...

Посмотрел таблицу, возможно пропустил: неужели ни один тул не использует b allele frequency (процент аллелей в гетерозиготах )? Это же огромный пласт информации дополняющий покрытие. В раковой геномики вообще нельзя без этого.

Докину ещё статью для вдохновения, где оптимизировали параметры одного из тулов, используя ещё 2 других и сделали из всего этого пайплайн для WES/панелей sensitivity повысилась https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-021-04452-6

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
@Benzenoid can you tell me the easiest, and safest way to bu.y HEX now?
Živa Žena
20
This is a question from my wife who make a fortune with memes 😂😂 About the Migration and Tokens: 1. How will the old tokens be migrated to the new $LGCYX network? What is th...
🍿 °anton°
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
What is the Dex situation? Agora team started with the Pnetwork for their dex which helped them both with integration. It’s completed but as you can see from the Pnetwork ann...
Ben
1
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Anyone knows where there are some instructions or discort about failed bridge transactions ?
Jochem
21
@lozuk how do I get my phex copies of my ehex from a atomic wallet, to move to my rabby?
Justfrontin 👀
11
Карта сайта