на несколько образцов, полученная объединением нескольких однообразцовых, мне бы понять, как фильтровать снипы по генотипу одного из образцов. пробовал bcftools view -i 'FORMAT/GT[4] != "0/0"' (например, для того, чтоб убрать такие снипы, у которых пятый семпл имеет генотип не 0/0), но кажется это не работает, судя по аутпуту.
Такое через awk скорее всего проще сделать. bcftools не уверен, что может такое.
Ага, понял. Просто разработчики пакета пишут, что их тулы быстрее чем awk+cut+UNIX-утилиты, думал, что так лучше будет. awk так awk :^)
Ну если vcf не прямо огроменный, то разница в скорости не то чтобы сильно заметна
в несжатом виде 58 гб (семплов > 2K), но благо у меня есть время, чтоб подождать awk
Обсуждают сегодня