повторяющиеся команды зациклить, чтобы не хардкодить? В папках K и E есть подпапки с файлами, со всеми из которых надо провести одно и то же. Вот пример повторяющегося кода.
k1_files <-
list.files("~/NGS/dmel_seqs/Analysis/K/k1", full.names = TRUE)
k1_data <-
map_df(k1_files,
~ read_delim(
.,
delim = "\t",
comment = "#",
col_names = c("CHROM", "POS", "ID", "REF", "ALT", "QUAL", "FILTER", "INFO", "FORMAT", "test")
))
unique_variants_k1_sample <- anti_join(k1_data, common_variants, by = c("CHROM", "POS", "ID", "REF", "ALT"))
k5_files <-
list.files("~/NGS/dmel_seqs/Analysis/K/k5", full.names = TRUE)
k5_data <-
map_df(k5_files,
~ read_delim(
.,
delim = "\t",
comment = "#",
col_names = c("CHROM", "POS", "ID", "REF", "ALT", "QUAL", "FILTER", "INFO", "FORMAT", "test")
))
unique_variants_k5_sample <- anti_join(k5_data, common_variants, by = c("CHROM", "POS", "ID", "REF", "ALT")
так? # Список папок верхнего уровня folders <- c("~/NGS/dmel_seqs/Analysis/K", "~/NGS/dmel_seqs/Analysis/E") # Для каждой папки... for (folder in folders) { # Получаем список подпапок subfolders <- list.dirs(folder, recursive = FALSE) for (subfolder in subfolders) { # Список файлов files <- list.files(subfolder, full.names = TRUE) # Чтение файлов data <- purrr::map_df(files, ~ readr::read_delim( ., delim = "\t", comment = "#", col_names = c("CHROM", "POS", "ID", "REF", "ALT", "QUAL", "FILTER", "INFO", "FORMAT", "test") )) # Удаление общих вариантов assign(paste0("unique_variants_", basename(subfolder), "_sample"), dplyr::anti_join(data, common_variants, by = c("CHROM", "POS", "ID", "REF", "ALT"))) } } [на правах чатгпт]
О, я думала циклы в R это неправославно :) Сейчас делаю через функцию и map, как мне Лена предложила.
смотря для чего неправославно Если там разница в performance околонулевая, а читабельность выше - лучше предпочесть читабельность
думали совершенно верно, так нельзя
Как меня научили в том числе в этом чате (а особенно книги Викхама), подход с использованием функций и map более читаемый чем вложенные циклы
readr вообще умеет читать всю директорию. параметр id указывает колонку с путем к файлу. https://readr.tidyverse.org/reference/read_delim.html
можно самостоятельно убрать это безобразие? тем более, чатгптшное
https://github.com/cwickham/purrr-tutorial
Обсуждают сегодня