79 строк с учетом use, пустых строк и комментов. пишу на расте что то +- серьезное совсем недолго, хотелось бы узнать какие моменты можно сделать более "растовым" способом и вообще мнение почитать
Кидай на rust-playground наверняка что-то подскажут
https://play.rust-lang.org/?version=stable&mode=debug&edition=2021&gist=dc2253633bbacad6cd6feff2a88ea019 заранее спасибо)
Лишние коллекты убираются, сейчас покажу
А зачем там асинк?
в будущем будет поднянут reqwest с запросами. конкретно в этой функции скорее всего да, он не будет нужен, тут уже убрать забыл просто. этот кусок примерно 1/5 всей задачи выполняет
А такой вопросик: сохранение порядка элементов имеет значение? В плане важно ли видеть multiple_bdu в конце bdu_codes?
нет, порядок может быть абсолютно любым. тут просто первым пришло в голову аппенд сделать)
async fn parse_report(path: impl AsRef<Path>) { // read report file let src_report = fs::read_to_string(path).unwrap(); // setup parser and selector let html = Html::parse_fragment(&src_report); let selector = Selector::parse(r#"td[class="bdu"]"#).unwrap(); // get all bdu codes from report with BDU:XXXX-XXXXX format let many_bdu_codes = html .select(&selector) .map(|bdu| bdu.inner_html()); // retrieve all codes at once, getting many of them at each step let bdu_codes: Vec<_> = many_bdu_codes.flat_map(|mut multicode| { // the key part to do less than more; by splitting off before <br>s // we're getting the shared logic between two similar algorithms multicode.push_str("<br>"); std::iter::from_fn(move || { let rest = multicode.split_off(multicode.find("<br>")?); let mut code = std::mem::replace(&mut multicode, rest); code.replace_range(..code.find(':')?, ""); Some(code) }) }).collect(); println!("{:#?}", bdu_codes); } Не проверял работоспособность, но вроде бы так
а магию с from_fn и multicode.split_off(multicode.find("<br>")?) нельзя заменить на multicode.split("<br>")?
fn parse_report(path: &str) { let report = std::fs::read_to_string("/home/nikolay/Desktop/otchet.html").unwrap(); let html = Html::parse_fragment(&report); let bdu_selector = Selector::parse(r#"td[class="bdu"]"#).unwrap(); let cells = html.select(&bdu_selector).map(|bdu| bdu.inner_html()); for cell in cells { for bdu in cell.split("<br>") { let (_, bdu) = bdu.split_once(':').unwrap(); println!("{:#?}", bdu); } } } еще у знакомого спросил, как это лучше сделать. он вот такой вариант предложил, работает ровно так, как нужно(без контейнеров правда, но это дело 2 строчек). и по конструкциям очень простой для понимания. у меня сказывается привычка к c#, пока не до конца отвык от его логики и в раст протаскиваю это все. но вам все равно спасибо больше за уделенное время, этот вариант тоже разберу для понимания тех конструкций)
Обсуждают сегодня