искать 7 строк по первым трем строкам.(это даты время и даты) а остальные строки могут быть любыми поэтому их нужно просо брать и все. как такое сделать?
даты в первой и третьей строке одинаковые?
а откуда ты взял такие данные? Может они в каком-то распространённом формате под который есть библиотека?
я бы сделала просто rg -P '([0-2][0-9]|3[01])\.(0[0-9]|1[0-2])\.[0-9]{4}\n(2[0-3]|[01][0-9]):([0-5][0-9])\n\1\.\2\.\3' -A 4
transaction_pattern = r'([0-2][0-9]|3[01])\.(0[0-9]|1[0-2])\.[0-9]{4}\n(2[0-3]|[01][0-9]):([0-5][0-9])\n\1\.\2\.\3' matches = re.findall(transaction_pattern, pdf_text) print(matches) [('05', '09', '20', '10'), ('05', '09', '20', '09'), ('05', '09', '20', '09')] чет не то он выводит.
может я что-то не так делаю? transaction_pattern = r'([0-2][0-9]|3[01])\.(0[0-9]|1[0-2])\.([0-9]{4})\n(2[0-3]|[01][0-9]):([0-5][0-9])\n\1\.\2\.\3' matches = re.findall(transaction_pattern, pdf_text) print(matches)
результат правильный
Обсуждают сегодня