какую сторону рыть.
нужно в большом файле заполненом буквами найти отрезки длинной 100 символов. внутри которых больше 70% содержимого это буква А например.
другими словами найти области где явно кучкуются одинаковые символы.
зависит от ограничений по памяти.
А нельзя тупо проходиться по символам в цикле(файл грузить частями, конечно), и хранить количество повторений символа искомого в последних 100 символах?
Обсуждают сегодня