"fmt"
"io/ioutil"
"log"
"os"
"regexp"
"strings"
)
func main() {
// Тут предствлено решения на стандартных регулярках , в принципе не должна быть большая разница
// в большинстве случаев с интеловским hyperscan
PatternFile := flag.String("pattern", "bug.txt", "файл шаблона поиска")
Filetosearch := flag.String("file", "landscape.txt", "сам файл в котором будет поиск")
flag.Parse()
//считаем что файл для скорости у нас вмещается в память
//иначе придется читать кусками
filep, err := os.Open(*PatternFile)
if err != nil {
log.Fatal(err)
}
defer filep.Close()
b, err := ioutil.ReadAll(filep)
pattern_cnt := string(b)
file_landscape, err := os.Open(*Filetosearch)
if err != nil {
log.Fatal(err)
}
defer file_landscape.Close()
b_2, err := ioutil.ReadAll(file_landscape)
landscape_cnt := string(b_2)
// делаем escape метасимволов
pattern_cnt = regexp.QuoteMeta(pattern_cnt)
//Меняем и убираем перевод новых строк и также для универсальность пробелы перед ними на s+
pattern_cnt = strings.TrimSpace(pattern_cnt)
pattern_cnt = strings.Replace(pattern_cnt, " ", "\\s+", -1)
pattern_cnt = strings.Replace(pattern_cnt, "\n", "\\s+", -1)
//добавим опцию нежадности(ленивости) для ускорения
pattern_cnt = "(?U)" + pattern_cnt
re_bug := regexp.MustCompile(pattern_cnt)
//Тут в принципе может и индекс и сам найдейнный шаблон посмотреть
//for i, match := range re_bug.FindAllString(landscape_cnt, -1) {
// fmt.Println(match, "index : ", i)
//}
fmt.Println(len(re_bug.FindAllString(landscape_cnt, -1)))
}
кто ж тебя простыни кода учил в чат кидать
Обсуждают сегодня