текстов нужно получить? характеристики текста (длина, язык, частотность слов итп) или же какие-то числовые данные html страниц?
В этом вся и сложность, что так называемое задание состояло в том, что "надо прошерстить новости / статьи, выгрузить их, проанализировать на аномальные значения". Как это делать с числовыми значениями я определенное представление имею, а что делать с текстом и что считать аномалией, я не особо понимаю
Обсуждают сегодня