и аренде квартир, которые собираются с других сайтов.
Проблема заключается в том, что пользователи иногда не корректно публикуют объявления, чаще всего пропускают одну цифру или наоборот добавляют лишний НОЛЬ в цене.
К примеру, вместо 124кв, в объявлении по ошибке написано 1240кв.
или вместо 2 000 000 рублей по ошибке пишут 20 000 000 рублей.
Мне нужен механизм, при помощи которого я смогу выявлять, такие объявления.
Может у кого-то был такой опыт?
Как эффективнее всего сделать это?
Буду признателен вам за любую информацию.
сравни площадь и другие значимые признаки с ценой (или наоборот площадью) и убери лишний ноль при случае? если вокруге везде за 40кв 5млн, а у тебя 50, то у дали ноль?
Построить набор простых регрессоров, фичи - н-1 признаков, таргет - последний признак. Будет н моделей. Загоняешь объявления и смотришь, где предсказание отличается на порядок
для ошибок в словах погугли spelling correction
Обсуждают сегодня