по суммаризации, очень полезно. А есть ли где-то последняя часть цикла про метрики качества? На Хабре не могу найти ссылку. Спасибо!
Спасибо за добрые слова. А она не вышла, с декабря особо времени не было. Но обязательно в ближайшие месяцы выйдет :)
Там можно коротко написать: 1. Любая языковая модель индуцирует метрику качества суммаризации 2. Все метрики качества суммаризации - говно, особенно rouge1, которая индуцирована униграмной моделью :)
1. Да. 2. Да, но вопрос в том, насколько одна говнянее другой
А что за цикл статей? Ссылки на архив киньте?
Это скорее научно-популярный цикл, начало вот: https://habr.com/ru/post/595517/
Да, хороший обзор. А диссер о чем?
Да примерно о том же, о реферировании новостей в 3 вариантах: генерации заголовков, генерации реферата по одному документу, генерации реферата по нескольким документам
Новости - скучный объект IMHO. Там первое предложение уже даёт 80% соты. На фронтире - суммаризация длинных текстов, особенно разговорных
Для двух из трёх вариантов это не так. Про "фронтир" я скорее не согласен, разговорные тексты это интересено, но задачи про них едва ли можно ставить однозначно выше задач про всё остальное.
Обсуждают сегодня