Здравствуйте. Подскажите, пожалуйста, знатоки библиотеки transformers от Huggingface в чем

Question

Здравствуйте. Подскажите, пожалуйста, знатоки библиотеки transformers от Huggingface в чем

может быть причина, что в функции generate не работают bad_words_ids?
Пытаюсь убрать ряд слов
bad_words_ids = tokenizer(["word"]).input_ids но слово как появлялось в выходе Bart, так и появляется

#nlp #programming #russian

0

24.11.2021

2 ответов

32 просмотра

Dmitry S Автор вопроса

[[30112], [34063], [15545, 1952], [21928, 12, 5406], [42351, 661]] Вот такой вид имеет массив bad_words_id который подаю в модель

0

24.11.2021

Ilya Gusev · Accepted Answer

Ilya Gusev

Dmitry S
[[30112], [34063], [15545, 1952], [21928, 12, 5406...

Не выглядит, как что-то криминальное В доках советуют делать вот так: tokenizer(bad_word, add_prefix_space=True).input_ids, возможно проблема именно в add_prefix_space

0

24.11.2021

170 похожих чатов

Здравствуйте. Подскажите, пожалуйста, знатоки библиотеки transformers от Huggingface в чем

2 ответов

Похожие вопросы