использовать в июле 2023?
желательно что бы она GPU 16 -24 Gb входила
и с инференсом в 1-2с
Спасибо
На HF много моделей на T5
Доброго дня) В наше время проще взять будет готовое решение на базе GPT3.5/GPT4 по API или использовать что-то вроде TurboText - там как раз рерайт и генератор отзывов есть. Варианты на Т5 для английского неплохие (на русском ерунда только полная), но сильно уступают по развёрнутости и креативности в сравнении с вышеуказанными вариантами. Если нужны короткие отзывы, то T5 с дообучением подойдёт.
хотелось бы уйти от API ибо дорого т.к. планируется несколько сотен тысяч нужно локальное решение
Там цена 0.002$ за 1000 токенов. Если у вас короткие отзывы (50-300 токенов), то на 1$ вам хватит порядка 5000 отзывов
Кстати, а OpenAI API tokens округляет до 1000 или так считает? Цены всегда за 1000
Округляет только в конце месяца, а не за каждую генерацию. В личном кабинете идут потом цены за каждый вызов и в конце месяца, если 540341 токена потрачено, то округлят до 541К
порядка 10000 токенов в отзыве (
10000 токенов - это около 30000 символов, вы курсовые пишете или отзывы? Даже в 2000 символов отзывы читают менее 1% людей
и в 10000 токенов ни одна модель из HF генерировать не будет
покажите хоть одну такую модель, пожалуйста)
Та же mpt storywriter. Можно на Т5 алиби эмбеддинги натянуть
config.max_seq_len = 83968 # (input + output) tokens can now be up to 83968 и посмотрите в конфиг, где указано 4096, т.е. они обрезают по 4096 и потом склеивают их, чтобы обработать эти 83968, модель не принимает всю информацию из 84К токенов сразу, а делает партициями, из-за чего если подавать текст на 84К, где каждые 4К токенов будет разная информация, то модель запутается, потому что она уже не будет знать, что было ранее
еще BLOOM и RMT
Обсуждают сегодня