170 похожих чатов

Доброго дня всем! подскажите какую LLM для рерайтинга отзывов ( английские)

использовать в июле 2023?
желательно что бы она GPU 16 -24 Gb входила
и с инференсом в 1-2с
Спасибо

15 ответов

22 просмотра

На HF много моделей на T5

Доброго дня) В наше время проще взять будет готовое решение на базе GPT3.5/GPT4 по API или использовать что-то вроде TurboText - там как раз рерайт и генератор отзывов есть. Варианты на Т5 для английского неплохие (на русском ерунда только полная), но сильно уступают по развёрнутости и креативности в сравнении с вышеуказанными вариантами. Если нужны короткие отзывы, то T5 с дообучением подойдёт.

Dmitriy- Автор вопроса
Олег Рубан
Доброго дня) В наше время проще взять будет готово...

хотелось бы уйти от API ибо дорого т.к. планируется несколько сотен тысяч нужно локальное решение

Там цена 0.002$ за 1000 токенов. Если у вас короткие отзывы (50-300 токенов), то на 1$ вам хватит порядка 5000 отзывов

Олег Рубан
Там цена 0.002$ за 1000 токенов. Если у вас коротк...

Кстати, а OpenAI API tokens округляет до 1000 или так считает? Цены всегда за 1000

Rinat Abdullin
Кстати, а OpenAI API tokens округляет до 1000 или ...

Округляет только в конце месяца, а не за каждую генерацию. В личном кабинете идут потом цены за каждый вызов и в конце месяца, если 540341 токена потрачено, то округлят до 541К

Dmitriy- Автор вопроса
Dmitriy
порядка 10000 токенов в отзыве (

10000 токенов - это около 30000 символов, вы курсовые пишете или отзывы? Даже в 2000 символов отзывы читают менее 1% людей

Dmitriy
порядка 10000 токенов в отзыве (

и в 10000 токенов ни одна модель из HF генерировать не будет

datascience xc
Будет

покажите хоть одну такую модель, пожалуйста)

Та же mpt storywriter. Можно на Т5 алиби эмбеддинги натянуть

datascience xc
Та же mpt storywriter. Можно на Т5 алиби эмбеддинг...

config.max_seq_len = 83968 # (input + output) tokens can now be up to 83968 и посмотрите в конфиг, где указано 4096, т.е. они обрезают по 4096 и потом склеивают их, чтобы обработать эти 83968, модель не принимает всю информацию из 84К токенов сразу, а делает партициями, из-за чего если подавать текст на 84К, где каждые 4К токенов будет разная информация, то модель запутается, потому что она уже не будет знать, что было ранее

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
5
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Ребят в СИ можно реализовать ООП?
Николай
33
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Карта сайта