Всем привет. Встала задачка восстановления пунктуации, собираю данные. Нашел много годного в corus, но в основном это новости и литература. При этом предполагается использоват...
Кто в курсе как из хагингфейсовских токенизаторов убирать нежелательные токены? Делаю так, результат не очевидный. Кроме того, как модель понимает, какие именно эмбеддинги ей ...
Господа, есть вопрос. Есть бот, работает уже долго и хорошо. На днях, что-то случилось. Возможно, после очередного апдейта, а, может, и нет. Бот стал присылать юзерам в случай...
Что-то ничего не гуглится, поэтому ответ скорее нет, но все же: можно ли инферить в fp16 на cpu?
Слышал такую тему, что модели со значениями некоторых гиперпараметров, равными степеням двойки обучаются на GPU быстрее. Есть че почитать/бенчмарки на эту тему?
Какие есть практики по тестированию бота, который уже запущен в продакшн? Делать тестовую копию вторым приложением? Есть что-то по-рациональней?
Как можно полностью ограничить в правах какую-то роль? Если вешать лямбда-функцию с проверкой на каждый хендлер, может быть слишком много запросов к БД. Есть какое-то нормальн...
От чего зависит кликабельность телефонных номеров? Кантрикоды есть, какие-то номера - не линки, какие-то - линки.
Кстати, насчёт "векторных бд" и similarity search. Есть словарь в pickle, где каждому ключу соответствует набор пар векторов. Где бы это лучше хранить и откуда быстрее читать?
Как вообще работают боты с тысячами юзеров? Сколько может стоить хостить такого бота, чтобы он не тормозил, отвечая всем?
У меня возникает очередь. Юзеры очень часто грузят фотки пачками, они отправляются в гугл-диск. Операция долгая, как быть? Хранить фотки в БД, не отправляя в реалтайме в диск?...
Вчера прислали вот такое и мне интересен третий вопрос. Понятно, что здесь переобучение на 10 фичах, но результат после добавления ещё 10 мне кажется не очевидным. Может кто-т...
pyTelegramBotAPI, "Bad Request: strings must be encoded in UTF-8" при попытке отправить документ. Чё за фигня, кто подскажет?
Где самое большое data science комьюнити? Рашка входит в топ-3?
Так как в итоге сохранять на сервере изменённую эксельку? В Гугле не вижу ни одного внятного примера, ежели я правильно гуглю. Причем с pickle вроде бы все окей, перезаписываю...
Чат, мне нужно как-то отследить время именно первого вызова некого хендлера. Как это сделать? Понятное дело, в голову идет какой-нибудь флаг просто, но юзер-то не один
чат, я использую apscheduler. Бот хостится на хероку на бесплатном тарифе, который засыпает через полчаса. Это может быть причиной того, что таймер aps не срабатывает?
Народец, подскажите Есть нейронка, обученная на неком датасете. Потом датасет расширился. Лучше дообучать нейронку на нем с существующими весами, или с нуля?
Почему выбрали именно чаты по DS для написания сотни сообщений с нулевой смысловой нагрузкой?
Я понимаю)) вопрос не в пикле, а в табличке, которую надо обновлять. Говорю, моя экселька не перезаписывается. А csv будет?