170 похожих чатов

React — русскоговорящее с...

Android Developers

Vue.js — русскоговорящее ...

Telegram Developers

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Angular - русскоговорящее...

Верстка сайтов HTML/CSS/J...

Kubernetes — русскоговоря...

Битрикс для разработчиков

MODX. Русскоязычное сообщ...

pgsql – PostgreSQL

iOS Developers — русского...

ClickHouse не тормозит

Rust — русскоговорящее со...

JavaScript — русскоговоря...

React Native — русскогово...

Docker — русскоговорящее ...

HTML/CSS — русскоговоряще...

Python beginners

🐧 RU.UBUNTU — Официальное...

Kotlin Community

Чат экстремального погром...

Scala User Group

Клуб Vue.js-разработчиков

Xamarin Developers (MAUI,...

Svelte [svelt] - All abou...

Системное администрирован...

Nuxt.js | Vue SSR

var chat = new Chat();

Data Science Chat

Ассемблер

Android Architecture

Laravel для начинающих

Церковь метрик

QA — русскоговорящее сооб...

R (язык программирования)

Big Data Science :: AI / ...

Delphi & Lazarus

Solidity Development

Evolution CMS официальное...

pro.net (former COM+)

OpenStreetMap RU

Visual Studio Code — русс...

GraphQL — русскоговорящее...

IDE и редакторы — русског...

OpenCartForum - 🇺🇦🇪🇺Чат O...

Angular.js (1.x) — русско...

Flutter Developers — русс...

AI / Искусственный Интелл...

Laravel Framework Russian...

Чат — Верстка Сайтов и Фр...

Java Underground

Natural Language Processi...

SqlCom.ru - сообщество MS...

Delphi Community

Server Side Swift Develop...

Autohotkey_RU ( v1 & v2 )

PHP DevConf KZ🇰🇿

pro.rb (Ruby/Rails / RU)

Odoo talks & fun

Software Design/Architect...

AndroidDev Pro:: Професси...

WordPress for developers

PowerShellRus - о Powersh...

Эльбрусы и с чем их едят

Java/Kotlin and more

pro.buildsystems

Python для анализа данных

Скрипты Гугл, Таблицы, Go...

Compiler Development

firebase_ru — русскоговор...

RU.CRYPTOGRAPHY — Криптог...

pro.osdev - os developmen...

GameDev for Web

PostgreSQL (English)

Tilda Developers

RU.Docker — Официальное Р...

Emacs — русскоговорящее с...

FreePascal & Lazarus

Язык программирования Jul...

WordPress – русскоговорящ...

ReasonML и OCaml

WebAssembly — русскоговор...

ansible — русскоговорящее...

Сrystal Lang — русскогово...

Clojure — русскоговорящее...

macOS Developers — русско...

DL in NLP discussion grou...

use Perl or die;

FORTH и родственные ЯП

Natural Language Processi...

Sequelize - community (en...

Elm Lang сообщество разра...

WordPress CodeRun

ReactiveX - русскоговорящ...

PureScript — русскоговоря...

Эликсир и Вунш

Natural Language Processing

Всем привет,объясните, пожалуйста, есть ли смысл стоить embedding-ги при

помощи:

- TF-IDF
- Word2Vec CBOW
- GloVe

если есть берты которые не только слова по отдельности представят в числовом виде, а и attention юзают блгодаря чему сохраняют связь между словами что позволяет вычленить гараздо больше инфы с текста.К примеру те же sentance transformers

В чем смысл юзать что либо иное?

- TF-IDF вообще только релевантность слов считает в рамках предложения, но никак не имитирует смысл слов и их связь.

(исходя из моего понимания,поправьте,пожалуйста, если я не прав)

- Word2Vec CBOW так то учитывает контекст, но attention для этого лучше,ИМХО.Смысл в этом подходе?

- GloVe (uses the semantic relationship between the words is obtained using a co-occurrence matrix)

тоже казалось бы как-то слова связывает между собой, но это все еще не attention.

Вопрос: зачем их юзают, и стоит ли в них углубляться если есть берты?

#nlp #programming #russian

0

22.11.2023

10 ответов

87 просмотров

Предполагаю что основная причина в том, что attention очень дорого считать, поправьте, если ошибаюсь

0

22.11.2023

единственный повод считать эмбеддинги чем-то кроме берта - это то, что TF-IDF заведётся на микроволновке, а берт нет

0

22.11.2023

Ilya Shigabeev
единственный повод считать эмбеддинги чем-то кроме...

Мелкий берт заведется

0

22.11.2023

Konstantin Galagan

TF-IDF хорошо ловит мусор, опечатки и тп., т.к. считает их очень важными из-за редкого употребления. Ну и ключевые слова (тэги) можно до кучи

0

22.11.2023

Gleb Maksimov Автор вопроса

Ilya Shigabeev
единственный повод считать эмбеддинги чем-то кроме...

но там же он не особо много инфы вычленит, толку 0 почти же, или я не прав?

0

22.11.2023

Gleb Maksimov
но там же он не особо много инфы вычленит, толку 0...

ещё как вычленит. Языки всегда сложно моделировать

0

22.11.2023

Gleb Maksimov
но там же он не особо много инфы вычленит, толку 0...

А какая задача, напомни?

0

22.11.2023

Gleb Maksimov Автор вопроса

Ilya Shigabeev
А какая задача, напомни?

та любая, от text-classification до text-generation

0

22.11.2023

Gleb Maksimov Автор вопроса

ну конкретно сейчас текст классифицирую)

0

22.11.2023

Gleb Maksimov
ну конкретно сейчас текст классифицирую)

Я бы сделал baseline на tfidf за пару часов со стеммингом, и если качество оказалось бы ниже приемлемого, ковырял бы bert

0

22.11.2023

Похожие вопросы

Natural Language Processing / Dmitriy

Подписаться

всем привет! 📗Есть задача генерации вопросов к тексту Посоветуйте что почитать ? Что использовать? дообучить, формат датасета

#nlp #programming #russian

06.09.2023

0

57 ответов

Natural Language Processing / Igor Chesnokov

Подписаться

Всем привет: после курса Andrew Ng Machine Learning Specialization играю с llama-2-7b-chat.ggmlv3.q8_0 и датасетом в форме текстов Сенеки. Ответы начинаются нормально, но под ...

#nlp #programming #russian

27.09.2023

0

10 ответов

Natural Language Processing / miteigi nemoto

Подписаться

Помогите интерпретировать результаты тестов. Почему большинство моделей имеют плохую релевантность? Даже те, что якобы на русский язык ориентированы. Сравнение разных моделей...

#nlp #programming #russian

06.08.2023

0

2 ответов

Natural Language Processing / datascience xc

Подписаться

Я пригласил девушку на свидание, мы договорились встретиться в 9. Я купил цветы и стал ждать ее, сидя на скамейке. Была прекрасная погода и у меня было хорошее настроение. В 1...

#nlp #programming #russian

15.09.2023

0

19 ответов

Natural Language Processing / vvv

Подписаться

Кейс с ChatGPT про 10.000 € в месяц 🤑 Интересно? Рассказываю. Есть компания, которая уже пару декад делает аналитику для торговых сетей. Они хороши в своем деле, что клиент...

#nlp #programming #russian

14.09.2023

0

5 ответов

Natural Language Processing / Serg Sk

Подписаться

Добрый день. Хочу взять RTX 4090. Или есть смысл заморачиваться и искать с жидкостным охлождением, когда модуль охлаждения отдельно. Может у кого есть какой-то полезный опыт в...

#nlp #programming #russian

16.11.2023

0

22 ответов

Natural Language Processing / Ростислав Корст

Подписаться

Всем привет! Подскажите, пожалуйста, для поиска использую e5 с векторами 1024 float32 Качество поиска фича similarity между запросом и документом супер растит, но соответстве...

#nlp #programming #russian

05.10.2023

0

21 ответов

Natural Language Processing / Владимир Кузовкин

Подписаться

коллеги,добрый вечер. У меня текст был разбит на несколько токенов. Все прекрасно, да вот беда: в нем очень часто идут повторения слов. Например первые три строки можно отнест...

#nlp #programming #russian

28.09.2023

0

23 ответов

Natural Language Processing / Oleg

Подписаться

Господа и дамы, ИИ эксперты, подскажите не знающему (кто чем сможет в любом виде: подходы, названия, ссылки, метрики) как получить ранжирующую модель, если есть пара тысяч отд...

#nlp #programming #russian

23.10.2023

0

2 ответов

Natural Language Processing / Nick

Подписаться

Привет! Кто знает, существует ли подобный этому leaderboard для русскоязычных embeddings?

#nlp #programming #russian

11.08.2023

0

27 ответов

Смотреть еще

Natural Language Processing

Подписаться

Вопросов 1570

Ответов 5203

Участников 5348

Telegram @natural_language_processing

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?

Rꙮman Yankꙮvsky

А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...

30500 за редактор? )

Владимир

а через ESC-код ?

Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится

У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...

Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...

Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...

Ребят в СИ можно реализовать ООП?

https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...

Карта сайта