169 похожих чатов

Привет всем. У меня такой вопрос. очень надеюсь на вашу

помощь.
Есть строка: анкер клиновой М10*130/10/15 холодный цинк. Я знаю, что этой строке соответствует строка: анкер М10*130. И у меня огромное количество таких сопоставлений в excel файле для разных наименований. Я хочу чтобы какой-то алгоритм обучился на моих данных и когда я покажу ему строчку формата: "анкерный болт клин М10*130/10/15 оцинк." он её понял и сказал мне что это "анкер М10*130". В строках, которые необходимо распознавать встречаются опечатки синонимы и т.д. То есть мне необходимо не вычленять суть а просто сопоставлять строки, которые могут отличаться от изначального датасета. Если алгоритм неправильно определит строку, я бы добавлял её в изначальный датасет, чтобы он делал сопоставление точнее.
В какую сторону мне смотреть? По какой теме информацию смотреть?

6 ответов

36 просмотров

что с "дефолтным" bag of words + xgboost ? не пробовали?

дообучить берт на next sentence prediction, с лёту будет неплохо работать

Lik-Nani Автор вопроса

Даже на русском?

ну rubert

Тут лучше не bag of words, a bag of character ngrams (от 2 до 6 где-то), чтобы сходство "анкер" и "анкерный" уловить.

да в классических схемах была еще и лемматизация. пробовать надо.

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Ребят в СИ можно реализовать ООП?
Николай
33
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Карта сайта