Привет всем. У меня такой вопрос. очень надеюсь на вашу

Question

Natural Language Processing & Text Mining

Привет всем. У меня такой вопрос. очень надеюсь на вашу

помощь.
Есть строка: анкер клиновой М10*130/10/15 холодный цинк. Я знаю, что этой строке соответствует строка: анкер М10*130. И у меня огромное количество таких сопоставлений в excel файле для разных наименований. Я хочу чтобы какой-то алгоритм обучился на моих данных и когда я покажу ему строчку формата: "анкерный болт клин М10*130/10/15 оцинк." он её понял и сказал мне что это "анкер М10*130". В строках, которые необходимо распознавать встречаются опечатки синонимы и т.д. То есть мне необходимо не вычленять суть а просто сопоставлять строки, которые могут отличаться от изначального датасета. Если алгоритм неправильно определит строку, я бы добавлял её в изначальный датасет, чтобы он делал сопоставление точнее.
В какую сторону мне смотреть? По какой теме информацию смотреть?

#programming #russian

0

04.08.2021