основе обучения без учителя, или теперь и без этого все хорошо?
Можете привести пример задачи?
Пример - загружаете техническую документацию на устройство и получаете список его узлов и возможных манипуляций с ними
Составление онтологии здесь нужно для упрощения поиска или же например составление автоопросника для обучения?
Кейсов много, включая перечисленные, добавьте реверс-инжиниринг бизнес процессов, к примеру. Но интересует имменно SOTA на саму задачу - тестовые данные, бенчмарки и лидерборд.
При возможности построения хороших эмбеддингов онтология в явном виде редко кому нужна, пространства на котором можно решать разные задачи обычно достаточно. Да и метрику качества автоматической онтологии не так просто хорошую ввести.
Да этот ответ предусмотрен в части вопроса "теперь и без этого все хорошо" ;-)
На практике сейчас работает такая схема: 1) при старте решения задачи, собираешь весь материал который есть по процессу (описание, диаграммы и тд) 2) делаешь выжимку через gpt-4, указывая под какую задачу ты хочешь сделать онтологию 3) просишь сделать первую версию онтологии, итеративно смотришь на нее глазами, и дополняешь 4) промтишь мапить новые данные (те которые сразу не поместились в контекст) в эту онтологию. Если данные не могут быть смаплены (например ответвление процесса), делаешь промт на расширение онтологии 5) самое главное определить точки входа человека в этот процесс, чтобы он дал свой фидбек. Gpt4 очень хорошо структурирует, и за счет common scenes может накидать скелет любого процесса, дальше уже в human feedback уточняешь. С поиском другая история, там в целом просто метой нужно правильно обогащать, потом из каждого объекта ее извлекать и сначала по ней фильтровать объекты
Ох как четко и понятно. Потом компактное представление онтологии на вход в GPT, чтобы он мог на месте выбрать самое релевантное для конкретной задачи? Или просто хардкодить ветки по параметрам задачи? (2) не пробовали давать при review онтологии собранный feedback для её дальнейшей оптимизации? (У меня GPT неплохие идеи выдает на этом этапе)
Обсуждают сегодня