215 похожих чатов

7 ответов

8 просмотров

Смотри альфаго когда делали)) у них первый этап был такой же)) они учили по сыгранным партиям прогнозировать след ход.

Marianna-Kovalova Автор вопроса
Kostya bah
Смотри альфаго когда делали)) у них первый этап бы...

Тогда вот и ответ) читайте про альфаго и делайте)

Marianna Kovalova
Тогда вот и ответ) читайте про альфаго и делайте)

Там сложно все(((там использовали сверточные нейросети

Marianna-Kovalova Автор вопроса
Kostya bah
Там сложно все(((там использовали сверточные нейро...

Я не сильно интересовалась ни го, не альфаго, но, насколько слышала, то там все-таки rl. А ещё в этом rl, если не ошибаюсь, метод Монте-Карло. Может это поможет. Или придут умные люди и поймут, что такое шаблон в вашем случае)) и помогут хорошими советами

Marianna Kovalova
Я не сильно интересовалась ни го, не альфаго, но, ...

Правильно rl и монтекарло. У них было 4этапа. 4этап был как раз и монтекарло который использовал 3предыдущих этапа)) 1. обозначить вероятность каждого варианта. Самый сильныц и есть след ход 2 используя результат первого играла сама с собоц множество ДО КОНЦА делая разметку f(позиция) = оценка(0 до 1) 3 решение разметки это уже ml) 4 и все 3компонента это параметры монтекарло. Играла сама с собой уже с "пониманием позиции"

Kostya bah
Правильно rl и монтекарло. У них было 4этапа. 4эт...

Вы же понимаете, что вы так к "шаблонам" не придете? Это так, btw

Kostya bah
Правильно rl и монтекарло. У них было 4этапа. 4эт...

Я не знаю, тут уже упоминали или нет, но Есть KataGo, публичная реализация AlphaZero (апгрейд AlphaGo), которая может много вещей делать умных. Например, предсказывать хороший ход без Монте-Карло (такая сетка сама по себе имеет где-то 5й дан), предсказывать вероятность победить, и может оценивать территорию. Есть огромное количество предобученных чекпоинтов (готовые обученные нейросети) с разными ЭЛО рейтингами, от рандома до superhuman level. Если вам надо ваши ситуации классифицировать - можно взять предобученную сетку, натянуть поверх нее линейный классификатор и обучить на 500 примеров, а остальные предсказать обученной моделью.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта