есть берет вершины из инпут буфферов и записывает треугольники в аутпут. Как лучше организовать синхронизацию между потоками? Сделать чтобы каждый invocation обрабатывал каждый n-ый треугольник или реализовать через атомик?
Делал через атомик индекса треугольника. Работает хорошо если количество обрабатываемых треугольников между потоками примерно равны и нет общих вершин. Реализаця через wavefront не дало перфа.
Обсуждают сегодня