можно хотеть определять над байтами, над кодпоинтами, или над egc, в полной зависимости от вводных. И не автоматически отдаёт предпочтение каким-то конкретным вариантам представления строки, типа [ucs4], я правильно понимаю?
RGA определён для последовательности, а не текста, поэтому для кодпойнтов (независимо от версии UCS) работает отлично, а для EGC, во-первых алгоритм сложнее, во-вторых, будет странно, если в новой версии юникода старые кластеры будут разбиты по-новому
Обсуждают сегодня