170 похожих чатов

Товарищи, добрый день! Такой вопрос: вот у меня есть несколько

частотных распределений subword tokens (упорядоченных по рангу), и они ложатся более-менее в распределение Ципфа (=на лог-лог шкале получается прямая линия).

НО: хотелось бы как-то измерить это "более-менее". То есть если нам дано реальное распределение, посчитать степень отклонения от идеального распределения Ципфа или, например, аппроксимировать значения альфы-бэты самого близкого распределения Ципфа.

Не подскажете ли случайно, может, есть какие-то готовые/близкие решения?

1 ответов

6 просмотров

Значения параметров распределения Ципфа (или похожего на него, но более простого распределения Парето) можно оценить методом максимального правдоподобия (вот пример вывода формулы для Парето). Сравнить степень отклонения реального распределения от идеального можно с помощью статистики Колмогорова-Смирнова. Если я ничего не путаю, и то и другое умеет считать scipy.

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Я вот подумал. SSE выполняет операции максимум с 64-битной точностью. А FPU - всегда с 80-битной. Разве не должно быть FPU точнее тогда?
The Bird of Hermes
13
как быть с принтером? такой подход прокатит?
zamtmn
12
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Я не понимаю, это троллинг или что? Швабрика поддерживают, который буквально пишет на ассемблере взаимодействия с винапи. Я это ещё написал загрузчик и хоть что-то изучаю в о...
Shadow Akira
6
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Карта сайта