IPB

Добро пожаловать, гость ( Вход | Регистрация )

> Гамма-распределение
UNDEFEAT
7.5.2023, 21:37
Сообщение #1


Avorthoren
****

Группа: Модераторы BrainGames
Сообщений: 3 864
Регистрация: 13.11.2010
Из: Kиев
Пользователь №: 21 696



Добрый день всем посвящённым в статистику smile.gif

Я не посвящён, потому был бы очень благодарен, если кто-то мне поможет с решением данной проблемы.
Есть случайная величина, которая описывается гамма-распределением с неизвестными параметрами. Есть выборка значений этой СВ. Задача:
1. Найти матожидание.
2. В некой информативной форме указать характеристическое отклонение от матожидания.
Я могу найти параметры k и theta распределения, откуда я автоматически получаю среднее:
EX = k * theta
И дисперсию:
DX = k * theta * theta
Также я могу получить среднеквадратичное отклонение:
sigma = sqrt(DX)
Но оно совершенно неинформативно, потому что иногда оно больше среднего значения, потому могут получаться записи вида:
10 ± 12
Но гамма-распределение оперирует случайными величинами, которые всегда положительны. Оно несимметрично, потому "среднее отклонение влево" (если так можно выразиться) будет меньше "среднего отклонения вправо". Хотелось бы найти такое р, для которого будет простая формула для двух величин dl и dr таких, что:
1) Вероятность того, что значение СВ лежит на отрезке [EX - dl; EX] равна p.
2) Вероятность того, что значение СВ лежит на отрезке [EX; EX + dr] равна p.

Может кто уже сталкивался с такой проблемой? Моя первая идея была найти p при dr = sigma, а уже отсюда найти dl, но как-то пока не получается biggrin.gif

Сообщение было отредактировано UNDEFEAT: 8.5.2023, 21:24
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
 
Ответить в эту темуОткрыть новую тему
Ответов
alan
8.5.2023, 20:29
Сообщение #2


zzz...
*****

Группа: Администраторы Braingames
Сообщений: 13 545
Регистрация: 23.2.2009
Из: Симферополь
Пользователь №: 13 114



Я со статистикой имел много дела, но уже давно.
Потому мое неэкспертное мнение:

Мат ожидание любой величины будет обычным средним, независимо от ее распределения. Наиболее точным способом его определить именно взять среднее, а не аппроксимировать данные кривой и потом брать среднее от этой аналитической функции. Во втором случае результат сильно зависит от метода аппроксимации.

С дисперсией сложнее. Дисперсия это характеристика "ширины" распределения по сути, и обычно она считается для определения доверительного интервала. Но вот если величина распределена не по Гаусу то это не лучший способ определить доверительный интервал.
В данном случае для theta > 1 дисперсия обязана быть больше среднего, так что 10 ± 12 абсолютно адекватная штука. Вопрос в том как ее интерпретировать.

Тут главный вопрос - зачем тебе нужно знать матожидание и "характеристическое отклонение от матожидания"?

QUOTE
Хотелось бы найти такое р, для которого будет простая формула для двух величин dl и dr таких, что:
1) Вероятность того, что значение СВ лежит на отрезке [EX - dl; EX] равна p.
2) Вероятность того, что значение СВ лежит на отрезке [EX; EX + dr] равна p.

если только за этим то это можно сделать даже программно, рассчитав интегралы от аналитической функции распределения. вероятность это ж обычный интеграл от функции, никакой мистики, вот и приравняй их, забудь про дисперсию.
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
UNDEFEAT
8.5.2023, 21:20
Сообщение #3


Avorthoren
****

Группа: Модераторы BrainGames
Сообщений: 3 864
Регистрация: 13.11.2010
Из: Kиев
Пользователь №: 21 696



QUOTE(alan @ 8.5.2023, 20:29) *
С дисперсией сложнее. Дисперсия это характеристика "ширины" распределения по сути, и обычно она считается для определения доверительного интервала.
...
В данном случае для theta > 1 дисперсия обязана быть больше среднего, так что 10 ± 12 абсолютно адекватная штука. Вопрос в том как ее интерпретировать.


Мне кажется, ты немного путаешь дисперсию, среднеквадратическое отклонение и ширину интервала, в который значения СВ будут попадать с конкретной вероятностью.
Ну и в примере "10 ± 12" второе число - это не дисперсия, а среднеквадратичное отклонение, sigma, корень квадратный из дисперсии.

QUOTE(alan @ 8.5.2023, 20:29) *
Тут главный вопрос - зачем тебе нужно знать матожидание и "характеристическое отклонение от матожидания"?


Чтобы сравнить несколько выборок для разных СВ и выбрать самую подходящую из них. Например, если две будут иметь одинаковое матожидание, то я выберу ту, у которой меньший разброс.

QUOTE(alan @ 8.5.2023, 20:29) *
если только за этим то это можно сделать даже программно, рассчитав интегралы от аналитической функции распределения. вероятность это ж обычный интеграл от функции, никакой мистики, вот и приравняй их, забудь про дисперсию.


Я понимаю, что я могу выбрать любое понравившееся мне р, а потом "подобрать" соответствующий интервал, на котором значения двух описанных выше интегралов будут равны р. Собственно, программно я это всё и делаю.

Но это запасной вариант. Я надеялся на то, что кому-то будет известна простая замкнутая форма для некого удобного значения р smile.gif

Сообщение было отредактировано UNDEFEAT: 8.5.2023, 21:21
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения

Сообщения в этой теме


Ответить в эту темуОткрыть новую тему
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0 -

 



- Упрощённая версия Сейчас: 18.7.2025, 11:46
Яндекс.Метрика