Приведённые python-скрипты это пример, где вам нужно понять, что поменять так, что бы все работало для вашего варианта. По этой же причине код был написан и прокомментирован.
$ git clone https://github.com/Sammers21/math_stat_python
$ cd math_stat_python
$ python problem<номер_задачи>.py
Заметка: для запуска всех задач необходимы python-библиотеки: scipy, numpy, matplotlib, pandas, statsmodels. Версия python 3.5.2 или выше
Вопрос: Как можно сгенерировать ваше распределение с использованием лишь равномерного распределения R(0,1)?
Ответ: Находим обратную функцию и подставляем значения равномерного распределения.
Вопрос (вытекающий из первого): А какая обратная функция к вашей?
Ответ: Взял мел и написал её на доске или бумаге.
Вопрос: Что такое медиана и какова медиана вашего распределения?
Ответ: Медиана — квантиль уровня 0.5, т.е. такое значение распределения, получить значение меньше которого можно с вероятностью 1/2. Чтобы найти его, нужно решить уравнение вида F(x) = 1/2, где F - функция распределения.
Вопрос: Дайте определение центральной предельной теоремы (ЦПТ)
Ответ:
Вопрос: Что такое дисперсия?
Ответ: Дисперсия: D(X) = E((X-E(X))^2)
Вопрос: Что такое ошибка первого и второго рода?
Ответ:
Вопрос: Что такое уровень доверия?
Ответ: Уровень доверия — статистический термин, означающий вероятность того, что доверительный интервал содержит истинное значение параметра.
Вопрос: А какую вы будете использовать статистику для оценки:
a) мат ожидания с известной дисперсией
б) мат ожидания с неизвестной дисперсией
в) дисперсии с известным мат ожиданем
г) дисперсии с неизвестным мат ожиданем
Ответы на a) и б)
Ответы на в) и г)
Вопрос: Приведите пример выборки, для которой коэффициент Пирсона будет близок к нулю, а Спирмена — к единице
Ответ: Выброс, см. пример на нижеприведенной иллюстрации
Вопрос: При каких условиях коэффициент такой-то будет принимать крайнее значение такое-то
Ответ:
к-т \ значение | -1 | 1 |
---|---|---|
Пирсона | y = ax + b, a < 0 (обратная линейная связь) |
y = ax + b, a > 0 (прямая линейная связь) |
Спирмена | x_i > x_j => y_i < y_j (строго обратная связь) |
x_i > x_j => y_i > y_j (строго прямая связь) |
Вопрос: Классическая линейная нормальная регресионная модель.
Ответ: Если регрессионная модель отвечает данным условиям:
- — детерминированные (неслучайные) величины
- (дисперсия ошибки постоянна - гомоскедастичность)
- — некоррелированность ошибок
То она называется классической линейной нормальной регрессионной моделью (КЛНРМ)
Вопрос: Метод наименьших квадратов и теорема Гаусса-Маркова.
Ответ: МНК заключается в нахождении таких коэффициентов регрессии, при которых суммма квадратов ошибок будет наименьшей:
Берётся частная производная по каждому коэффиценту, приравнивается к нулю. Из таких уравнений составляется и решается система.
Теорема Гаусса Маркова: если регрессионная модель удовлетворяет условиям Гаусса-Маркова (из вопроса 1), то:
- Полученные оценки коэффициентов несмещённые
- Оценки состоятельны
- Оценки эффективны, т.е. имеют наименьшую дисперсию среди всех возможных линейных оценок
- Оценки распределены нормально
Вопрос: Оценка дисперсии случайной составляющей и ковариационной матрицы оценок коэффициентов регрессии.
Ответ:
k — количество оцениваемых коэффициентов
Вопрос: Коэффициент детерминации.
Ответ:
Это доля дисперсии зависимой переменной, объяснённая моделью. Принимает значения от 0 до 1. Чем он выше, тем лучше подобрана модель и больше зависимость объясняемой переменной от объясняющих.
Вопрос: Доверительный интервал для коэффициента регрессии.
Ответ:
t — квантиль распределения t(n-k)
Вопрос: Проверка гипотезы о значении коэффициента и значимости регрессии в целом.
Ответ: Из методички от Zakhse:
Вопрос: Проверка гипотезы о линейном ограничении.
Ответ: Из методички от Zakhse:
Вопрос: Интерпретация коэффициентов линейной, полулогарифмической и логарифмической моделей регрессии.
Ответ: Из статьи Фурманова К.К.:
Вопрос: Тесты на правильность спецификации: график «остатки-прогнозы», тест Рамсея.
Ответ: Читаем статью Фурманова К.К.!
Вопрос: Линейная модель вероятности. Модели logit и probit, их оценивание методом максимального правдоподобия.
Ответ:
Вопрос: Интерпретация коэффициентов линейной и логит моделей.
Ответ:
- Для Logit:
- Для линейной:
Вопрос: Что такое Pseudo R^2?
Ответ:
- Если тут нет вопроса, который Фурманов задавал вам, то не стесняйтесь и добавьте его (посредством pull request).
- Если у вас есть проблема, с которой вы столкнулись и не можете решить, то создайте issue в этом репозитории. Помощь обязательно будет. Быстрая и оперативная.
- Если вы считаете, что в коде, который демонстрирует примерное решение задачи, есть ошибка, то непременно исправьте её или сообщите о ней.