Уровень значимости α.
Уровень значимости обычно обозначают греческой буквой (альфа).
Статистическая значимость результата представляет собой меру уверенности в его истинности (в смысле репрезентативности выборки). Более точно, уровень значимости α - это показатель, обратно пропорциональный надежности результата. Более высокий уровень соответствует более низкому уровню доверия найденным в выборке результатам, например, зависимостям между переменными. А именно, уровень значимости представляет собой вероятность ошибки, связанной с обобщением наблюдаемого результата на всю популяцию.
Например, α = 0.05 (т.е. 1/20) показывает, что имеется 5% вероятность того, что найденная в выборке зависимость между переменными является лишь случайной особенностью данной выборки. Иными словами, если данная зависимость в популяции отсутствует, а вы многократно проводили бы подобные эксперименты, то примерно в одном из двадцати повторений эксперимента можно было бы ожидать такой же или более сильной зависимости между изучаемыми переменными. Во многих исследованиях α=0.05 рассматривается как приемлемая граница уровня ошибки.
Параметр
Параметр – это величина, обычно неизвестная и, следовательно, подлежащая оценке, которая представляет определенную характеристику генеральной совокупности. Например, математическое ожидание μ распределения – это параметр, характеризующий центральную тенденцию. По имеющейся у нас выборке мы можем посчитать значение статистики, используемой для оценки параметра.
Например, среднее выборки дает информацию о среднем μ генеральной совокупности, из которой была сделана эта выборка. Поскольку выборка случайна, это значение также случайно.
Параметры часто обозначают греческими буквами (например, ), а соответствующие статистики – латинскими (например, s).
Точечные и интервальные оценки.
Оценки неизвестных параметров бывают двух видов – точечные и интервальные.
Точечная оценка - оценка имеющая конкретное числовое значение. Например, среднее арифметическое:
= (x1+x2+...+xn)/n,
где: - среднее арифметическое (точечная оценка математического ожидания μ);
x1,x2,...xn - выборочные значения; n - объем выборки.
Интервальная оценка - оценка представляемая интервалом значений, внутри которого с задаваемой исследователем вероятностью 1- α находится истинное значение оцениваемого параметра. Интервал в интервальной оценке называется доверительным интервалом, задаваемая исследователем вероятность, 1- α, называется доверительной вероятностью. В практике статистических вычислений применяются стандартные значения доверительной вероятности: 0,95, 0,98 и 0,99 (95%, 98% и 99% соответственно).
Например, пусть интервальная оценка математического ожидания μ равна (3; 8) при доверительной вероятности 0,95. Это означает, что μ лежит в пределах от 3 до 8 с вероятностью 0,95, следовательно вероятность того, что μ меньше 3 или больше 8 не превышает α=0.05.
Выборочное среднее
Перечень всех значений, которые может принимать среднее выборки (или выборочное среднее), а также указание того, как часто эти значения встречаются, называется выборочным распределением выборки. В соответствии с центральной предельной теоремой, при увеличении размера выборкиn выборочные средние начинают подчиняться нормальному распределению вероятностей и концентрироваться вокруг среднего значения генеральной совокупности. Это утверждение оказывается верным независимо от распределения совокупности, из которой была получена выборка.
Распределение всех возможных выборочных средних является приблизительно нормальным для выборок достаточно большого размера.
Изменчивость (стандартное отклонение) выборочного распределения измеряется стандартными ошибками. Стандартная ошибка среднего рассчитывается по формуле:
.
По мере увеличения размера выборки изменчивость среднего снижается.
Доверительный интервал - это допустимое отклонение наблюдаемых значений от истинных. Размер этого допущения определяется исследователем с учетом требований к точности информации.
Доверительные интервалы для среднего задают область вокруг среднего, в которой с заданным уровнем доверия содержится "истинное" среднее популяции. Если среднее в вашей выборке равно 23, а нижняя и верхняя границы для =0.05 равны 19 и 27 соответственно, то вы можете заключить, что с 95% вероятностью среднее выборки больше 19 и меньше 27.
Говоря более точно, если вы последовательно вычисляете доверительный интервал по большому количеству независимых случайных выборок одинакового размера, то 95% этих интервалов будут, действительно, включать в себя истинные значения среднего, т. е. в 95% случаев вы окажетесь правы, утверждая, что истинное значение среднего содержится внутри данного доверительного интервала.
Если вы установите меньшее значение -уровня, то интервал будет шире, и увеличится "уверенность" в оценке, и наоборот; как мы знаем из прогнозов погоды, чем "неопределеннее" прогноз (т.е. шире доверительный интервал), тем скорее он сбудется. Заметим, что ширина доверительного интервала зависит от размера выборки и дисперсии наблюдений. Вычисление доверительных интервалов основывается на предположении, что переменная в совокупности нормально распределена.
Маленькая выборка (n<60).
Для нахождения доверительных интервалов для среднего значения используем следующие формулы:
,
нижняя граница верхняя граница
где среднее по выборке;
s выборочное стандартное отклонение;
n объём выборки;
- стандартная ошибка
уровень значимости;
- t-значение Стьюдента.
В Excelе для нахождения доверительных интервалов можно использовать специальные функции. Прежде всего надо найти выборочное среднее и стандартное отклонение (используя STDEV-функцию), после этого использовать формулы:
нижняя граница = - TINV(;n-1)*/SQRT(n)
верхняя граница = + TINV(;n-1)*/SQRT(n)
Болшая выборка (n 60)
Для нахождения доверительных интервалов для среднего значения используем следующие формулы:
,
нижняя граница верхняя граница
где - z-значение из стандартного нормального распределения, соответствующее желаемому доверительному интервалу.
Excel: Аналогично, как и в предыдущем пункте находим прежде всего стандартное отклонение (используя не STDEV-функцию, а STDEVP). Далее:
нижняя граница = - CONFIDENCE(;s;n)
верхняя граница = + CONFIDENCE(;s;n)
Задачи.
В течении 124 дней учитывали количество заказов. Откройте файл Orders.xls. Используя уровень значимости α = 0.01; 0.05, найдите доверительный интервал для среднего значения.
Автобаза проявляет интерес к времени потраченному на ремонт машин. Анализ эксплуатации 9-ти машин показал, что машины в течение года были в ремонте 16, 10, 21, 22, 8, 17, 19, 14, 19 дней соответственно. Найти доверительный интервал для среднего времени ремонта машин на уровне доверия 95%.
В обслуживающей фирме каждый день регистрировали число поступивших жалоб. Для исследования среднего числа заявлений были случайно выбраны 7 дней. Число жалоб в эти дни: 10, 12, 8, 5, 11, 9, 14, соответственно. Вычислить доверительный интервал для среднего числа ежедневных заявлений на уровне доверия 99%.
4
Другие работы по теме:
Рынок вторичного жилья
Исходные данные о продаже квартир на вторичном рынке жилья исследуемого региона, этапы нахождения на данной основе парной регрессии, уравнения линейной регрессии, выборочной дисперсии и ковариации. Определение средней стоимости квартиры, ее вариации.
Статистический анализ
Порядок проведения анализа распределения элементов статистического и динамического ряда. Методы вычисления основных статистических параметров. Корреляционная зависимость. Уравнение регрессии. Обобщение статистических данных и статистический анализ.
Структура и свойство материалов (из конспекта лекций)
Симметрия – общее свойство материала. Характеризуется . центром симметрии ( I ), плоскостью симметрии (m), осью симметрии (n). Это некая точка m многогранника, которая хар-ся тем, что при пересечении многогранника отсекает одинаковые части.
Физика металлов
Понятие атомного номера элемента в таблице Менделеева. Сопоставление квантовых чисел с определяемыми ими категориями. Связь между атомами в металлах. Классификация дефектов строения кристаллов. Переход вещества из одного агрегатного состояния в другое.
Тезисы к экзамену по статистике
Статистика -отрасль практической деятельности которая имеет своей целью сбор-обработку, анализ, и публикацию полученных данных об общественных явлениях и процессах.
Обработка результатов эксперимента
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ КАФЕДРА МАТЕМАТИКИ СЕМЕСТРОВАЯ РАБОТА ПО СТАТИСТИКЕ
Выборочный метод
Тема 3. Выборочный метод Оглавление: 3.1 Сплошное выборочное наблюдение 3.2 Статистические оценки 3.3 Оценка доли признака 3.4 Точечные оценки для средней и дисперсии генеральной совокупности
Методы обработки статистических данных
Учреждение образования Гродненский государственный университет имени Янки Купалы” ОБРАБОТКА ДАННЫХ Учебная программа для специальности: 1-03 03 08-02 Олигофренопедагогика. Логопедия.
Статистика 3
1. В каком году был основан Международный статистический институт, существующий и сейчас. а) в 1882 в) в1883 с) в 1884 d) в 1885 е) в 1886 2. С чем связана история развития статистики.
Выборочный метод
Ознакомление с методикой проведения выборочного обследования, определением ошибок. Сплошное выборочное наблюдение. Статистические оценки. Оценка доли признака. Точечные оценки для средней и дисперсии генеральной совокупности. Интервальные оценки средней.
Математические методы в психологии 3
МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ Голубев А.М. Выписка из образовательного стандарта по дисциплине «Математические методы в психологии» Измерение в психологии; типы шкал; представление данных; описательная статистика; меры связи; метрика; методы одномерной и многомерной прикладной статистики; многомерное шкалирование; многомерный анализ данных (факторный, кластерный); дисперсионный анализ; анализ данных на компьютере, статистические пакеты; приближенные вычисления; возможности и ограничения конкретных компьютерных методов обработки данных; стандарты обработки данных; нормативы представления результатов анализа данных в научной психологии; методы математического моделирования; модели индивидуального и группового поведения, моделирование когнитивных процессов и структур, проблема искусственного интеллекта
Вакансионное Распухание
1. Уравнения концентрации точечных дефектов. Основу теоретических моделей распухания составляют кинетические уравнения концентрации точечных дефектов среды, содержащей стоки. При этом предполагается, что концентрация радиационных точечных дефектов при характерных температурах распухания (0,2-0,6)
Основные этапы оценки бизнеса
МЕТОД РЫНКА КАПИТАЛА Метод рынка капитала представляет собой один из методов оценки бизнеса сравнительным подходом. Сравнительный подход к оценке бизнеса базируется на рыночной информации и учитывает текущие действия продавцов и покупателей акций предприятий или действующих бизнесов. Другими словами, величиной стоимости оцениваемого бизнеса считается реальная цена продажи аналогичного бизнеса, зафиксированная рынком.
учевая болезнь
В условиях массового поражения населения наибольшую опасность представляет внешнее облучение и развивающаяся при этом лучевая болезнь. Хотя в основе развития её лежит нарушение всех функций органов и систем, наиболее опасной является поражение центральной нервной системы, системы кроветворения, желудочно-кишечного тракта.
Энтеробиоз
Определение, этиология, эпидемиология и патогенез. Симптомы и течение. Диагноз и дифференциальный диагноз.
Метод наименьших квадратов 2
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ Московский Авиационный институт (Государственный технический университет)
Основные понятия высшей математики
Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text
Вычисление наибольшей прибыли предприятия
Содержание Задача 1 Пусть х (млн. шт.) – объем производства, С(х)=2х3-7х и D(x)=2х2+9х+15 – соответственно функция издержек и доход некоторой фирмы. При каком значении х фирма получит наибольшую прибыль π(х)? какова эта прибыль?
Элементы математической статистики
Содержание Введение 1. Элементы математической статистики 1.1 Оценки параметров распределения 1.2 Наиболее важные распределения, применяемые в математической статистике 1.2.1 Нормальное распределение
Первичная статистическая обработка информации
400 45 431 394 362 436 343 403 483 462 395 467 420 411 391 397 455 412 363 449 439 411 468 435 313 486 463 417 369 377 409 390 389 386 409 379 412 370 391 421 459 390 415 415 366 323 469 399 486 393 361 407
Случай бесконечной плотности объемного заряда и бесконечного суммарного заряда
Случай бесконечной плотности объемного заряда и бесконечного суммарного заряда. М.И. Векслер, Г.Г. Зегря Cлучаи c бесконечной плотностью заряда ρ физически абсолютно невозможны, но они "появляются" в задачах с точечными зарядами, заряженными нитями и плоскостями. При этом возникают некоторые сложности, а именно: - неограниченность поля и потенциала;
Элементы математической статистики
Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.
Обработка результатов эксперимента
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ КАФЕДРА МАТЕМАТИКИ СЕМЕСТРОВАЯ РАБОТА ПО СТАТИСТИКЕ
Понятие рядов распределения. Дискретные и интервальные ряды распределения
Понятие рядов распределения. Дискретные и интервальные ряды распределения Рядами распределения называются группировки особого вида, при которых по каждому признаку, группе признаков или классу признаков известны численность единиц в группе либо удельный вес этой численности в общем итоге. Т.е.
Тезисы к экзамену по статистике
Статистика -отрасль практической деятельности которая имеет своей целью сбор-обработку, анализ, и публикацию полученных данных об общественных явлениях и процессах.
Вакансионное Распухание
1. Уравнения концентрации точечных дефектов. Основу теоретических моделей распухания составляют кинетические уравнения концентрации точечных дефектов среды, содержащей стоки. При этом предполагается, что концентрация радиационных точечных дефектов при характерных температурах распухания (0,2-0,6) Тпл превосходит концентрацию термически равновесных дефектов.
Множества
Понятие множества в Паскале очень близко к математическому определению: множество - это совокупность однотипных неиндексированных объектов.
Картографический метод
Картографический метод — это графический способ изложения информации о размещении и развитии природных, демографических, социально-экономических и других объектов на определенной территории.