НЕСКОЛЬКО СЛОВ О ТЕОРИИ СТАТИСТИЧЕСКИХ ОШИБОК - Студенческий научный форум

X Международная студенческая научная конференция Студенческий научный форум - 2018

НЕСКОЛЬКО СЛОВ О ТЕОРИИ СТАТИСТИЧЕСКИХ ОШИБОК

Носкова А.А. 1
1Сургутский Государственный Педагогический Университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Колмогоров и Прохоров (1984) определили математическую статистику как ветвь математики, систематизирующую, обрабатывающую и применяющую статистические данные, под которыми понимается число объектов в некоторых совокупностях. Разумеется, они исключили сбор данных и их предварительное исследование, которое по существу появилось в середине ХХ в. и является важной главой теоретической статистики. Споры о различии между математической и теоретической статистиками можно решить, полагая, что именно сбор и исследование данных относятся к последней и определяют ее отличие от первой.

Первое достойное определение теории статистики (которая, видимо, почти совпадает с теоретической статистикой) предложил Butte: это – наука о понимании и оценке статистических данных, их сбору и систематизации. Неясно, включал ли он в свое определение и приложения статистики.

Громадное количество определений статистики (без каких-либо прилагательных) было предложено начиная со Шлёцера, но указанного выше достаточно. Впрочем, упомянем еще Гаттерера, у которого цели статистики частично относились к новому государствоведению: понять состояние государства, исходя из его прежних состояний.

Статистический метод – это метод исследования, основанный на математической обработке количественных данных, и в основном его имеют в виду в связи с естествознанием. Его первая стадия была характерна выявлением статистических закономерностей, основанных на общих представлениях; вот афоризм Гиппократа (1952): полные люди склонны умирать в более раннем возрасте, чем остальные.

Здесь можно усмотреть качественную корреляцию, вполне совместимую с качественным характером древней науки. Во время второй стадии выводы основывались на статистических данных (Граунт). Нынешняя, третья стадия началась в середине XIX в. с появлением первых стохастических критериев для проверки статистических выводов, см. Пуассон (1837), Sheynin. Впрочем, эти стадии не отделены друг от друга полностью: даже древние астрономы накапливали свои количественные наблюдения [1].

Исключительно важные открытия удалось сделать без применения критериев. Оказалось, например, что очистка питьевой воды в восемь раз снижала смертность от холеры, что объясняло пути распространения холерных эпидемий. Аналогично, проявился полный успех оспопрививания (Дженне, в 1798 г.), хотя потребовались дополнительные статистические исследования технологии прививок и без разочарований обойтись не удалось.

Теория ошибок относится к статистическому методу. Ее основная особенность – применение истинного значения измеряемых констант. Фурье определил его как предел среднего арифметического из измерений, что эвристически схоже с частотным определением вероятности по Мизесу и означает, что остаточные систематические ошибки включаются в это значение.

С момента своего зарождения во второй половине XVIII в. Т. Симпсон (1756; 1757) и Ламберт, который и ввел термин теория ошибок до 1920-х годов эта теория оставалась основным полем приложения теории вероятностей, а математическая статистика переняла у нее принципы наибольшего правдоподобия и наименьшей дисперсии.

Первое гауссово обоснование метода (точнее, принципа) наименьших квадратов (1809) для уравнивания косвенных наблюдений (т. е. для оценивания неизвестных, входящих в избыточную систему линейных уравнений, коэффициенты которой задаются соответствующей теорией, а свободные члены – результаты непосредственных наблюдений) было основано на (независимо введенном им) принципе наибольшего правдоподобия и на предположении о том, что среднее арифметическое – лучшая оценка истинного значения непосредственных наблюдений [2].

Его второе обоснование 1823 г., весьма тяжело написанное, было основано на принципе наименьшей дисперсии искомых оценок. Колмогоров (1946) мимоходом заметил, что можно было бы принять выведенную Гауссом формулу выборочной дисперсии за её определение. Во всяком случае, её вывод несложен, а принцип наименьших квадратов последует сразу же, потому что указанный вывод требует только линейности и независимости исходных уравнений и несмещённости оценок неизвестных. Можно предположить, что Гаусс это прекрасно знал и ввёл два независимых обоснования принципа наименьших квадратов. Оставив только второе, можно будет отказаться от рассуждений 1809 г., которые ввиду своего изящества и сравнительной простоты оставались основными.

Многие авторы предпочли обоснование 1823 г., и в том числе Марков, который тем не менее отрицал всякую оптимальность метода наименьших квадратов (МНК) в и тем самым обесценил своё предпочтение. Вопреки его мнению, в случае нормального распределения ошибок наблюдения МНКв обеспечивает совместную эффективность оценок (Петров 1954).

Один из первых методов уравнивания косвенных наблюдений предложил Бошкович, который участвовал в прокладке градусного измерения в Италии. В некотором смысле его рекомендация приводила к выбору медианы.

Уже Кеплер считал среднее арифметическое буквой закона. Уравнивая косвенные наблюдения, он, видимо, применял элементы принципа минимакса (выбора решения избыточной системы уравнений, соответствующего наименьшему абсолютному максимальному остаточному свободному члену) и метода Монте-Карло: он искажал наблюдения произвольными малыми поправками так, чтобы они соответствовали друг другу.

Древние астрономы считали непосредственные наблюдения своей собственностью; они не сообщали об отброшенных результатах и выбирали любую разумную оценку. Погрешности наблюдений были значительными, и теперь известно, что при плохих распределениях среднее арифметическое не лучше отдельного наблюдения, а иногда хуже его.

Бируни, арабский учёный X – XI вв., который превзошёл Птолемея, ещё не придерживался среднего арифметического, а выбирал различные оценки (Шейнин 1992).

Существует и детерминированная теория ошибок, которая исследует весь процесс наблюдений без применения стохастических представлений и близка к предварительному исследованию данных и планированию эксперимента. Уже древние астрономы умели выбирать наилучшие моменты наблюдений, чтобы неизбежные ошибки меньше всего влияли на результаты.

Не позднее XVII в. естествоиспытатели включая Ньютона начали учитывать подобные соображения. Даниил Бернулли чётко определил случайные и систематические ошибки, Гаусс и Бессель породили новую стадию экспериментальной науки, предполагая, что каждый инструмент должен быть полностью исследован и отъюстирован. Бессель (1839) определял, в каких двух точках должны находиться опоры измерительного жезла, чтобы он в наименьшей степени изгибался (и изменял свою длину) под влиянием собственного веса.

Последний пример: выбор исходных данных. Некоторые естествоиспытатели XIX в. полагали, что можно надежно использовать разнородные данные. Английский хирург Дж. Симпсон тщетно изучал смертность от ампутации конечности по данным многих больниц за 45 лет. С другой стороны, заключения иногда делались при отсутствии данных. У. Гершель заявил, что размер звезды, случайно отобранной из многих тысяч, вряд ли будет существенно отличаться от их среднего размера. Он не знал, что размеры звезд чудовищно различны, так что их среднее не имеет смысла, да и вообще нельзя ничего узнать из незнания[3].

Список используемых источников

  1. Статистические методы. [Электронный ресурс] – Режим доступа: http://diplomba.ru/work/74016

  2. Теория статистических методов. [Электронный ресурс] – Режим доступа:http://www.0zd.ru/ekonomika_i_ekonomicheskaya_teoriya/teoriya_statisticheskix_metodov.html

  3. Теория статистики. [Электронный ресурс] – Режим доступа: http://www.e-reading.club/bookreader.php/99603/Burhanova_Teoriya_statistiki.html

Просмотров работы: 31527