Чаще всего при исследовании технических, экономических и социальных систем связь между анализируемыми величинами может быть получена в виде таблиц. Как правило, эти табличные данные получены экспериментально и имеют погрешности различной природы. При аппроксимации необходимо получить модельную зависимость yмодель = f(x), которая позволила бы "сгладить" имеющиеся погрешности, получить промежуточные и экстраполяционные значения функции, изначально не содержащиеся в исходной табличной информации.
Классический подход к оцениванию параметров регрессионной зависимости основан на методе наименьших квадратов (МНК). МНК позволяет получить такие оценки искомых параметров модельной зависимости, при которых сумма квадратов отклонений табличных значений исследуемого признака от теоретических, полученных по модели, минимальна:
Ф(a,b,c, …) = .
Если между исследуемыми величинами существуют нелинейная зависимость, то она выражаются с помощью соответствующих нелинейных функций. При этом к внутренне нелинейным моделям, которые к линейному виду не приводятся, можно, например, отнести следующие модели: , , логистическая – , обратная – [1].
Частные производные функции Ф(a,b,c,…) по искомым параметрам a,b,c,…при оптимальном выборе неизвестных коэффициентов по МНК должны обращаться в нуль, при этом получаем систему нелинейных уравнений, число которых совпадает с количеством искомых параметров модельной зависимости. Решение полученной системы нелинейных уравнений весьма затруднительно, т.к. чаще всего приходится применять численные итерационные методы, обеспечивая при этом сходимость процесса, точность вычислений и выбор начального приближения.
Однако для нахождения искомых параметров можно использовать надстройку «Поиск решения» электронных таблиц MS Excel, которая позволяет минимизировать значение целевой функции, в качестве которой выступает сумма , изменяя значения в некоторых ячейках. В эти ячейки первоначально занесены начальные значения искомых параметров.
Продемонстрируем данный подход для нахождения параметров a, b и с известной в экономике и социологии логистической кривой .
Ниже представлен лист MS Excel, на котором параметрам a, b и с присвоены начальные значения 10, 10 и 3, при этом кривая логистической модели проходит вне точек табличной зависимости. Значение суммы в целевой ячейке F14, вычисленная по формуле составляет 1331,96.
Вызываем диалоговое окно надстройки «Поиск решения» и выполняем необходимые установки, указывая в качестве целевой ячейки − ячейку F14, содержимое которой необходимо минимизировать, изменяя значения параметров a, b и с в ячейках B1:B3.
В результате работы надстройки по подбору параметров a, b и с(а = 55,165, b = 58,749 и с = 1,408) значение в целевой ячейке F14 приняло минимальное значение 3,74, а точки табличной зависимости группируются вдоль кривой логистической модели.
Литература
1. Шалабанов А.К., Роганов Д.А.. Эконометрика // Учебно-методическое пособие. // Академия Управления «ТИСБИ». - 2004