Стохастическая модель в экономике. Детерминированные и стохастические модели. Математические модели в экономике и программировании

Математические модели в экономике и программировании

1. Детерминированные и вероятностные математические модели в экономике. Преимущества и недостатки

Методы исследования экономических процессов базируются на использовании математических - детерминированных и вероятностных - моделей, представляющих изучаемый процесс, систему или вид деятельности. Такие модели дают количественную характеристику проблемы и служат основой для принятия управленческого решения при поисках оптимального варианта. Насколько обоснованы эти решения, являются ли они лучшими из возможных, учтены ли и взвешены все факторы, определяющие оптимальное решение, каков критерий, позволяющий определить, что данное решение действительно наилучшее, - таков круг вопросов, имеющих большое значение для руководителей производства, и ответ на которые можно найти с помощью методов исследования операций [Чесноков С. В. Детерминационный анализ социально-экономических данных. - М.: Наука, 1982, стр. 45].

Одним из принципов формирования системы управления является метод кибернетических (математических) моделей. Математическое моделирование занимает промежуточное положение между экспериментом и теорией: нет необходимости строить реальную физическую модель системы, ее заменит математическая модель. Особенность формирования системы управления заключается в вероятностном, статистическом подходе к процессам управления. В кибернетике принято, что любой процесс управления подвержен случайным, возмущающим воздействиям. Так, на производственный процесс оказывают влияния большое количество факторов, учесть которые детерминированным образом невозможно. Поэтому считается, что на производственный процесс воздействуют случайные сигналы. В силу этого планирование работы предприятия может быть только вероятностным.

По этим причинам часто, говоря о математическом моделировании экономических процессов, имеют в виду именно вероятностные модели.

Опишем каждый из типов математических моделей.

Детерминированные математические модели характеризуются тем, что описывают связь некоторых факторов с результативным показателем как функциональную зависимость, т. е. в детерминированных моделях результативный показатель модели представлен в виде произведения, частного, алгебраической суммы факторов, или в виде любой другой функции. Данный вид математических моделей наиболее распространен, поскольку, будучи достаточно простыми в применении (по сравнению вероятностными моделями), позволяет осознать логику действия основных факторов развития экономического процесса, количественно оценить их влияние, понять, какие факторы и в какой пропорции возможно и целесообразно изменить для повышения эффективности производства.

Вероятностные математические модели принципиально отличаются от детерминированных тем, что в вероятностных моделях взаимосвязь между факторами и результирующим признаком вероятностная (стохастическая): при функциональной зависимости (детерминированные модели) одному и тому же состоянию факторов соответствует единственное состояние результирующего признака, тогда как в вероятностных моделях одному и тому же состоянию факторов соответствует целое множество состояний результирующего признака [Толстова Ю. Н. Логика математического анализа экономических процессов. - М.: Наука, 2001, с. 32-33].

Преимущество детерминированных моделей в простоте их применения. Основной недостаток - низкая адекватность реальной действительности, т. к., как было отмечено выше, большинство экономических процессов носит вероятностный характер.

Достоинством вероятностных моделей является то, что они, как правило, больше соответствуют реальной действительности (более адекватны), чем детерминированные. Однако, недостатком вероятностных моделей является сложность и трудоемкость их применения, так что во многих ситуациях достаточно бывает ограничиться детерминированными моделями.

2. Постановка задачи линейного программирования на примере задачи о пищевом рационе

Впервые постановка задачи линейного программирования в виде предложения по составлению оптимального плана перевозок; позволяющего минимизировать суммарной километраж, была дана в работе советского экономиста А. Н. Толстого в 1930 году.

Систематические исследования задач линейного программирования и разработка общих методов их решения получили дальнейшее развитие в работах российских математиков Л. В. Канторовича, В. С. Немчинова и других математиков и экономистов. Также методам линейного программирования посвящено много работ зарубежных и, прежде всего, американских ученых.

Задача линейного программирования состоит в максимизации (минимизации) линейной функции.

при ограничениях

причем все

Замечание. Неравенства могут быть и противоположного смысла. Умножением соответствующих неравенств на (-1) можно всегда получить систему вида (*).

Если число переменных системы ограничений и целевой функции в математической модели задачи равно 2, то её можно решить графически.

Итак, надо максимизировать функцию к удовлетворяющей системе ограничений.

Обратимся к одному из неравенств системы ограничений.

С геометрической точки зрения все точки, удовлетворяющие этому неравенству, должны либо лежать на прямой , либо принадлежать одной из полуплоскостей, на которые разбивается плоскость этой прямой. Для того чтобы выяснить это, надо проверить какая из них содержит точку ().

Замечание 2. Если , то проще взять точку (0;0).

Условия неотрицательности также определяют полуплоскости соответственно с пограничными прямыми . Будем считать, что система неравенств совместна, тогда полуплоскости, пересекаясь, образуют общую часть, которая является выпуклым множеством и представляет собой совокупность точек, координаты которых являются решением данной системы - это множество допустимых решений. Совокупность этих точек (решений) называется многоугольником решений. Он может быть точкой, лучом, многоугольником, неограниченной многоугольной областью. Таким образом, задача линейного программирования состоит в нахождении такой точки многоугольника решений, в которой целевая функция принимает максимальное (минимальное) значение. Эта точка существует тогда, когда многоугольник решений не пуст и на нем целевая функция ограничена сверху (снизу). При указанных условиях в одной из вершин многоугольника решений целевая функция принимает максимальное значение. Для определения данной вершины построим прямую (где h - некоторая постоянная). Чаще всего берется прямая . Остается выяснить направление движения данной прямой. Это направление определяется градиентом (антиградиентом) целевой функции.

Вектор в каждой точке перпендикулярен прямой , поэтому значение f будет возрастать при перемещении прямой в направлении градиента (убывать в направлении антиградиента). Для этого параллельно прямой проводим прямые, смещаясь в направлении градиента (антиградиента).

Эти построения будем продолжать до тех пор, пока прямая не пройдет через последнюю вершину многоугольника решений. Эта точка определяет оптимальное значение.

Итак, нахождение решения задачи линейного программирования геометрическим методом включает следующие этапы:

Строят прямые, уравнения которых получаются в результате замены в ограничениях знаков неравенств на знаки точных равенств.

Находят полуплоскости, определяемые каждым из ограничений задачи.

Находят многоугольник решений.

Строят вектор .

Строят прямую .

Строят параллельные прямые в направлении градиента или антиградиента, в результате чего находят точку, в которой функция принимает максимальное или минимальное значение, либо устанавливают неограниченность сверху (снизу) функции на допустимом множестве.

Определяют координаты точки максимума (минимума) функции и вычисляют значение целевой функции в этой точке.

Задача о рациональном питании (задача о пищевом рационе)

Постановка задачи

Ферма производит откорм скота с коммерческой целью. Для простоты допустим, что имеется всего четыре вида продуктов: П1, П2, П3, П4; стоимость единицы каждого продукта равна соответственно С1, С2, С3, С4. Из этих продуктов требуется составить пищевой рацион, который должен содержать: белков - не менее b1 единиц; углеводов - не менее b2 единиц; жиров - не менее b3 единиц. Для продуктов П1, П2, П3, П4 содержание белков, углеводов и жиров (в единицах на единицу продукта) известно и задано в таблице, где aij (i=1,2,3,4; j=1,2,3) - какие-то определённые числа; первый индекс указывает номер продукта, второй - номер элемента (белки, углеводы, жиры).

МАТЕМАТИЧЕСКИЕ МОДЕЛИ

2.1. Постановка задачи

Детерминированные модели описывают процессы в детерминированных системах.

Детерминированные системы характеризуются однозначным соответствием (соотношением) между входными и выходными сигналами (процессами).

Если задан входной сигнал такой системы, известны ее характеристикаy = F(x), а также ее состояние в начальный момент времени, то значение сигнала на выходе системы в любой момент времени определяется однозначно (рис. 2.1).

Существует два подхода к исследованию физических систем: детерминированный и стохастический.

Детерминированный подход основан на применении детерминированной математической модели физической системы.

Стохастический подход подразумевает использование стохастической математической модели физической системы.

Стохастическая математическая модель наиболее адекватно (достоверно) отображает физические процессы в реальной системе, функцио-нирующей в условиях влияния внешних и внутренних случайных факторов (шумов).

2.2. Случайные факторы (шумы)

Внутренние факторы

1) температурная и временная нестабильность электронныхкомпонентов;

2) нестабильность питающего напряжения;

3) шум квантования в цифровых системах;

4) шумы в полупроводниковых приборах в результате неравномерности процессов генерации и рекомбинации основных носителей заряда;

5) тепловой шум в проводниках за счет теплового хаотического движения носителей заряда;

6) дробовой шум в полупроводниках, обусловленный случайным характером процесса преодоления носителями потенциального барьера;

7) фликкер – шум, обусловленный медленными случайными флуктуациями физико-химического состояния отдельных областей материалов электронных устройств и т. д.

Внешние факторы

1) внешние электрические и магнитные поля;

2) электромагнитные бури;

3) помехи, связанные с работой промышленности и транспорта;

4) вибрации;

5) влияние космических лучей, тепловое излучение окружающих объектов;

6) колебания температуры, давления, влажности воздуха;

7) запыленность воздуха и т. д.

Влияние (наличие) случайных факторов приводит к одной из ситуаций, приведенных на рис. 2.2:

Следовательно, предположение о детерминированном характере физической системы и описание ее детерминированной математической моделью являетсяидеализацией реальной системы. Фактически имеем ситуацию, изображенную на рис. 2.3.

Детерминированная модель допустима в следующих случаях:

1) влияние случайных факторов столь незначительно, что пренебрежение ими не приведет к ощутимому искажению результатов моделирования.

2) детерминированная математическая модель отображает реальные физические процессы в усредненном смысле.

В тех задачах, где не требуется высокой точности результатов моделирования, предпочтение отдается детерминированной модели. Это объясняется тем, что реализация и анализ детерминированной математической модели много проще, чем стохастической.

Детерминированная модель недопустима в следующих ситуациях: случайные процессы ω(t) соизмеримы с детерминированными x(t). Результаты, полученные с помощью детерминированной математической модели, будут неадекватными реальным процессам. Это относится к системам радиолокации, к системам наведения и управления летательными аппаратами, к системам связи, телевидению, к системам навигации, к любым системам, работающим со слабыми сигналами, в электронных устройствах контроля, в прецизионных измерительных устройствах и т. д.

В математическом моделировании случайный процесс часто рассматривают как случайную функцию времени, мгновенные значения которой являются случайными величинами.

2.3. Суть стохастической модели

Стохастическая математическая модель устанавливает вероятностные соотношения между входом и выходом системы . Такая модель позволяет сделать статистические выводы о некоторых вероятностных характеристиках исследуемого процесса y(t):

1) математическое ожидание (среднее значение):

2) дисперсия (мера рассеивания значений случайного процесса y(t) относительно его среднего значения):

3) среднее квадратичное отклонение:

(2.3)

4) корреляционная функция (характеризует степень зависимости – корреляции – между значениями процесса y(t), отстоящими друг от друга на время τ):

5) спектральная плотность случайного процесса y(t) описывает его частотные свойства:

(2.5)

преобразование Фурье.

Стохастическаямодель формируется на основе стохастического дифференциального либо стохастического разностного уравнения.

Различают три типа стохастических дифференциальных уравнений: со случайными параметрами, со случайными начальными условиями, со случайным входным процессом (случайной правой частью). Приведем пример стохастического дифференциального уравнения третьего типа:

, (2.6)

где
аддитивный случайный процесс – входной шум.

В нелинейных системах присутствуют мультипликативные шумы .

Анализ стохастических моделей требует использования довольно сложного математического аппарата, особенно для нелинейных систем.

2.4. Понятие типовой модели случайного процесса. Нормальный (гауссовский) случайный процесс

При разработке стохастической модели важное значение имеет определение характера случайного процесса
. Случайный процесс может быть описан набором (последовательностью) функций распределения – одномерной, двумерной, … , n-мерной или соответствующими плотностями распределения вероятности. В большинстве практических задач ограничиваются определением одномерного и двумерного законов распределения.

В некоторых задачах характер распределения
априорно известен.

В большинстве случаев, когда случайный процесс
представляет собой результат воздействия на физическую систему совокупности значительного числа независимых случайных факторов, полагают, что
обладает свойствами нормального (гауссовского) закона распределения . В этом случае говорят, что случайный процесс
заменяется его типовой моделью – гауссовским случайным процессом. Одномерная плотность распределения вероятности нормального (гауссовского)случайного процесса приведена на рис. 2.4.

Нормальное (гауссовское) распределение случайного процесса обладает следующими свойствами .

1. Значительное количество случайных процессов в природе подчиняются нормальному (гауссовскому) закону распределения.

2. Возможность достаточно строго определить (доказать) нормальный характер случайного процесса.

3. При воздействии на физическую систему совокупности случайных факторов с различными законами распределения их суммарный эффект подчиняется нормальному закону распределения (центральная предельная теорема ).

4. При прохождении через линейную систему нормальный процесс сохраняет свои свойства в отличие от других случайных процессов.

5. Гауссовский случайный процесс может быть полностью описан с помощью двух характеристик – математического ожидания и дисперсии.

Впроцессе моделирования часто возникает задача –определить характер распределения некоторой случайной величины x по результатам её многократных измерений (наблюдений)
.Для этого составляют гистограмму – ступенчатый график, позволяющий по результатам измерения случайной величины оценить её плотность распределения вероятности.

При построении гистограммы диапазон значений случайной величины
разбивают на некоторое количество интервалов, а затем подсчитывают частоту (процент) попадания данных в каждый интервал. Таким образом, гистограмма отображает частоту попадания значений случайной величины в каждый из интервалов. Если аппроксимировать построенную гистограмму непрерывной аналитической функцией, то эта функция может рассматриваться как статистическая оценка неизвестной теоретической плотности распределения вероятности.

При формировании непрерывных стохастических моделей используется понятие «случайный процесс». Разработчики разностных стохастических моделей оперируют понятием «случайная последовательность».

Особую роль в теории стохастического моделирования играют марковские случайные последовательности. Для них справедливо следующее соотношение для условной плотности вероятности:

Из него следует, что вероятностный закон, описывающий поведение процесса в момент времени , зависит только от предыдущего состояния процесса в момент времени
и абсолютно не зависит от его поведения в прошлом (т. е. в моменты времени
).

Перечисленные выше внутренние и внешние случайные факторы (шумы) представляют собой случайные процессы различных классов. Другими примерами случайных процессов являются турбулентные течения жидкостей и газов, изменение нагрузки энергосистемы, питающей большое количество потребителей, распространение радиоволн при наличии случайных замираний радиосигналов, изменение координат частицы в броуновском движении, процессы отказов аппаратуры, поступления заявок на обслуживание, распределение числа частиц в малом объеме коллоидного раствора, задающее воздействие в радиолокационных следящих системах, процесс термоэлектронной эмиссии с поверхности металла и т. д.

1. Детерминированные и вероятностные математические модели в экономике. Преимущества и недостатки

Методы исследования экономических процессов базируются на использовании математических - детерминированных и вероятностных - моделей, представляющих изучаемый процесс, систему или вид деятельности. Такие модели дают количественную характеристику проблемы и служат основой для принятия управленческого решения при поисках оптимального варианта. Насколько обоснованы эти решения, являются ли они лучшими из возможных, учтены ли и взвешены все факторы, определяющие оптимальное решение, каков критерий, позволяющий определить, что данное решение действительно наилучшее, - таков круг вопросов, имеющих большое значение для руководителей производства, и ответ на которые можно найти с помощью методов исследования операций [Чесноков С. В. Детерминационный анализ социально-экономических данных. - М.: Наука, 1982, стр. 45].

Одним из принципов формирования системы управления является метод кибернетических (математических) моделей. Математическое моделирование занимает промежуточное положение между экспериментом и теорией: нет необходимости строить реальную физическую модель системы, ее заменит математическая модель. Особенность формирования системы управления заключается в вероятностном, статистическом подходе к процессам управления. В кибернетике принято, что любой процесс управления подвержен случайным, возмущающим воздействиям. Так, на производственный процесс оказывают влияния большое количество факторов, учесть которые детерминированным образом невозможно. Поэтому считается, что на производственный процесс воздействуют случайные сигналы. В силу этого планирование работы предприятия может быть только вероятностным.

По этим причинам часто, говоря о математическом моделировании экономических процессов, имеют в виду именно вероятностные модели.

Опишем каждый из типов математических моделей.

Детерминированные математические модели характеризуются тем, что описывают связь некоторых факторов с результативным показателем как функциональную зависимость, т. е. в детерминированных моделях результативный показатель модели представлен в виде произведения, частного, алгебраической суммы факторов, или в виде любой другой функции. Данный вид математических моделей наиболее распространен, поскольку, будучи достаточно простыми в применении (по сравнению вероятностными моделями), позволяет осознать логику действия основных факторов развития экономического процесса, количественно оценить их влияние, понять, какие факторы и в какой пропорции возможно и целесообразно изменить для повышения эффективности производства.

Вероятностные математические модели принципиально отличаются от детерминированных тем, что в вероятностных моделях взаимосвязь между факторами и результирующим признаком вероятностная (стохастическая): при функциональной зависимости (детерминированные модели) одному и тому же состоянию факторов соответствует единственное состояние результирующего признака, тогда как в вероятностных моделях одному и тому же состоянию факторов соответствует целое множество состояний результирующего признака [Толстова Ю. Н. Логика математического анализа экономических процессов. - М.: Наука, 2001, с. 32-33].

Преимущество детерминированных моделей в простоте их применения. Основной недостаток - низкая адекватность реальной действительности, т. к., как было отмечено выше, большинство экономических процессов носит вероятностный характер.

Достоинством вероятностных моделей является то, что они, как правило, больше соответствуют реальной действительности (более адекватны), чем детерминированные. Однако, недостатком вероятностных моделей является сложность и трудоемкость их применения, так что во многих ситуациях достаточно бывает ограничиться детерминированными моделями.

Впервые постановка задачи линейного программирования в виде предложения по составлению оптимального плана перевозок; позволяющего минимизировать суммарной километраж, была дана в работе советского экономиста А. Н. Толстого в 1930 году.

Систематические исследования задач линейного программирования и разработка общих методов их решения получили дальнейшее развитие в работах российских математиков Л. В. Канторовича, В. С. Немчинова и других математиков и экономистов. Также методам линейного программирования посвящено много работ зарубежных и, прежде всего, американских ученых.

Задача линейного программирования состоит в максимизации (минимизации) линейной функции.

, где

при ограничениях

причем все

Замечание. Неравенства могут быть и противоположного смысла. Умножением соответствующих неравенств на (-1) можно всегда получить систему вида (*).

Если число переменных системы ограничений и целевой функции в математической модели задачи равно 2, то её можно решить графически.

Итак, надо максимизировать функцию

к удовлетворяющей системе ограничений.

Обратимся к одному из неравенств системы ограничений.

С геометрической точки зрения все точки, удовлетворяющие этому неравенству, должны либо лежать на прямой

, либо принадлежать одной из полуплоскостей, на которые разбивается плоскость этой прямой. Для того чтобы выяснить это, надо проверить какая из них содержит точку ().

Замечание 2. Если

, то проще взять точку (0;0).

Условия неотрицательности

также определяют полуплоскости соответственно с пограничными прямыми . Будем считать, что система неравенств совместна, тогда полуплоскости, пересекаясь, образуют общую часть, которая является выпуклым множеством и представляет собой совокупность точек, координаты которых являются решением данной системы - это множество допустимых решений. Совокупность этих точек (решений) называется многоугольником решений. Он может быть точкой, лучом, многоугольником, неограниченной многоугольной областью. Таким образом, задача линейного программирования состоит в нахождении такой точки многоугольника решений, в которой целевая функция принимает максимальное (минимальное) значение. Эта точка существует тогда, когда многоугольник решений не пуст и на нем целевая функция ограничена сверху (снизу). При указанных условиях в одной из вершин многоугольника решений целевая функция принимает максимальное значение. Для определения данной вершины построим прямую (где h - некоторая постоянная). Чаще всего берется прямая . Остается выяснить направление движения данной прямой. Это направление определяется градиентом (антиградиентом) целевой функции. в каждой точке перпендикулярен прямой , поэтому значение f будет возрастать при перемещении прямой в направлении градиента (убывать в направлении антиградиента). Для этого параллельно прямой проводим прямые, смещаясь в направлении градиента (антиградиента).

Эти построения будем продолжать до тех пор, пока прямая не пройдет через последнюю вершину многоугольника решений. Эта точка определяет оптимальное значение.

Итак, нахождение решения задачи линейного программирования геометрическим методом включает следующие этапы:

Строят прямые, уравнения которых получаются в результате замены в ограничениях знаков неравенств на знаки точных равенств.

Находят полуплоскости, определяемые каждым из ограничений задачи.

Находят многоугольник решений.

Строят вектор

.

Строят прямую

.

Строят параллельные прямые

в направлении градиента или антиградиента, в результате чего находят точку, в которой функция принимает максимальное или минимальное значение, либо устанавливают неограниченность сверху (снизу) функции на допустимом множестве.

Определяют координаты точки максимума (минимума) функции и вычисляют значение целевой функции в этой точке.

Задача о рациональном питании (задача о пищевом рационе)

Постановка задачи

Ферма производит откорм скота с коммерческой целью. Для простоты допустим, что имеется всего четыре вида продуктов: П1, П2, П3, П4; стоимость единицы каждого продукта равна соответственно С1, С2, С3, С4. Из этих продуктов требуется составить пищевой рацион, который должен содержать: белков - не менее b1 единиц; углеводов - не менее b2 единиц; жиров - не менее b3 единиц. Для продуктов П1, П2, П3, П4 содержание белков, углеводов и жиров (в единицах на единицу продукта) известно и задано в таблице, где aij (i=1,2,3,4; j=1,2,3) - какие-то определённые числа; первый индекс указывает номер продукта, второй - номер элемента (белки, углеводы, жиры).

Стохастические модели

Как уже говорилось выше, стохастические модели – это модели вероятностные. При этом в результате расчетов можно сказать с достаточной степенью вероятности, каково будет значение анализируемого показателя при изменении фактора. Самое частое применение стохастических моделей – прогнозирование.

Стохастическое моделирование является в определенной степени дополнением и углублением детерминированного факторного анализа. В факторном анализе эти модели используются по трем основным причинам:

  • необходимо изучить влияние факторов, по которым нельзя построить жестко детерминированную факторную модель (например, уровень финансового левериджа);
  • необходимо изучить влияние сложных факторов, которые не поддаются объединению в одной и той же жестко детерминированной модели;
  • необходимо изучить влияние сложных факторов, которые не могут быть выражены одним количественным показателем (например, уровень научно-технического прогресса).

В отличие от жестко детерминированного стохастический подход для реализации требует ряда предпосылок:

  1. наличие совокупности;
  2. достаточный объем наблюдений;
  3. случайность и независимость наблюдений;
  4. однородность;
  5. наличие распределения признаков, близкого к нормальному;
  6. наличие специального математического аппарата.

Построение стохастической модели проводится в несколько этапов:

  • качественный анализ (постановка цели анализа, определение совокупности, определение результативных и факторных признаков, выбор периода, за который проводится анализ, выбор метода анализа);
  • предварительный анализ моделируемой совокупности (проверка однородности совокупности, исключение аномальных наблюдений, уточнение необходимого объема выборки, установление законов распределения изучаемых показателей);
  • построение стохастической (регрессионной) модели (уточнение перечня факторов, расчет оценок параметров уравнения регрессии, перебор конкурирующих вариантов моделей);
  • оценка адекватности модели (проверка статистической существенности уравнения в целом и его отдельных параметров, проверка соответствия формальных свойств оценок задачам исследования);
  • экономическая интерпретация и практическое использование модели (определение пространственно-временной устойчивости построенной зависимости, оценка практических свойств модели).

Основные понятия корреляционного и регрессионного анализа

Корреляционный анализ - совокупность методов математической статистики, позволяющих оценивать коэффициенты, характеризующие корреляцию между случайными величинами, и проверять гипотезы об их значениях на основе расчета их выборочных аналогов.

Корреляционным анализом называется метод обработки статистических данных, заключающийся в изучении коэффициентов (корреляции) между переменными.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции .

В наиболее общем виде задача статистики (и, соответственно, экономического анализа) в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.

Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие.

Задачи собственнокорреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

Задачирегрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, что дает основание говорить о статистическом изучении взаимосвязей.

Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.

Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы – параметрические – и принято называть корреляционными.

Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является и простота вычислений.

Автокорреляция - статистическая взаимосвязь между случайными величинами из одного ряда, но взятых со сдвигом, например, для случайного процесса - со сдвигом по времени.

Парная корреляция



Простейшим приемом выявления связи между двумя признаками является построение корреляционной таблицы:

\ Y \ X \ Y 1 Y 2 ... Y z Итого Y i
X 1 f 11 ... f 1z
X 1 f 21 ... f 2z
... ... ... ... ... ... ...
X r f k1 k2 ... f kz
Итого ... n
... -

В основу группировки положены два изучаемых во взаимосвязи признака – Х и У. Частоты f ij показывают количество соответствующих сочетаний Х и У.

Если f ij расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания f ij допустимо утверждать о связи между Х и У. При этом, если f ij концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь.

Наглядным изображением корреляционной таблице служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи.

Корреляционным полем называется множество точек {X i , Y i } на плоскости XY (рисунки 6.1 - 6.2).

Если точки корреляционного поля образуют эллипс, главная диагональ которого имеет положительный угол наклона (/), то имеет место положительная корреляция (пример подобной ситуации можно видеть на рисунке 6.1).

Если точки корреляционного поля образуют эллипс, главная диагональ которого имеет отрицательный угол наклона (\), то имеет место отрицательная корреляция (пример изображен на рисунке 6.2).

Если же в расположении точек нет какой-либо закономерности, то говорят, что в этом случае наблюдается нулевая корреляция.

В итогах корреляционной таблицы по строкам и столбцам приводятся два распределения – одно по X, другое по У. Рассчитаем для каждого Х i среднее значение У, т.е. , как

Последовательность точек (X i , ) дает график, который иллюстрирует зависимость среднего значения результативного признака У от факторного X, – эмпирическую линию регрессии, наглядно показывающую, как изменяется У по мере изменения X.

По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов.

Любому реальному процессу свойственны случайные колебания, вызываемые физической изменчивостью каких- либо факторов во времени. Кроме того, могут существовать случайные внешние воздействия на систему. Поэтому при равном среднем значении входных в параметров в различные моменты времени выходные параметры будут неодинаковы. Следовательно, если случайные воздействия на исследуемую систему существенны, необходимо разрабатывать вероятностную (стохастическую) модель объекта, учитывая статистические законы распределения параметров системы и выбирая соответствующий математический аппарат.

При построении детерминированных моделей случайными факторами пренебрегают, учитывая лишь конкретные условия решаемой задачи, свойства и внутренние связи объекта (по этому принципу построены практически все разделы классической физики)

Идея детерминистических методов - в использовании собственной динамики модели при эволюции системы.

В нашем курсе эти методы представляют: метод молекулярной динамики , преимуществами которого являться: точность и определенность численного алгоритма; недостатком - трудоемкость из- за подсчета сил взаимодействия между частицами (для системы N частиц на каждом шаге нужно выполнить
операций подсчета этих сил).

При детерминистическом подходе задаються, и интегрируются по времени уравнения движения. Мы будем рассматривать системы из многих частиц. Положение частиц дают вклад потенциальной энергии в полную энергию системы, а их скорости определяют вклад кинетической энергии. Система движется вдоль траектории с постоянной энергией в фазовом пространстве (далее будут пояснения). Для детерминированных методов естественным является микроканонический ансамбль, энергия которого - это интеграл движения. Кроме того, можно исследовать и системы, для которых интегралом движения являться температура и (или) давление. В этом случае система незамкнута, и ее можно представить в контакте с тепловым резервуаром (канонический ансамбль). Для ее моделирования можно использовать подход, при котором мы ограничиваем ряд степеней свободы системы (например, задаем условие
).

Как мы уже отмечали, в случае, когда процессы в системе происходят непредсказуемо, такие события и связанные с ними величины называют случайными , а алгоритмы моделирования процессов в системе - вероятностными (стохастическими) . Греческое stoohastikos - означает буквально “тот, кто может угадать”.

Стохастические методы используют несколько иной подход, чем детерминистические: требуется насчитать лишь конфигурационную часть задачи. Уравнения для импульса системы всегда можно проинтегрировать. Проблема, которая затем встает - каким образом вести переходы от одной конфигурации к другой, которые в детерминистическом подходе определяться импульсом. Такие переходы в стохастических методах осуществляться при вероятностной эволюции в марковском процессе . Марковский процесс является вероятностным аналогом собственной динамики модели.

Этот подход имеет то преимущество, что позволяет моделировать системы, не имеющие какой - бы то ни было собственной динамики.

В отличие от детерминистических, стохастические методы на ПК реализуют проще, быстрее, однако для получения близких к истинным величин необходима хорошая статистика, что требует моделирования большого ансамбля частиц.

Примером полностью стохастического метода является метод Монте-Карло . Стохастические методы используют важную концепцию марковского процесса (марковской цепи). Марковский процесс является вероятностным аналогом процесса в классической механике. Марковская цепь характеризуется отсутствием памяти, т. е. статистические характеристики ближайшего будущего определяться только настоящим, без учета прошлого.

Практичне заняття 2.

Модель случайного блуждания

Пример (формальный)

Предположим, что в узлах двумерной решетки в произвольных позициях размещены частицы. На каждом временном шаге частица “прыгает” в одну из блажащих позиций. Значит, частица имеет возможность выбора направления прыжка в любое из четырех ближайших мест. После прыжка частица "не помнит", откуда она прыгнула. Этот случай соответствует случайному блужданию и является марковской цепью. Результатом на каждом шаге является новое состояние системы частиц. Переход из одного состояния в другое зависит только от предыдущего состояния, т. е. вероятность нахождения системы в состоянии i зависит только от состояния i-1.

Какие же физические процессы в твердом теле напоминают нам (подобие) описанной формальной модели случайного блуждания?

Конечно же, диффузионные, т. е. самые, процессы, механизмы которых мы рассматривали курсе тепло - массопереноса (3 курс). В качестве примера вспомним обычную классическую самодиффузию в кристалле, когда, не меняя своих видимых свойств атомы периодически меняют места временной оседлости и блуждают по решетке, с помощью так называемого “вакансионного” механизма. Он же - один из важнейших механизмов диффузии в сплавах. Явление миграции атомов в твердых телах играют решающую роль во многих традиционных и нетрадиционных технологиях - металлургии, металлообработке, создании полупроводников и сверхпроводников, защитных покрытий и тонких пленок.

Его открыл Роберт Аустен в 1896 году, наблюдая диффузию золота и свинца. Диффузия - процесс перераспределения концентраций атомов в пространстве путем хаотической (тепловой) миграции. Причины , с точки зрения термодинамики, могут быть две: энтропийная (всегда) и энергетическая (иногда). Энтропийная причина - это увеличение хаоса при перемешивании атомов резного сорта. Энергетическая - способствует образованию сплава, когда выгоднее быть рядом атомом разного сорта, и способствует диффузионному распаду, когда энергетический выиграш, обеспечивается размещением вместе атомов одного сорта.

Наиболее распространенными механизмами диффузии являются:

    вакансионный

    межузловой

    механизм вытеснения

Для реализации вакансионного механизма необходима хотя бы одна вакансия. Миграция вакансий осуществляется путем перехода в незанятый узел одного из соседних атомов. Атом же может осуществить диффузионный скачок, если рядом с ним оказалась вакансия. Вакансия см, с периодом тепловых колебаний атома в узле решеткис, при температуре Т=1330 К (на 6 К < точки плавления), число скачков, которое совершает вакансия в 1с, путь за одну секунду-см=3 м (=10 км/ч). По прямой же путь, проходимый вакансиейсм, т. е. в 300 раз короче пути по ломаной.

Природе понадобилось. чтобы вакансия в течении 1с раз изменила место оседлости, прошла по ломаной 3м, а сместилась по прямой всего лишь на 10 мкм. Атомы ведут себя спокойнее вакансий. Но и они миллион раз в секунду меняют место оседлости и движутся со скоростью примерно 1м/час.

Так. что достаточно одной вакансии на несколько тысяч атомов, чтобы при температуре, близкой к плавлению, перемещать атомы на микро уровне.

Сформируем теперь модель случайного блуждания для явления диффузии в кристалле. Процесс блуждания атома - хаотический и непредсказуемый. Однако для ансамбля блуждающих атомов должны проявляться статистические закономерности. Мы рассмотрим некоррелированные скачки.

Это значит, что если
и
- перемещение атомов приi и j-м скачках, то после усреднения по ансамблю блуждающих атомов:

(среднее произведение= произведению средних. Если блуждания полностью случайны, все направления равноправны и
=0.)

пусть каждая частица ансамбля совершает N элементарных скачков. Тогда ее полное перемещение равно:

;

а средний квадрат перемещения

Так как корреляции нет, то второе слагаемое =0.

Пусть каждый скачок имеет одинаковую длину h и случайное направление, а среднее число скачков в единицу времени- v. Тогда

Очевидно, что

Назовем величину
- коэффициентом диффузии блуждающих атомов. Тогда
;

Для трехмерного случая -
.

Мы получили параболический закон диффузии - средний квадрат смещения пропорционален времени блужданий.

Именно эту задачу нам предстоит решить на следующей лабораторной работе - моделирование случайных одномерных блужданий.

Численная модель.

Мы задаем ансамбль из М частиц, каждая из которых совершает N шагов, независимо друг от друга, вправо или влево с одинаковой вероятностью. Длина шага = h.

Для каждой частицы вычисляем квадрат смещения
заN шагов. Затем проводим усреднение по ансамблю -
. Величина
, если
, т. е. Средний квадрат смещения пропорционален времени случайных блужданий
- среднее время одного шага) - параболический закон диффузии.