Welcome to svlab

Member Login

Lost your password?

Not a member yet? Sign Up!

Предыдущий пост Следующий пост
06 Aug 2019

Факторно-вероятностная модель

Разработана факторно-вероятностная модель, являющаяся вероятностной постановкой факторного анализа. Модель основана на уравнениях Байеса для исходных и факторных показателей. Модель была протестирована с помощью авторской программы SEM решения структурных уравнений. Численный эксперимент подтвердил работоспособность модели получать аналогичные с методом главных компонент результаты.

Введение

Классический факторный анализ позволяет на базе выборки различных показателей сформировать факторные показатели, с необходимой точностью описывающие исходный объект и уменьшающие размерность задачи путем перехода к ним. Факторные показатели являются линейной комбинацией исходных показателей. Тем самым факторные модели носят линейный характер. До настоящего времени ни разу не была рассмотрена вероятностная постановка факторного анализа. Когда на базе информации о значениях исходных показателей вычисляются вероятности значений факторов, и наоборот, на базе информации о значениях факторов, вычисляются исходные показатели диагностируемого объекта. Для получения истинных значений таких величин, предлагается использовать уравнения Байеса для условных вероятностей. В данной работе разработана факторно-вероятностная модель и протестирована с помощью программы SEM решения структурных уравнений.

Теорема Байеса

В качестве уравнений моделей могут выбираться принципиальные уравнения, которым подчиняются определенные величины. Одним из таких возможных уравнений, является уравнение Байеса, уравнивающее условные вероятности:

p\left(A\left|B\right. \right)=\frac{p\left(B\left|A\right. \right)p\left(A\right)}{p\left(B\right)} .

где

p\left(A\left|B\right. \right)

-- вероятность появления события A, при появлении события \textit{B};

p\left(B\left|A\right. \right)

-- вероятность появления события B, при появлении события \textit{A}.

p\left(A\right)

-- вероятность появления события A.

p\left(B\right)

-- вероятность появления события B.

Факторная модель

Факторный анализ основывается на следующей линейной модели, связывающей исходные показатели

\overrightarrow{z_{i} }

и факторы

\overrightarrow{p_{i} }

:

\overrightarrow{z_{i} } =a_{i1} \overrightarrow{p_{1} } +a_{i2} \overrightarrow{p_{2} } +\ldots +a_{ig} \overrightarrow{p_{g} } +d_{i} \overrightarrow{u_{i} }

\textit{m} -- число переменных, \textit{g} -- число факторов,

\overrightarrow{z_{i} }

-- исходные переменные,

\overrightarrow{p_{i} }

-- общие факторы,

\overrightarrow{u_{i} }

-- специфичные факторы. В матричном виде линейная модель факторного анализа записывается в виде:

Z=AP+DU,

где

Z\mathop{\leftrightarrow }\limits_{m\times n} z_{ij}

-- матрица размерности

m\times n

значений m параметров у n объектов,

P\mathop{\leftrightarrow }\limits_{g\times n} p_{ij}

-- матрица размерности

g\times n

значений g факторов у n объектов,

U\mathop{\leftrightarrow }\limits_{m\times n} u_{ij}

-- матрица размерности

m\times n

значений m специфичных факторов у n объектов,

A\mathop{\leftrightarrow }\limits_{m\times g} a_{ij}

-- матрица факторного отображения размерности

m\times g

весовых коэффициентов,

D\mathop{\leftrightarrow }\limits_{m\times m} d_{ij}

-- диагональная матрица размерности

m\times m

весовых коэффициентов специфичных факторов.

Факторно-вероятностная модель

В расчете значений факторов fij предлагается использовать обратную матрицу факторного отображения bij:

f_{ij} =\sum _{s=1}^{m}b_{is} z_{sj} ,

i -- индекс фактора, j -- индекс объекта, s -- индекс измеряемого показателя. Используя теорему Байеса приближенно можно уравнять следующие величины:

  1. p\left(z_{ij} \left|f_{1j} \ldots f_{gj} \right. \right)\approx p\left(z_{ij} \right)\mathop{\prod }\limits_{s=1}^{g} p\left(f_{sj} \left|z_{ij} \right. \right)
    ;
  2. p\left(f_{ij} \left|z_{1j} \ldots z_{mj} \right. \right)\approx p\left(f_{ij} \right)\mathop{\prod }\limits_{s=1}^{m} p\left(z_{sj} \left|f_{ij} \right. \right)
    .

В данной модели предполагается прямой статистический подсчет соответствующих частот. Вероятность

p\left(z_{ij} \left|f_{1j} \ldots f_{gj} \right. \right)

-- это отношение количества значений i-го измеряемого показателя близкого к zij при значении фактора s близкого к значению fsj на общее число значений i-го измеряемого показателя равного количество объектов n. Близость значений может определяться попаданием в тот же интервал из всего возможного числа интервалов значений, например, является ли значение положительным или отрицательным, т.е. используется два интервала. Вероятность

p\left(f_{sj} \left|z_{ij} \right. \right)

-- это отношение количества значений s-го фактора близкого к fsj при значении измеряемого показателя i близкого к значению zij на общее число значений s-го фактора равного количество объектов n. Вероятность

p\left(f_{ij} \right)

-- это отношение количества значений i-го фактора близкого к fij на общее число значений i-го фактора равного количество объектов n. Аналогично для второго приближенного уравнения.

Данная модель выявляет оптимальные значения факторных нагрузок bij приносящих уравнениям модели 1 и 2 наименьшие невязки.

Численный эксперимент

В качестве исходных данных были взяты 38 биофизических показателя для 131 лица с артериальной гипертензией начальной стадии. Некоторые показатели из выборки:

  1. вес,
  2. индекс массы тела (ИМТ),
  3. частота дыхания (ЧД),
  4. сегментоядерные нейтрофилы (С),
  5. лимфоциты (Л),
  6. конечно-систолический размер левого желудочка (КСР),
  7. конечно-систолический объем левого желудочка (КСО),
  8. конечно-диастолический размер левого желудочка (КДР),
  9. конечно-диастолический объем левого желудочка (КДО),
  10. ударный объем (УО),
  11. минутный объем сердца (МОС),
  12. общее периферическое сосудистое сопротивление (ОПСС),
  13. индекс Хильдебрандта (ИХ),
  14. фракция выброса левого желудочка (ФВ),
  15. фракция укорочения левого желудочка (ФУ).

С помощью авторской программы SEM решения структурных уравнений были найдены оптимальные значения обратной матрицы факторного отображения bij (таблица 2). Внедряемый скрипт модели был написан на языке Java. Чтобы проверить работоспособность модели была предварительно найдена матрица факторного отображения по методу главных факторов (таблица 1) для сравнения.

Таблица 1. Исходное факторное решение (метод главных факторов)

 

Таблица 2. Факторная отображение факторно-вероятностной модели

В результате сравнение заметно сходство двух матриц факторного отображения, что подтверждает работоспособность модели.

Классический факторный анализ выявляет причину роста и изменения величин одних показателей от изменения величин факторов. В факторно-вероятностном подходе факторного анализа выявляется истинные группы показателей связанных и интерпретируемых одной причиной или латентным показателеми, т.к. выявляется одновременное вероятное наполнение исходных показателей факторами, а не линейными комбинациями, которые работают и близки к истине только в случае линейной модели причин – летентных показателей и исходных.

Нагрузки факторной структуры представленной в таблице 2 (факторно-вероятностный подход) несколько отличается от таблицы 1. В таблице 2 фактор 2 F2 имеет значимое наполнение показателями ИМТ, ОПСС, ФВ, ФУ. Этот фактор можно проинтерпретировать как развитие мышечной ткани человека. Поскольку ИМТ тем больше, чем больше масса тела; ФВ и ФУ тем больше, чем больше нагнетательная функция сердца; ОПСС тем больше, чем больше мышечная скованность кровеносных сосудов. Фактор F5 имеет наполнение показателями Вес, КДР, ИХ. Это можно проинтерпретировать как одновременную взаимосвязь показателей связанных с дыханием. Чем больше Вес тем сложнее дышать. На вдохе нагнетаемому размеру сердца мешает объем легких. Это влияет на отношение частоты сердечных сокращений к частоте дыхательных движений.

Факторно-вероятностный подход смог выявить два новых дополнительных фактора по сравнению с классическим подходом.

Заключение

На базе факторно-вероятностной модели была вычислена матрица факторного отображения. С помощью численного эксперимента была подтверждена работоспособность модели. Преимуществом использования факторно-вероятностной модели является статистический подход учитывающий распределение значений определенных величин по объектам.

Список литературы

Шовин В.А. Факторное моделирование с помощью нейронной сети. // Математические структуры и моделирование. 2014. № 4 (32). С. 112-115.

SHARE:

#

Post dicussion

Контакты

Для связи svbeat@yandex.ru

  • 1