Авторы: 147 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

Книги:  180 А Б В Г Д Е З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я


загрузка...

2.5. Формирование главных компонент

Рассмотрим множество финансовых показателей ,…, . Значение каждого показателя рассчитывается по данным бухгалтерской отчетности на конец каждого квартала за период в несколько лет, начиная с 1999 года, для компаний, имеющих котируемые на бирже акции. Таким образом, множество реализаций каждого финансового показателя представляет собой вектор-столбец 1FRNFRjFRjFR длины m (m – совокупное число наблюдений по всем компаниям за доступное число кварталов).

Матрица X размера m*N, где m – число наблюдений, N – число учитываемых в модели финансовых показателей, формируется из центрированных и нормированных векторов-столбцов jFR. Тогда каждый элемент матрицы рассчитывается как

2/1,][][jjijjiFRVFREFRx−=,

где – i-ая координата вектора ijFRjFR (i=1,…,m; j=1,…,N), i-ая реализация случайной величины , jFR

6

Σ==miijjFRmFRE11][ - оценка математического ожидания случайной величины , jFR

Σ=−=mijijjFREFRmFRV12])[(1][– оценка дисперсии случайной величины . jFR

Каждый вектор-столбец матрицы Х (jX, j=1,…,N) есть множество реализаций случайной величины Xj, имеющей нулевое среднее и единичную дисперсию. Диагональные элементы положительно определенной матрицы (XX')N*N являются оценками (с точностью до коэффициента) дисперсий случайных величин Хj. Тогда сумма диагональных элементов матрицы XX' (след матрицы) представляет собой суммарную дисперсию случайных величин Xj (j=1,…,N), или изменчивость матрицы Х. Здесь и далее 'X - транспонированная матрица X.

Построим матрицу главных компонент Z: jjbXZ= так, чтобы суммарная дисперсия компонент матрицы Z покрывала максимально возможную долю изменчивости X.

Построение первой главной компоненты

Найдем такой вектор 1b, который доставляет максимум дисперсии компоненты 11bXZ=. При этом необходимо исключить влияние вектора 1b на дисперсию компоненты , с тем чтобы ее изменчивость была обусловлена лишь матрицей Х. 1Z

Таким образом, мы имеем оптимизационную задачу с ограничениями:

max)''()'(1111→⋅⋅⋅=bXXbZZ

1)'(11=bb

Данная задача может быть решена методом множителей Лагранжа.

max)1'()''(111111→−⋅⋅⋅⋅⋅=bbbXXbLμ

Первым условием оптимума является равенство нулю первых частных производных функции Лагранжа.

01'02'2111111111=−=∂∂=⋅⋅=∂∂bbLbbXXbLμμ

Таким образом, 111'bbXX=⋅⋅μ.

Тогда 1μ - собственное число, а 1b - соответствующий ему собственный вектор матрицы X’X.

max)'()''(111111→=⋅⋅=⋅⋅⋅μμbbbXXb, следовательно, 1μ есть наибольшее собственное число матрицы XX'.

Таким образом, для построения первой главной компоненты необходимо найти множество собственных чисел и соответствующих им собственных векторов матрицы XX'.11 Выбрать наибольшее собственное число 1μ и соответствующий собственный вектор 1b и построить компоненту 1Z. Доля изменчивости матрицы X, охватываемая вектором 1Z равна 1μ.

11 Множество собственных значений можно искать на множестве решений уравнения 0)'(=μEXX, где Е – единичная матрица.

Вторая компонента 22bXZ=, отвечающая максимуму изменчивости матрицы Х, строится на базе собственного вектора 2b, соответствующего второму по величине собственному числу после 1μ. Этот собственный вектор будет ортогонален 1b, поскольку матрица XX' положительно определена12. Аналогичным образом строится вся система ортогональных главных компонент 3Z,…,NZ.

Общий алгоритм построения главных компонент

1. Находим собственные числа матрицы XX' как вектор решений уравнения 0)'(=μEXX. Поскольку матрица XX' симметрична, то все собственные числа jμ являются действительными.

2. Ранжируем собственные числа по убыванию, присвоив наибольшему числу порядковый номер 1 (1μ) , а наименьшему, соответственно, N (Nμ).

3. Находим ортогональные собственные вектора матрицы XX': 1b, 2b,…, Nb. Составляем из них матрицу собственных векторов, размером N*N, B={1b, 2b,…, Nb}. EBB=', где E – единичная матрица.

4. Строим матрицу главных компонент BXZ=. j-й вектор-столбец матрицы Z есть главная компонента, соответствующая j-му собственному значению матрицы XX'. Λ=ZZ', где Λ - диагональная матрица, на диагонали которой расположены собственные числа матрицы XX'.