РУБРИКИ |
Диплом: Многочленные матрицы |
РЕКОМЕНДУЕМ |
|
Диплом: Многочленные матрицы0 1 × 1 1 1 2 А0(1)В0-1(l)= -2 0 1 2 = -2 -2 , 1 2 × 2l2+3 -l2+1 = 1 l2+5 А0(1)В0-1В(l)= -2 -2 -l2-1 l2+1 -2l 2-4 -6 , R(l)= А(1)(l) - А0(1)В0-1В(l)= -3l l2-13l - 1 l2+5 = -3l-1 -13l -5 = -2l2-l+1 -11l -2l4-4 -6 -l+5 -11l+6 ,
3 5 l+ 1 2 3l+1 5l+2 Q(l) = А0В0-1l + А0(1)В 0-1 = 2 5 -2 -2 = 2l-2 5l-2 . §2. Скалярная эквивалентность. Как уже отмечалось две λ-матрицы А(λ), В(λ) эквивалентны тогда и только тогда, если существуют λ-матрицы U(λ), V(λ) с не зависящими от λ ненулевыми определителями, удовлетворяющие соотношению А(λ) = U(λ) В(λ)V(λ). (17) Условимся говорить, что матрица А(λ) скалярно эквивалентна матрице В(λ), если существуют неособенные матрицы U,V с независящими от λ элементами, удовлетворяющие соотношению (17). Матрицы с независящими от λ элементами будем называть скалярными. Т е о р е м а 2. Если λ-многочлены первой степени Аλ+В, Сλ+D регулярны и эквивалентны , то они и скалярно эквивалентны. По условию Аλ+В = U(λ) (Сλ+D) V(λ), (18) где U(λ), V(λ) - матрицы с отличными от нуля постоянными определителями. Обозначим через P, S левые частное и остаток от деления U(λ) на Аλ+В, а через Q, R - правые частное и остаток от деления V(λ) на Аλ+В. Следовательно, U = (Аλ+В) P + S, V = Q(Аλ+В) + R. (19) Матрицы S и R скалярны, так как их степень меньше единицы. Покажем, что Аλ+В = S(Сλ+D) R. (20) Действительно, умножая обе стороны равенства (18) на U-1 и подставляя вместо V его выражение из (19), получим, перенеся члены [U-1 - (Сλ+D)Q] (Аλ+В) = (Сλ+D)R. Сравнивая степени левой и правой частей, видим, что выражение внутри квадратных скобок должно равняться некоторой скалярной матрице Т, и мы имеем Т = U-1- (Сλ + D)Q, Т(Аλ+В) = (Сλ+D)R. (21) Отсюда Е = U(Сλ + D)Q + UТ = (Аλ+В)V-1Q + UТ = (Аλ+В)V-1 Q + [(Аλ+В)Р + S]Т, т.е. Е = (Аλ+В)[V-1Q + РТ] + SТ. Но правая часть может иметь нулевую степень только в случае обращения в нуль квадратной скобки, откуда Е = SТ, Т = S-1. Сравнивая с (21), получаем (20), где S, а значит и R - обратимые скалярные матрицы. §3. Характеристический многочлен матрицы Рассмотрим квадратную матрицу А = ||аik||1n. Характеристической матрицей для матрицы А называется матрица λЕ-А. λ - а11 -а12 . -а1n λЕ-А = -а21 λ - а22 . -а2n .......... . -аn1 -аn2 . λ - аnn Определитель характеристической матрицы ∆(λ) = |λЕ-А| = |λ δik - аik|1n представляет собой скалярный многочлен относительно λ и называется характеристичным многочленом матрицы А. Матрицу В(λ) = ||bik (λ)||1n , где b ik (λ) - алгебраическое дополнение элемента λδik - аik в определителе ∆(λ), мы будем называть присоединенной матрицей для матрицы А. Чтобы найти старшие члены характеристического многочлена, воспользуемся тем, что величина определителя равна сумме произведений его элементов, взятых по одному из каждой строки и каждого столбца и снабженных надлежащими знаками. Поэтому, чтобы получить член, имеющий относительно λ наивысшую степень, необходимо взять произведения элементов наивысшей степени. В нашем случае таким произведением будет только одно- произведение диагональных элементов (λ - а11) (λ - а22) .(λ - аnn). Все остальные входящие в состав определителя произведения имеют степень не выше n-2, так как если один из множителей такого произведения будет - аik (i ≠ k), то это произведение не будет содержать множителями λ-а ii, λ-акк и будет, следовательно, степени не более n-2. Таким образом, ∆(λ) = (λ - а11) . (λ - аm ) + члены степени не выше n-2, или ∆(λ) = λn - (а11 + . + аnn) λn-1 + . (22) Сумма диагональных элементов матрицы называется ее следом. Формула (22) показывает, что степень характеристического многочлена матрицы равна порядку этой матрицы, старший коэффициент характеристического многочлена равен 1, а коэффициент при λn-1 равен следу матрицы, взятому с обратным знаком. Т е о р е м а 3. Характеристические многочлены подобных матриц равны друг другу. Из этой теоремы вытекает, в частности, что подобные матрицы имеют одинаковые следы и определители, так как след и определитель матрицы, взятые с надлежащими знаками, являются коэффициентами ее характеристического многочлена. Корни характеристического многочлена матрицы называются ее характеристическими числами или собственными значениями. Кратные корни характеристического многочлена называются кратными собственными значениями матрицы. Известно, что сумма всех вещественных и комплексных корней многочлена степени n, имеющего старший коэффициент 1, равна взятому с обратным знаком коэффициенту при (n-1)-й степени переменной. Формула (22) показывает поэтому, что в поле комплексных чисел сумма всех собственных значений матрицы равна ее следу. Т е о р е м а Г а м и л ь т о н а - К э л и. Каждая матрица является корнем своего характеристического многочлена, т.е. ∆(А)= 0. Пример. А = 2 1 -1 3 ,
∆(λ) = λ - 2 -1 = λ² - 5λ + 7, 1 λ - 3 ∆(А) = А² - 5А + 7Е = 3 5 -5 2 1 +7 1 0 = 0 0 = 0. -5 8 -1 3 0 1 0 0 §4. Минимальный многочлен матрицы Определение. Скалярный многочлен F(λ) называется аннулирующим многочленом квадратной матрицы А, если F(А) = 0. Аннулирующий многочлен ψ(λ) наименьшей степени со старшим коэффициентом, равным единице, называется минимальным многочленом матрицы А. Согласно теореме Гамильтона- Кэли характеристический многочлен ∆(λ) матрицы А является аннулирующим для этой матрицы. Однако, в общем случае он не является минимальным. Разделим произвольный аннулирующий многочлен f(λ) на минимальный: f(λ) = ψ(λ)q(λ) + r(λ), степень r(λ) меньше степени ψ(λ). Отсюда имеем: f(А) = ψ(А)q(А) + r(А). Поскольку f(А) = 0 и ψ(А) = 0, то, значит, и r(А) = 0. Но степень r(λ) меньше степени минимального многочлена ψ(λ). Поэтому r(λ)≡0. Таким образом, произвольный аннулирующий многочлен матрицы всегда делится без остатка на ее минимальный многочлен. Пусть два многочлена ψ(λ) и ψ'(λ) являются минимальными для одной и той же матрицы. Тогда каждый из них делится на другой многочлен без остатка, т.е. эти многочлены отличаются постоянными множителями. Этот постоянный множитель равен единице, поскольку равны единице старшие коэффициенты в ψ(λ) и ψ'(λ). Мы доказали единственность минимального многочлена для данной матрицы А. Если Dn-1(λ) - наибольший общий делитель миноров (n-1)-го порядка характеристической матрицы λЕ-А, а Dn(λ)=| λЕ-А |, то минимальный многочлен ψ(λ) матрицы А можно найти по формуле ψ(λ) = Dn(λ) : Dn-1(λ) = Еn(λ), где Еn - последний инвариантный множитель матрицы λЕ-А. Отсюда ясно, что минимальный многочлен тогда и только тогда совпадает с характеристическим многочленом, когда Dn-1(λ)=1, т.е. когда матрица λЕ-А имеет лишь один инвариантный множитель, отличный от единицы, именно Еn(λ). Минимальный многочлен клеточно-диагональной матрицы А = {А1, А2, ., Аs} равен наименьшему общему кратному минимальных многочленов диагональных клеток Аi. Примеры: 1) Минимальный многочлен нулевой матрицы равен l, а единичной матрицы Е равен l-1. 2) Найти минимальный многочлен инволютивной матрицы А, т.е. матрицы, для которой А2=Е. В данном случае А2 - Е = 0. Поэтому аннулирующим многочленом будет f(l)=l2-1. Так как минимальный многочлен делит любой аннулирующий, то возможны случаи: y(l)=l-1, y(l)=l+1, y(l)=l2+1. В первом случае А - Е = 0, А = Е. Во втором А + Е = 0, А = -Е. В третьем А ¹ ± Е . Итак, если А ¹ ± Е и А2=Е, то y(l)=l 2-1. §5. Критерий подобия матриц Пусть дана матрица А=||аik||1n с числовыми элементами из поля К. Ее характеристическая матрица λЕ-А является λ-матрицей ранга n и потому имеет n инвариантных многочленов i1(λ), i2(λ), ., in(λ). Следующая теорема показывает, что эти инвариантные многочлены определяют исходную матрицу А с точностью до преобразования подобия. Т е о р е м а 4. Для того чтобы две матрицы А=||аik||1 n и В=||вik||1n были подобны (В=Т -1АТ), необходимо и достаточно, чтобы они имели одни и те же инвариантные многочлены, или, что то же, одни и те же элементарные делители в поле К. Доказательство. Условие необходимо. Действительно , если матрицы А и В подобны, то существует такая неособенная матрица Т, что В=Т-1АТ. Отсюда λЕ-В = Т-1 (λЕ-А)Т. Это равенство показывает, что характеристические матрицы λЕ-А и λЕ-В эквивалентны и потому имеют одни и те же инвариантные многочлены. Условие достаточно. Пусть характеристические матрицы λЕ-А и λЕ-В имеют одни и те же инвариантные многочлены. Тогда эти λ-матрицы эквивалентны, и, следовательно, существуют две многочленные матрицы Р(λ) и Q(λ) такие, что λЕ-В = Р(λ)(λЕ-А) Q(λ). (23) Применяя к матричным двучленам λЕ-А и λЕ-В второе условие эквивалентности, мы можем в тождестве (23) заменить λ-матрицы Р(λ) и Q(λ) постоянными матрицами Р и Q: λЕ-В = Р(λЕ-А)Q, (24) причем в качестве Р и Q можно взять соответственно левый и правый остатки от деления Р(λ) и Q(λ) на λЕ-В, т.е. на основании обобщенной теоремы Безу можно положить: Р = ˆР(В), Q = Q(В). (25) Приравнивая в обеих частях равенства (24) коэффициенты при нулевой и при первой степенях λ, получим: В = РАQ, Е = РQ, т.е. В=Т-1АТ, где Т = Q = Р-1. Теорема доказана. Из теоремы можно извлечь следующий алгоритм для распознования подобия матриц А, В: составляем характеристические матрицы λЕ-А, λЕ-В и приводим их элементарными преобразованиями к канонической диагональной форме. Если эти формы совпадают, то матрицы А, В подобны; если различны, то А и В не подобны. Добавление к теореме 4. Если А=||аik||1n и В=||вik||1n - две подобные матрицы В=Т-1АТ, (26) то в качестве преобразующей матрицы Т можно взять матрицу Т = Q(В) = [^Р(В)]-1, (27) где Р(λ) и Q(λ) - многочленные матрицы в тождестве λЕ-В = Р(λ)(λЕ-А)Q(λ), связывающем эквивалентные характеристические матрицы λЕ-А и λЕ- В; в формуле (27) Q(В) обозначает правое значение матричного многочлена Q(λ), а ^Р(В) - левое значение матричного многочлена Р(λ) при замене аргумента λ матрицей В. Пример. Доказать, что матрицы 1 -3 4 -3 А = 1 2 и В = 3 -1 подобны, и найти преобразующую матрицу Т, для которой В=Т-1АТ. Инвариантные множители характеристических матриц lЕ-А и lЕ-В одинаковы: Е1(l) = 1 , Е2(l) = l2- 3l + 5. Поэтому матрицы А и В подобны. Полагая х у Т = z t и приравнивая элементы матриц в равенстве АТ=ТВ, получим х - 3z = 4х + 3у х + 2z = 4z + 3t , y - 3t = -3x - y y + 2t = -3z - t . Решая методом исключения, найдем два линейно независимых уравнения: x + y + z = 0 , y + 3z + 3t = 0 . Общее решение: х = 2z + 3t, y = -3z - 3t. Подставляя эти значения х и у в определитель, найдем
2z+3t -3z-3t = 3z2 + 5zt + 3t2 |T| = z t Беря например, z=-1, t=1, получим |T| =1, х=1, у=0, откуда
1 0 Т = -1 0 . §6. Нормальная форма Жордана Т е о р е м а 5. Каждая квадратная матрица над полем комплексных чисел, а также и над любым другим алгебраически замкнутым полем подобна матрице, имеющей жорданову форму. Две матрицы Жордана подобны тогда и только тогда, когда они составлены из одних и тех же жордановых клеток и отличаются друг от друга, самое большее лишь расположением клеток на главной диагонали. Доказательству теоремы предпошлем две леммы, имеющие и самостоятельный интерес: Лемма 1. Характеристическая матрица клетки Жордана имеет только один элементарный делитель (λ - ρ)n, где n - порядок клетки, а ρ - ее собственное значение. Характеристическая матрица заданной клетки Жордана имеет вид λ - ρ -1 0 . 0 0 λ - ρ -1 . 0 0 λЕ-А = ...... . λ - ρ -1 λ - ρ Вычислим наибольший общий делитель Dk(λ) миноров порядка k матрицы λЕ-А. Прежде всего, имеем Dn(λ) = | λЕ-А | = (λ - ρ)n. Далее, Dn-1(λ) есть наибольший общий делитель всех миноров степени n-1. Но среди последних находится минор -1 0 . 0 0 λ - ρ -1 . 0 0 λ - ρ . 0 0 = (-1)n-1, ..... λ - ρ -1 получаемый вычеркиванием первого столбца и последней строки матрицы λЕ-А. Поскольку этот минор равен ±1, то Dn-1(λ)=1. Обозначим через d1(λ), ., dn(λ) инвариантные множители матрицы λЕ-А. Из соотношений Dn-1(λ) = d1(λ) . dn-1(λ) = 1, Dn (λ) = d1(λ) . dn-1(λ)dn(λ) = (λ - ρ)n вытекает, что d1(λ) =. = dn-1(λ) =1, dn (λ)=(λ - ρ)n . Следовательно, λЕ-А имеет только один элементарный делитель и этот делитель равен (λ - ρ)n . Лемма 2. Система элементарных делителей характеристической матрицы жордановой матрицы состоит из элементарных делителей ее клеток Жордана и определяет вид жордановой матрицы однозначно с точностью до порядка следования клеток по главной диагонали. По определению жордановой матрицей называется клеточно-диагональная матрица с клетками Жордана по главной диагонали. Поэтому характеристическая матрица для матрицы Жордана распадается на характеристические матрицы для отдельных клеток Жордана. Отсюда следует, что система элементарных делителей характеристической матрицы для матрицы Жордана состоит из элементарных делителей характеристических матриц отдельных клеток Жордана, по одному для каждой клетки. Тем самым система элементарных делителей характеристической матрицы для матрицы Жордана определяет вид этой матрицы однозначно с точностью до порядка расположения клеток по главной диагонали. Характеристические матрицы подобных матриц эквивалентны и потому имеют одинаковые системы элементарных делителей. Отсюда следует, что подобные матрицы Жордана должны состоять из одинаковых клеток Жордана, и для завершения доказательства теоремы остается только для каждой заданной матрицы А уметь построить подобную ей матрицу Жордана. Пусть (λ - ρ1) n1, ., (λ - ρs)ns - полный набор элементарных делителей характеристической матрицы λЕ-А. Обозначим через В клеточно-диагональную матрицу, диагональными клетками которой являются клетки Жордана с указанными элементарными делителями. Следовательно, матрица λЕ-В имеет те же элементарные делители, что и λЕ-А. Но тогда матрицы λЕ-А и λЕ-В эквивалентны, а отсюда вытекает, что А подобна жордановой матрице В. Теорема доказана. Изложенные рассуждения дают ответ и на вопрос о том, как по заданной матрице А найти подобную ей матрицу Жордана. Для этого достаточно составить характеристическую матрицу λЕ-А, привести ее элементарными преобразованиями к канонической диагональной форме, разложить диагональные многочлены на множители, найти элементарные делители и по ним составить матрицу Жордана. Пусть, например, 3 1 -3 А = -7 -2 9 . -2 -1 4 Составляем характеристическую матрицу λ-3 -1 3 λЕ-А = 7 λ+2 -9 2 1 λ-4 и ищем ее инвариантные множители. Эти множители, как легко видеть, будут 1, 1, (λ-1)(λ-2)². Следовательно, элементарные делители равны λ-1, (λ-2)² и жорданова матрица имеет вид 1 0 0 В = 0 2 1 . 0 0 2 В заключении сделаем еще одно замечание. Если элементарные делители матрицы λЕ-А окажутся первой степени, то первого порядка будут и клетки Жордана в соответствующей жордановой матрице В, т.е. матрица В будет диагональной. Обратно, если соответствующая жорданова матрица диагональна, то элементарные делители будут первой степени. Таким образом, для того чтобы заданная матрица была подобна диагональной необходимо и достаточно, чтобы все элементарные делители ее характеристической матрицы были первой степени. Глава III. Функции от матриц. §1. Многочлен от жордановой матрицы. В качестве основного поля берется поле всех комплексных чисел. Простейшими функциями от матриц являются многочлены. В дальнейшем будет дано общее определение функций от матриц, а сейчас укажем явное выражение для многочлена от матрицы, имеющей нормальную форму Жордана. Рассмотрим сначала отдельную клетку Жордана порядка n. ρ 1 0 . 0 0 ρ 1 . 0 0 (1) А = ..... . ρ 1 ρ Покажем, что для всех натуральных m имеет место формула ρm (m) ρm-1 . (n-1) ρm-n+1 Аm = ρm . ( n-2) ρm-n+2 (2) .... , ρm где положено m m(m-1) . (m-k+1) k 1· 2 . k . Доказательство проще всего провести индукцией по m. Для m=1 формула (2) совпадает с (1) и поэтому верна. С другой стороны, если равенство (2) верно для какого-нибудь m, то умножая его на А, мы непосредственными вычислениями получим, что для Аm+1 формула (2) также верна. Пусть теперь f(λ) - некоторый многочлен от λ: f(λ) = α0 + α1λ + α 2λ² + . + αkλk. Согласно определению f(А) = α 0Е + α1А + α2А² + . + αkАk. Подставляем сюда вместо матриц Аm их значения из (2), мы увидим, что в i-й строке и (i+s)-м столбце матрицы f(А) стоит выражение k ∑ αm m(m-1) . (m-s) ρm-s 1 fs (ρ) . m=0 1 ∙ 2 . s 1 ∙ 2 . s Следовательно окончательно имеем f(ρ) f΄(ρ) f"(ρ) . f (n-1)(ρ) f(ρ) f΄(ρ) . f(n-2) (ρ) (3) f(А) = ......... . f(ρ) Мы вычислили пока значение многочлена от клетки Жордана. Однако общая жорданова матрица А есть прямая сумма отдельных клеток Жордана: А = А1 + А2 + . + Аs, и отсюда имеем f(А) = f(А1) + f(А2) + . + f(Аs). (4) Здесь f(А1), ., f(Аs) - многочлены от отдельных клеток Жордана, выражения которых даны формулой (3). Этот результат можно применить и к вычислению многочленов от матриц А, не имеющих формы Жордана. В самом деле, сначала ищем такое Т, чтобы матрица Т-1АТ = В имела нормальную форму Жордана; затем вычисляем f(В) согласно формулам (3) и (4) и, наконец, в силу отношения f(А) = f(ТВТ-1) = Тf(В) Т-1 получаем значение f(А). §2. Скалярные функции Общее понятие матричных функций определяется совершенно аналогично понятию обыкновенных числовых функций. Именно рассмотрим некоторое множество матриц m. Если каждой матрице А из m поставлена в соответствие некоторая матрица В, то говорят, что В есть функция от А, определенная на m. Мы хотим теперь каждой обыкновенной числовой функции ρ= f(λ) , заданной на некотором множестве комплексных чисел и удовлетворяющей сформулированным ниже требованиям, поставить в соответствие определенную матричную функцию f(А). Соответствие это строится следующим образом. Пусть даны некоторая числовая функция ρ= f(λ) и произвольная матрица А. Обозначим через ρ1, ρ2, ., ρs различные собственные значения матрицы А. Приведем А к нормальной форме Жордана: Т-1АТ = В =В1 + В2 + . + Вt , где В1, ., Вt - клетки Жордана, и рассмотрим какую-нибудь из них, например ρi 1 0 .. 0 Вi = ρi 1 .. 0 (5) .... , ρi отвечающую элементарному делителю (λ-ρi)ni . Если функция f(λ) определна в окрестности точки ρi и имеет конечные производные f´(ρ), ., f(ni-1) (ρ i), то мы полагаем по определению, f(ρi) f´(ρi) . f(ni-1)(ρi) f (Вi) = f(ρi) . f(ni-2)(ρi) .......... . (6) f(ρi) Далее, если f(λ) определена в окрестности каждой точки ρ1 , ., ρs и имеет в них конечные производные надлежащих порядков, то мы полагаем также f(В) = f(В1) + f(В2) + . + f(Вt), (7) f(А) = Тf(В)Т-1 = Т(f(В1) + . + f(Вt)) Т-1. (8) Матрица f(А) называется значением функции f(λ) при λ=А. Ниже будет показано, что f(А) не зависит от способа приведения матрицы А к нормальной форме и, таким образом, является некоторой матричной функцией от А. Эта функция называется соответствующей числовой функции f(λ). Ясно, что далеко не все матричные функции имеют соответствующие числовые. Те из них, для которых соответствующие числовые функции существуют, называются скалярными функциями. Отметим несколько простейших свойств скалярных функций: 1°. Если f(λ) есть многочлен от λ, то значение скалярной функции f(А) совпадает со значением многочлена f(λ) при λ=А. Действительно, само определение скалярных функций выбрано таким образом, чтобы для многочленов оно совпадало со старым. 2°. Пусть А-матрица и f1(λ), f2(λ) - числовые функции, для которых выражения f1(A) и f2(А) имеют смысл. Если f(λ)= f1(λ) + f2(λ), то f(А) также имеет смысл и f(А)= f1(А) + f2(А). 3°. Если А-матрица, f1(λ) и f2(λ) - числовые функции для которых f1(А) и f2(А) имеют смысл, и f(λ)= f1(λ)f2(λ), то f(А) имеет смысл и f(А)= f1(А)f2(А). Доказательства свойств 2° и 3° аналогичны, поэтому мы ограничимся рассмотрением свойства 3°. Чтобы вычислить f1(А), f2(А), f(А), мы согласно определению, должны привести А к нормальной форме Жордана В и воспользоваться формулами (7) и (8). Если удастся показать, что f(В)= f1(В)f2(В), то из (8) непосредственно получится f(А)= f1(А) f2(А). С другой стороны, f(В)= f(В1) + f(В2) + . + f(Вt), f1(В)f2(В) = f1(В1) f2(В2) + . + f1(Вt) f2(Вt) , поэтому все дело сводится к доказательству равенств f(Вi) = f1(Вi) f2(Вi) (i=1, 2, ., t), где Вi - клетки Жордана. Беря значения f1(Вi), f2(Вi) из формулы (6) и перемножая, мы обнаружим, что в к-й строке и (k+j)-м столбце матрицы f1(Вi) f2 (Вi) будет стоять элемент, равный f1(ρ) · f2(j)(ρ) + f´1(ρ) · f2(j-1) (ρ) + . + f1(j)(ρ) · f2 (ρ). Это выражение можно переписать в виде [f1(ρ) f2 (j)(ρ) + f´1(ρ) f2 (i-1) (ρ) + . + f1(j)(ρ) · f2(ρ)], что согласно правилу дифференцирования произведения функций совпадает с f (j)(ρ). Таким образом, f1(Вi) f2(Вi) = f(Вi), и утверждение 3° доказано. Аналогичным образом, используя правило дифференцирования функции от функции, можно было бы показать, что если числовые функции φ(λ) и f(φ(λ)) удовлетворяют требованиям, при которых выражение f(φ(λ)) определено, и если ψ(λ)= f(φ(λ)), то ψ(А)= f(φ(А)). 4˚. Пусть А-матрица, имеющая собственные значения ρ1, ρ2, ., ρn, причем каждое собственное значение выписано здесь столько раз, какова его кратность. Если f(λ) - числовая функция и f(А) имеет смысл, то собственные значения матрицы f(А) равны f(ρ 1), f(ρ2), ., f(ρn). В самом деле, собственные значения матриц f(А) и Т-1f(А)Т=f(Т-1АТ) соответственно равны, поэтому мы можем предполагать, что А имеет нормальную форму Жордана. Формулы (5) и (6) показывают, что в этом случае f(А) имеет треугольную форму, причем по главной диагонали f(А) стоят числа f(ρ 1), f(ρ2), ., f(ρn). Поскольку диагональные элементы треугольной матрицы являются ее собственными значениями, то утверждение 4˚ доказано. Рассмотрим два примера. 1) Пусть f(λ)= λ-1. Эта функция определена всюду, кроме λ=0, и при всех значениях λ, отличных от нуля, имеет производные любых порядков. Следовательно, если матрица А не имеет нулевых собственных значений, т.е. если А неособенная, то f(А) имеет смысл. Но λ · f(λ)=1, поэтому А · f(А)=Е, откуда f(А)= А-1. Таким образом, функции λ-1 отвечает обратная матрица. 2) Пусть f(λ)=√λ. Эта функция при λ≠0 имеет конечные производные любых порядков. Таким образом, выражения √А имеет смысл для всех неособенных матриц А. Полагая в соотношении f(λ)f(λ) =λ λ=А, мы получим f(А)f(А) =А. Мы доказали, следовательно, что из всякой неособенной матрицы можно извлечь квадратный корень. Пример. Найти Аn, если 1 4 2 А = 0 -3 -2 0 4 3 . Найдем А2
1 4 2 × 1 4 2 = 1 0 0 = Е А2 = А × А = 0 -3 -2 0 -3 -2 0 1 0 0 4 3 0 4 3 0 0 1 Итак, Аn = Е, если n=2к и Аn = А, если n=2к+1. §3. Представление значений функций многочленами Во всех курсах высшей алгебры рассматривается задача, как по заданной системе различных чисел ρ1, ρ2, ., ρs и произвольной системе чисел a1, a2, ., as построить многочлен f(λ), который в точках ρ1, ρ 2, ., ρs принимает соответственные значения α1 , α2,.,αs . Решение дается в виде известного интерполяционного многочлена Лагранжа. Для дальнейшего важно уметь строить многочлены, которые не только сами, но и их производные до некоторого порядка принимают заданные значения в точках ρ1, ρ2, ., ρs. Эта задача является, таким образом, непосредственным обобщением предшествующей. Утверждение о ее разрешимости сформулируем в виде отдельной леммы. Лемма. Пусть заданы различные числа ρ1, ρ2, ., ρs и таблица из (к+1) s произвольных чисел αij . Найдется многочлен р(λ), который в каждой точке ρi имеет значение αi0, а его j-я производная - значение αij (=1, , ., s; j= 1, ., к). Сначала удобнее построить вспомогательный многочлен рi(λ) такой, что он и его производные до к-го порядка имеют требуемые значения лишь в точке ρi, а в остальных заданных точках обращаются в нуль. Положим φi(λ)= βi0 + βi1 (λ - ρi) + .+ βik(λ - ρi) k, Φi(λ) = (λ - ρ1)k+1. (λ - ρi-1)k+1(λ - ρi+1) k+1. (λ - ρs)k+1 , рi(λ) = φi(λ) Φi(λ), где βi0, βi1, . , βik - некоторые пока не определенные числа. Очевидно, при любых βi0 , ., βik имеем рi(ρj) = рi(ρj) = . = рi (k)(ρj) = 0 (j≠i). Согласно правилу дифференцирования произведения рi(j) = φi(j)(ρi ) Фi(ρi) + jφ i(j-1) (ρi) Фi (ρi) + . + φi (ρi)Фi (j)(ρi) или aij = j ! βij Фi(ρi) + j ! βij-1Фi(ρi) + . + βi 0 Фi(j)(ρi). (9) Так как Фi(ρi)≠0, то из соотношений (9) при j=0, 1, ., k можно последовательно определить числа βi0, βi1, . , βiк и тем самым найти рi (λ). Многочлен р(λ) = р1(λ) + р2(λ) + . + рs(λ) будет, очевидно, удовелтворять всем требованиям леммы. Рассмотрим некоторую числовую функцию f(λ) и матрицу А, для которой значение f(А) определено. Покажем, что тогда найдется многочлен р(λ), для которого р(А), будет равно f(А). Обозначим через ρ1, ρ 2, ., ρs различные собственные значения матрицы А. Пусть ее порядок есть n. Согласно только что доказанной лемме мы можем построить многочлен р(λ), удовлетворяющий требованиям р(ρi) = f(ρi), р΄(ρi) = f΄(ρi), ., р (n-1)(ρi) = f (n-1)(ρi) (10) (i= 1, ., s). Для определения смысла выражения f(А) нам нужны были только значения функции f(λ) и ее производных самое большее до (n-1)-й в точках ρ 1, ρ2, ., ρs . Поскольку эти значения у f(λ) и р(λ) совпадают, то f(А)=р(А). Итак: Т е о р е м а 1. Значения всех cкалярных функций от матрицы А можно представить многочленами от А. В частности, рассматривая функцию f(λ)=√λ, мы видим, что для каждой неособенной матрицы А существует такой многочлен р(λ), для которого р(А)р(А) = А. С помощью теоремы 1 легко решается вопрос об однозначиности определения значения f(А). В самом деле, зная функцию f(λ) и ее производные в точках ρ 1, ., ρs, мы можем построить многочлен р(λ), значение которого р(А) не зависит от приведения матрицы А к нормальной форме Жордана и в то же время совпадает с f(А). Следовательно, значение f(А), определенное с помощью приведения матрицы А к нормальной форме, от способа этого приведения не зависит. Сделаем еще одно замечание. Пусть f(λ) - некоторая числовая функция, А - матрица, для которой f(А) имеет смысл. Согласно теореме 1 мы можем найти многочлен р(λ), для которого р(А)=f(А). При заданной функции f(λ) многочлен р(λ) зависит лишь от элементарных делителей матрицы А. Но элементарные делители матрицы А и транспонированной матрицы А΄ совпадают, поэтому р(А΄)=f(А΄). Легко усмотреть, что р(А΄)=р(А)΄. Таким образом, для всех скалярных функций f(А) имеем f(А)=f(А)΄. §4. Элементарные делители функций Рассмотрим вопрос, как по элементарным делителям матрицы А найти элементарные делители какой-нибудь ее скалярной функции f(А). Приведем А к нормальной форме Т-1АТ = В = В1 + В2 + . Вt, (11) где В1, . ,Вt, - клетки Жордана. Согласно определению f(А) = Т f(В) Т-1, и, следовательно, элементарные делители матриц f(А) и f(В) совпадают. Из (11) вытекает, что f(В) = f(В1) + f(В2) + . + f(Вt); поэтому система элементарных делителей матрицы f(В) есть объединение систем элементарных делителей клеток f(В1), ., f(Вt). Таким образом, наш первоначальный вопрос сводится к следующему: дана клетка Жордана В i с элементарным делителем (λ-ρi)ni требуется найти элементарные делители для f(Вi).
На основании формул (5), (6) имеемλ - f(ρi) - f΄(ρi) . - f(ni-1) (ρi) λЕi-f(Bi) = λ-f(ρ i) . - f(ni-2) (ρi) ............ . (12) λ - f(ρi) Ищем наибольшие общие делители D1(l), D2(l), ..., D ni(l) миноров 1-го, 2-го, ..., ni-го порядков этой матрицы. Старший из них Dni(l) равен определителю матрицы, следовательно, Dni(l) = (l-f(ri))ni . Все остальные являются делителями Dni(l) и поэтому имеют вид (l-f(r i))α. Рассмотрим Dni-1(l). Этот многочлен должен быть делителем всех миноров порядка ni-1 матрицы (12), в том числе и минора D(l), получающегося вычеркиванием первого столбца и последней строки. Однако если в этот минор подставить вместо l число f(ri), то получится матрица треугольной формы с элементами - f¢(rj) на главной диагонали и, значит, D(ri) = (-f¢(ri))ni-1 . (13) Мы предположим теперь, что f¢(ri)¹0. Равенство (13) показывает тогда, что D(l) не делится на l- f(ri). Но многочлен D ni-1(l) должен быть общим делителем многочленов D(l) и D ni(l), следовательно, Dni-1(l)=1. Остальные многочлены Dni-2(l), ..., D2(l),D1 (l) являются делителями Dni-1(l) и поэтому также равны единице. Составляя отношения Dк+1 : Dк, мы видим, что инвариантными множителями матрицы (12) будут 1, ... , 1, (l-f(ri)) ni , вследствие чего матрица (12) будет иметь только один элементарный делитель (l-f(ri))ni. Отсюда следует Т е о р е м а 2. Пусть матрица А имеет собственные значения r1 , ..., rs и f(l) - функция, для которой f¢(ri)¹0 (i=1, ..., s). Тогда, если матрица f(А) существует, то ее элементарные делители можно получить заменой каждого элементарного делителя (l-ri )ni матрицы А выражением (l-f(ri))ni . Например, если А - неособенная матрица, f(l)=l-1 , то f(А)= А-1 и f¢(ri)=-ri-2¹0. Поэтому, если каждый элементарный делитель (l-ri)ni матрицы А заменить выражением (l-ri-1)ni, то получится система элементарных делителей обратной матрицы. §5. Степенные ряды Последовательность квадратных матриц А1, А2, ..., Аm, Аm+1, ... . (14) одного и того же порядка называется сходящейся к матрице А, если элементы матриц (14), стоящие на пересечении заданного столбца и заданной строки, стремятся к соответствующему элементу матрицы А. Из этого определения непосредственно ясно, что если матрицы Аm и Bm при возрастании m стремятся соответственно к А и В, то Аm+Bm и АmBm стремятся к А+В и АВ. В частности, если Т - постоянная матрица, а матрица Аm стремится к А, то Т-1 АmТ будет иметь своим пределом Т-1АТ. Далее, если Аm = Аm(1) + Аm(2) + ... + Аm(s) (m=1, 2, ...), где порядки клеток от m не зависят, то Аm при возрастании m стремится к некоторому пределу тогда и только тогда, если к пределу стремится каждая клетка Аm(i) отдельно. Последнее замечание позволяет весьма просто решить вопрос о сходимости так называемых степенных рядов от матрицы. Пусть α0 + α1l + α2l2 + ... + αmlm + ... (15) - формальный степенной ряд относительно переменной l. Выражение α0Е +α1А + α2А2 + ... + αmАm + ... (16) называется соответствующим степенным рядом от матрицы А, а многочлен fn(А) = α0Е + α1А + ... + αnАn - n-й начальной суммой этого ряда. Ряд (16) называется сходящимся, если последовательность начальных сумм f1(А), ...., fm(А), ... имеет предел; в случае существования этот предел называется суммой ряда (16). Приведем матрицу А к нормальной форме Т-1АТ = В = В1 + В2 + ... + Вt , где В1, ., Вt - клетки Жордана. Сходимость последовательности fm(А) равносильна сходимости последовательности Т-1fm(А)Т (m=1, 2, .). Но Т-1fm(А)Т = fm (Т-1АТ) = fm(В) = fm(В1) + ... + fm(Вt), поэтому вопрос о сходимости ряда (16) равносилен следующему; при каких условиях этот ряд сходится для клеток Жордана В1, ..., Вt? Рассмотрим одну из этих клеток, например Вi. Пусть ей отвечает элементарный делитель (l-ri)ni . Согласно формуле (3) fm(ri) f¢m(ri) ... fm(ni-1)(ri) fm(ri) ... fm(ni-2)(ri) , fm(Вi) = .................................... fm(ri) cледовательно, fm(Вi) при возрастании m тогда и только тогда стремится к некоторому пределу, когда к пределу стремится fm (ri), f¢m(ri), ..., fm (ni-1)(ri), т.е. когда в точке ri сходится ряд (15), а также ряды получаемые из него почленным дифференцированием до (n i-1)-го раза включительно. Из теории аналитических функций известно, что все эти ряды заведомо сходятся, если либо ri лежит внутри круга сходимости ряда (15), либо ri лежит на окружности круга сходимости и (ni-1)-я производная от ряда (15) в точке ri сходится. Следовательно, доказана Т е о р е м а 3. Для того чтобы степенной ряд от матрицы А сходился, необходимо и достаточно, чтобы каждое собственное значение ri матрицы А либо находилось внутри круга сходимости соответствующего степенного ряда f(l), либо лежало на круге сходимости с тем, чтобы одновременно ряд, полученный (ni-1) - кратным дифференцированием ряда f(l), сходился в точке ri, где ni - степень наивысшего элементарного делителя, принадлежащего ri .
Литература1. Гантмахер Ф.Р., Теория матриц, Гостехиздат, М., 1954. 2. Куликов Л.Я., Алгебра и теория чисел, М., Высшая школа, 1989. 3. Курош А.Г., Курс высшей алгебры, Издание 6. 4. Мальцев А.И., Основы линейной алгебры, Гостехиздат, 1975. 5. Мишина А.П., Проскуряков И.В., Высшая алгебра, Издательство физико- математической литературы, М., 1962. Дагестанский Государственный Педагогический Университет
КАФЕДРА АЛГЕБРЫ И ГЕОМЕТРИИДопущена к защите зав.кафедрой “___” _________ 2000 г.
ДИПЛОМНАЯ РАБОТАна тему:
МНОГОЧЛЕННЫЕ МАТРИЦЫИФУНКЦИИ ОТ МАТРИЦНаучный руководитель: доцент Казибеков Т.Л.
Выполнила: ст-ка 5 курсаОсманова Н.А. Махачкала 2000 г. Страницы: 1, 2 |
|
© 2010 |
|