§ 1. Правило Крамера решения систем линейных уравнений
Определения. Системой линейных уравнений называется система уравнений вида:
(1)
Где — известные числа,
— неизвестные,
. Решением Системы (1) называется упорядоченный набор чисел
, который при подстановке в каждое из уравнений системы обращает его в верное равенство. Система называется Совместной, если она имеет хотя бы одно решение.
Введем следующие обозначения:
— матрица системы, Ã=
—
Расширенная матрица, — столбец неизвестных,
— столбец свободных членов.
Матричными уравнениями называются уравнения вида АХ =В, ХА=В, АХВ=С, где A, B, C – известные матрицы, Х – Искомая.
Матрица называется Решением матричного уравнения, если при подстановке в это уравнение она обращает его в верное равенство.
Лемма. Пусть А – матрица системы (1), а В – столбец ее свободных членов. Тогда система линейных уравнений (1) равносильна матричному уравнению
АХ=В, (2)
В следующем смысле: если – решение (1), то столбец
— решение (2), и наоборот.
►{ – решение (1)}
– решение (2)}.◄
Уравнение (2) называется Матричной формой записи системы (1).
Теорема (правило Крамера). Если в системе линейных уравнений число уравнений равно числу неизвестных и определитель системы , то эта система имеет единственное решение, которое можно найти по формулам Крамера
, (3)
Где – определитель, полученный из ∆ заменой J-ого столбца на столбец свободных членов.
►На основании доказанной леммы система (1) равносильна матричному уравнению (2), поэтому теорему доказываем для этого уравнения.
Единственность. Предположим, что (2) имеет два решения . Тогда
{ и
}
— противоречие.
Существование. Покажем, что
— (4)
Решение уравнения (2). Действительно, Для получения же формул (3) распишем равенство (4) поэлементно. Введем обозначения:
.Тогда:
(4)[теорема замещения] =
◄
§ 2. Ранг матрицы
Определение. Рангом матрицы называется наивысший порядок отличных от нуля ее миноров. Ранг нулевой матрицы по определению равен нулю. Ранг матрицы будем обозначать так: .
Замечание. Если все миноры K-го порядка матрицы А равны нулю, то все ее миноры (K+1)-го порядка тоже равны нулю. Таким образом, если , это значит, что у матрицы А есть отличный от нуля минор R-го порядка, а все ее миноры (R+1)-го порядка равны нулю.
Определение. Элементарными преобразованиями матрицы называются:
1) умножение строк и столбцов на число, отличное от 0;
2) прибавление к какой либо строке (столбцу) другой строки (столбца), умноженной на число;
3) перестановка строк или столбцов.
Лемма. Последнее элементарное преобразование может быть получено последовательным применением первых двух
►Докажем утверждение для строк матрицы. Будем, как и раньше,
Обозначать сокращенно I-ю строку матрицы А.
Аналогично утверждение доказывается и для столбцов.◄
Теорема. Элементарные преобразования не меняют ранга матрицы.
►Для первого элементарного преобразования утверждение, очевидно, выполняется, так как ранг матрицы зависит от того, будет ли минор равен нулю или нет. А это свойство минора не изменится при умножении строки или столбца на число, отличное от нуля. Если утверждение справедливо для второго преобразования, то его справедливость для третьего вытекает из доказанной леммы.
Доказательство проведем для строк матрицы А (для столбцов оно будет аналогичным). Обозначим матрицу, полученную из
прибавлением к I — й строке K-й строки, умноженной на число
.
Пусть . Надо доказать, что и
. Разобьем доказательство на две части.
1. Покажем, что матрица имеет отличный от нуля минор R-го порядка.
А) Матрица А имеет отличный от нуля минор R-го порядка, не содержащий I — й строки. Этот же минор является и минором матрицы .
Б) Все миноры R-го порядка матрицы А, не содержащие I — й строки, равны нулю. Пусть – отличный от нуля минор R-го порядка матрицы А. Рассмотрим минор
матрицы
, расположенный в тех же строках и столбцах.
(1)
(волна указывает, что эти строки короче, они содержат только те элементы, которые принадлежат выделенным столбцам). В равенстве (1) определитель равен нулю, т. к. при
— это минор матрицы А, не содержащий I — й строки, а при
— это определитель, имеющий две одинаковые строки. Таким образом,
.
2. Покажем, что все миноры (R+1)-го порядка матрицы равны нулю.
А) Минор (R+1)-го порядка матрицы не содержит I — й строки. Тогда он является также и минором матрицы А, а значит, равен нулю.
Б) Минор (R+1)-го порядка матрицы
содержит I — ю строку. Тогда
. (2)
В равенстве (2) — минор (R+1)-го порядка матрицы А и, поэтому, равен нулю. Что касается определителя
, то при
он содержит две одинаковые строки, а при
— это минор (R+1)-го порядка матрицы А, а значит, в обоих случаях
=0.◄
Свойства ранга матрицы
1°. Ранг матрицы не превосходит ни количества ее строк, ни количества столбцов.
2°. При транспонировании матрицы ее ранг не меняется.
3°. Если rang A = 0, то A – нулевая матрица.
4°. Если у матрицы вычеркнуть столбец или строку, полностью состоящую из нулей, то ее ранг при этом не изменится.
5°. Если у матрицы вычеркнуть однy из двух пропорциональных строк (столбцов), то её ранг при этом не изменится.
6°. Ранг произведения матриц не превосходит ранга каждого из сомножителей. При этом, если один из сомножителей – невырожденная матрица, то ранг произведения равен рангу второго сомножителя.
Первые четыре свойства очевидны, пятое вытекает из доказанной теоремы, а шестое мы докажем позже, в четвёртой главе.
§ 3. Теорема о базисном миноре
Определение. Строки матрицы А
(1)
Называются Линейно зависимыми, если существуют числа , не все равные нулю такие, что
. (2)
Строки (1) называются Линейно независимыми, если равенство (2) выполняется Только в том случае, когда .
Аналогично формулируется определение линейной зависимости и независимости для столбцов матрицы (позднее мы введем понятия линейной зависимости и независимости в более общем случае).
Определение. Базисным минором матрицы называется любой отличный от нуля её минор, порядок которого равен рангу этой матрицы. Строки (столбцы), проходящие через базисный минор, называются Базисными.
Теорема 1 (о базисном миноре). Справедливы следующие утверждения:
1. Базисные строки (столбцы) матрицы линейно независимы.
2. Каждая из небазисных строк (столбцов) может быть представлена в виде линейной комбинации базисных.
►Пусть . Без ограничения общности можно считать, что базисный минор матрицы расположен в её левом верхнем углу. Если это не так, то с помощью перестановок строк и столбцов, которые не меняют ранга матрицы, его можно переместить в левый верхний угол. Тогда матрица А будет выглядеть так:
.
Обозначим М её базисный минор, М≠0. Приступаем непосредственно к доказательству.
1. Для доказательства линейной независимости строк
(3)
Составляем их линейную комбинацию и приравниваем её нулевой строке:
. (4)
Матрицы равны в том и только в том случае, когда равны их соответствующие элементы. Приравнивая нулю первые R Элементов матрицы-строки из левой части равенства (4), получаем следующую систему:
(5)
Конечно, мы могли бы приравнять нулю и все остальные элементы матрицы, но в этом, как вы увидите, нет никакой необходимости.
Система (5) — система линейных уравнений относительно , в которой число уравнений равно числу неизвестных и определитель которой совпадает с базисным минором. Поэтому он отличен от нуля. Значит, по правилу Крамера, эта система имеет единственное решение
(то, что это решение, проверяется непосредственной подстановкой). Таким образом, система строк (3) – линейно независима.
2. Нужно доказать, что строка
Может быть представлена в виде
, что равносильно следующему:
,
. (6)
К базисным строкам и столбцам добавим одну из небазисных строк и произвольный столбец и рассмотрим полученный определитель:
.
Определитель =0
и
, т. к. при
он содержит два одинаковых столбца, а при
— это минор (R+1)-го порядка матрицы А. Разложив
по последнему столбцу, получаем:
. (7)
Так как , то из (7) можно выразить
:
. (8)
При вычислении алгебраических дополнений к элементам последнего столбца дописанный J-й столбец вычеркивается, значит, алгебраические дополнения зависят от K, но никак не могут зависеть от J. Поэтому, полагая
, из (8) получаем (6).◄
Теорема 2 (О линейной независимости строк и столбцов). Для того чтобы строки (столбцы) матрицы были линейно независимы необходимо и достаточно, чтобы ее ранг равнялся количеству строк (столбцов).
►Доказательство проводим для строк матрицы (для столбцов оно будет аналогичным).
Необходимость. Дано: строки матрицы линейно независимы. Пусть
. Предположим, что базисный минор матрицы расположен в её левом верхнем углу. Тогда первые R её строк линейно независимы, а каждая из оставшихся строк, в том числе и (R+1)-я, может быть через них выражена, то есть
. Положим
. (9)
Среди чисел (9) есть отличные от нуля, и
.
Таким образом, строки матрицы линейно зависимы, и мы пришли к противоречию. Следовательно, предположение неверно и .
Достаточность. Дано: . Тогда базисный минор имеет M-й порядок, а значит, все строки являются базисными и поэтому линейно независимы.◄
Следствия.
1. Для того чтобы строки (столбцы) матрицы были линейно зависимы, необходимо и достаточно, чтобы ее ранг был меньше количества строк (столбцов).
2. Для того чтобы строки (столбцы) определителя были линейно независимы необходимо и достаточно, чтобы он был отличен от 0.
►{строки линейно независимы}
◄
3. Для того чтобы строки (столбцы) определителя были линейно зависимы необходимо и достаточно, чтобы он был равен 0.
§ 4. Критерий совместности линейных уравнений
Теорема Кронекера – Капелли (Критерий совместности системы линейных Уравнений). Для того чтобы система линейных уравнений была совместной необходимо и достаточно, чтобы ранг матрицы системы равнялся рангу расширенной матрицы ().
►Пусть задана система линейных уравнений
(1)
С матрицей А. Будем обозначать J-й столбец матрицы А. Система (1) может быть записана следующим образом:
(2)
Необходимость. Дано: система совместна. Следовательно, существует упорядоченный набор чисел такой, что
Получаем: [прибавляем к последнему столбцу
]
Достаточность. Дано: . Предположим, что базисный минор матрицы A Расположен в первых R столбцах. Этот же минор является базисным и для матрицы Ã: он отличен от нуля и его порядок равен R. По теореме о базисном миноре R первых столбцов матрицы Ã линейно независимы, а остальные, в том числе и В, можно через них выразить, т. е. существует такой упорядоченный набор чисел
, что
. Итак, упорядоченный набор
удовлетворяет уравнению (2), значит, является решением системы (1).◄
§ 5. Однородные системы линейных уравнений
Определение. Система линейных уравнений называется Однородной, если во всех ее уравнениях свободные члены равны нулю:
(1)
Часто удобно использовать и матричную запись:
А Х=О. (2)
Однородная система всегда совместна, она имеет, по крайней мере, решение , которое называется Тривиальным. Исследуем возможность существования других решений. Предположим, что
, и что ее базисный минор расположен в левом верхнем углу. Тогда можно отбросить
линейно зависимых последних уравнений. Неизвестные, коэффициенты при которых образуют базисный минор, называют Базисными неизвестными, а остальные – Свободными. Преобразуем систему следующим образом: базисные неизвестные оставим в левой части, а свободные перенесем направо. Получим систему уравнений, равносильную исходной:
(3)
Рассмотрим различные случаи.
1. Если , то в системе (3) число уравнений равно числу неизвестных, а её определитель совпадает с базисным минором и, поэтому, отличен от 0. Значит, по правилу Крамера система (3) имеет единственное решение, которое является тривиальным.
2. Пусть . Придадим свободным неизвестным какие-либо значения
. Подставляя их в (3), получаем систему крамеровского типа:
(4)
Она имеет единственное решение . Тогда упорядоченный набор
—
Решение системы (3) и исходной системы. Так как свободным неизвестным можно придать значения бесконечным числом способов, то при условии однородная система линейных уравнений имеет бесконечное множество решений.
Вывод. Для того чтобы однородная система линейных уравнений имела нетривиальные решения, необходимо и достаточно, чтобы ранг ее матрицы был меньше количества неизвестных. В частности, если в однородной системе число уравнений равно числу неизвестных, то для существования нетривиальных решений необходимо и достаточно, чтобы определитель матрицы системы был равен нулю.
.
Свойства решений однородной системы линейных уравнений
1°. Сумма решений однородной системы также является ее решением.
►{X1, X2 – решения (2)} {A(X1+X2) = AX1+AX2 = О}
{X1+X2 – решение (2)}.◄
2°. Если решение однородной системы умножить на число, то также получим ее решение.
►{Х – решение (2)}{А(αХ)=α(АХ)=αО=О}
{αХ – решение (2)}.◄
3°. При условии во множестве
всех решений однородной системы линейных уравнений существует линейно независимая система, состоящая из
решений, которая называется Фундаментальной системой решений Этой однородной системы.
►Построим систему решений следующим образом: для решения свободным неизвестным придадим значения
, для
—
, и т. д., и найдем базисные неизвестные, решая (4):
,
, … ,
(5)
(звездочками здесь отмечены значения неизвестных, которые для наших рассуждений не так уж и важны). Так как , то по теореме 2 § 3 система (5) линейно независима.◄
4°. Каждое решение однородной системы может быть представлено в виде линейной комбинации решений её фундаментальной системы
►Обозначим X0 произвольное решение однородной системы,
И построим вспомогательный столбец
. (6)
Из свойств 1° и 2° вытекает, что и
— также решения однородной системы. Но
, где
— некоторые числа. Подставив
в (3), получаем систему крамеровского типа
,
Которая имеет единственное тривиальное решение . Таким образом,
, следовательно
.◄
Замечания. 1. При доказательстве свойства 3° мы получили следующее правило: для построения фундаментальной системы решений следует свободным неизвестным придать значения по строкам единичной (или любой невырожденной) матрицы и найти соответствующие значения базисных неизвестных, решая систему (4). На практике сначала решают систему (4) в общем виде, выражая все неизвестные через свободные, а затем придают им необходимые значения.
2. Из доказанных свойств вытекает, что множество всех решений однородной системы линейных уравнений совпадает с множеством всевозможных линейных комбинаций решений её фундаментальной системы (т. е. решений вида (6)).
Определение. Множество всех решений системы линейных уравнений, выраженное через параметры (свободные неизвестные), называется Общим решением системы линейных уравнений. Каждое решение системы называется её Частным решением.
Чтобы получить какое-либо частное решение, следует в общем решении придать свободным неизвестным какие-то конкретные значения
§ 6. Неоднородные системы линейных уравнений
Пусть задана неоднородная система линейных уравнений
АХ=В (1)
В матричной записи. Наряду с (1) рассмотрим однородную систему
АХ=О (2)
С той же матрицей, что и система (1). Однородную систему (2) будем называть союзной для неоднородной системы (1).
Теорема. Справедливы следующие утверждения:
1. Разность решений неоднородной системы линейных уравнений является решением союзной к ней однородной системы.
2. Сумма решения неоднородной системы линейных уравнений и решения союзной к ней однородной является решением неоднородной системы.
3. Если неоднородная система линейных уравнений имеет решение , то любое ее решение Х может быть представлено в виде
, (3)
Где — некоторое решение союзной к ней однородной системы.
►1. — решения (1)}
— решение (2)}.
2. { – решение (1),
— решение (2)}
Решение (1)}.
3. Пусть система (1) имеет некоторое решение , и пусть
— её произвольное решение. Положим
. Тогда
— решение (2) и
.◄
Итак, если неоднородная система линейных уравнений имеет решение , то равенство (3) устанавливает взаимно однозначное соответствие между множеством всех её решений и множеством всех решений союзной к ней однородной системы. Таким образом, если неоднородная система имеет решения, то она имеет их столько, сколько и союзная к ней однородная.
Вывод. Пусть — число неизвестных системы линейных уравнений (1). Если
, то неоднородная система не имеет решений; если
, то она имеет единственное решение, если же
, то система (1) имеет бесчисленное множество решений. Кроме того, из (3) вытекает, что общее решение неоднородной системы линейных уравнений является суммой некоторого ее частного решения и общего решения союзной к ней однородной системы.
§7. Метод Гаусса решения системы линейных уравнений
Теорема. С помощью элементарных преобразований только над строками и перестановки столбцов любая ненулевая матрица может быть приведена к простейшему виду, т. е. к виду, когда в её левом верхнем углу находится единичная матрица, а последние строки полностью состоят из нулей.
►Пусть задана ненулевая матрица
(верхний индекс будет обозначать номер шага). Предположим, например, что . Если это не так, выберем какой-либо отличный от нуля элемент, назовем его Опорным (или Разрешающим), и с помощью перестановки строк и столбцов переместим этот элемент в левый верхний угол. Разделив первую строку матрицы А на
, получим матрицу
,
Которую, в свою очередь, преобразуем так: к I — й строке прибавим первую, умноженную на . Тогда матрица
перейдет в следующую:
,
Где — некоторые числа. Если какая-либо из строк матрицы
полностью состоит из нулей, мы ее переставим на последнее место.
Выберем теперь среди чисел , отличное от нуля и переместим его опять же с помощью перестановки строк и столбцов во вторую строку и второй столбец. Теперь
, и мы можем разделить на него вторую строку. Получаем новую матрицу
,
Строки которой, в том числе и первую, преобразуем так: к I-й строке прибавляем вторую, умноженную на . Тогда
переходит в следующую матрицу:
Теперь выбираем отличный от нуля элемент в последних ()-х строках, переставляем его в третью строку и третий столбец и процесс повторяем. Преобразования продолжаем до тех пор, пока не окажется, что все последние строки состоят из одних нулей. Полученная матрица и будет матрицей простейшего вида.◄
Замечание. На самом деле перестановкой столбцов мы заниматься не будем. Базисный минор вовсе не обязательно перемещать в первые столбцы и приводить к виду единичной матрицы, достаточно, чтобы в каждом из его столбцов был единственный отличный от нуля элемент. Кроме того, чтобы избежать дробей, строчки также не будем делить на опорный элемент. При переходе от каждой матрицы к следующей поступаем так:
А) выбираем опорный элемент в тех строках и столбцах, которые опорными еще не были;
Б) опорную строку оставляем без изменений, опорный столбец дополняем нулями;
В) предыдущие опорные столбцы умножаем на новый опорный элемент;
Г) остальные элементы пересчитываем по правилу прямоугольника:
, т. е. как определитель второго порядка, у которого главной является диагональ, содержащая опорный элемент.
Правило решения системы линейных уравнений
1. Вычисляем одновременно ранг матрицы системы и ранг расширенной матрицы, приводя матрицу А с помощью элементарных преобразований строк матрицы к простейшему виду. При этом получаем матрицу системы, равносильной исходной. Если
, то система решений не имеет.
2. Если , то система имеет единственное решение, которое получается сразу же, как только мы запишем систему по последней матрице.
3. Если , то последние
уравнений можно отбросить (они имеют вид 0=0), и
перейдет в матрицу
.
Её базисный минор расположен в первых столбцах, поэтому базисными будут первые
неизвестных. Выписывая по полученной матрице систему и выражая все неизвестные через свободные, находим общее решение.
Пример. Решим методом Гаусса систему линейных уравнений
▼Составляем расширенную матрицу и приводим её к простейшему виду методом опорного элемента. При этом всякий раз получаем матрицу системы, равносильной исходной. Поэтому между матрицами можно ставить знак равносильности. Опорный элемент будем подчеркивать двойной чертой.
.
Базисный минор можно выбрать, например, в первом, третьем и четвертом столбцах. Тогда базисными будут неизвестные , а свободным —
и
. По последней матрице выписываем систему, причем свободные неизвестные переносим направо:
Общее решение выглядит так:
.▲
§ 8. Еще раз об обратной матрице
Если квадратная матрица имеет второй или третий порядок, то обратную к ней найти очень просто. Это можно сделать практически устно, используя алгебраические дополнения. Если же матрица имеет более высокий порядок, то алгебраические дополнения устно считать уже затруднительно, да и количество их растет. Например, для вычисления обратной к матрице четвертого порядка надо найти один определитель четвертого порядка и 16 определителей третьего. Разберем сейчас ещё один способ вычисления обратной матрицы.
Пусть — невырожденная квадратная матрица
— Го порядка. Обратную к ней можно найти как решение матричного уравнения
. (1)
Обозначим
— Столбец матрицы
,
—
— Столбец матрицы
,
. Тогда уравнение (1) можно преобразовать так:
{(1)} {
}
{
}
{
}.
Таким образом, матричное уравнение (1) равносильно системе
(2)
Состоящей из систем линейных уравнений с одной и той же невырожденной матрицей . Каждую из этих систем можно решить методом Гаусса, приводя элементарными преобразованиями над строками (или методом опорного элемента) матрицу
к единичной (столбец
при этом переходит в некоторый столбец
):
{}
{
}
{
}.
Тогда .
Так как в (2) все системы имеют одну и туже матрицу, то нет необходимости преобразовывать отдельно расширенную матрицу каждой из этих систем, а можно это сделать вместе, записав матрицу и преобразовывая сразу и матрицу
и все столбцы
.
Из вышесказанного вытекает правило нахождения обратной матрицы: записываем расширенную матрицу и, применяя элементарные преобразования только к строкам, приводим матрицу
к единичной. При этом матрица
приводится к
:
.
Пример. С помощью элементарных преобразований найдем обратную для матрицы
.
▼
.
Таким образом,
.▲