Градиент - Gradient

Градиент, представленный синими стрелками, обозначает направление наибольшего изменения скалярной функции. Значения функции представлены в оттенках серого и увеличиваются по значению от белого (низкий) до темного (высокий).

В векторное исчисление, то градиент из скалярный дифференцируемая функция ж из несколько переменных это векторное поле (или же вектор-функция ) чья ценность в точке это вектор[а] компоненты которого являются частные производные из в .[1][2][3][4][5][6][7][8][9] То есть для , его градиент определяется в точке в н-пространственное пространство как вектор:[b]

В набла символ , записывается в виде перевернутого треугольника и произносится как "дель"", обозначает векторный дифференциальный оператор.

Градиент двойственный производная : значение градиента в точке равно касательный вектор - вектор в каждой точке; в то время как значение производной в точке равно coкасательный вектор - линейная функция от векторов.[c] Они связаны тем, что скалярное произведение градиента ж в какой-то момент п с другим касательным вектором v равно производная по направлению из ж в п функции по v; то есть, .

Вектор градиента можно интерпретировать как «направление и скорость наиболее быстрого увеличения». Если градиент функции отличен от нуля в точке п, направление градиента - это направление, в котором функция растет быстрее всего от п, а величина градиента - это скорость увеличения в этом направлении.[10][11][12][13][14][15][16] Кроме того, градиент является нулевым вектором в точке тогда и только тогда, когда это стационарная точка (где производная обращается в нуль). Таким образом, градиент играет фундаментальную роль в теория оптимизации, где он используется для максимизации функции градиентный подъем.

Градиент допускает множественные обобщения на более общие функции на коллекторы; видеть § Обобщения.

Мотивация

Градиент 2D функции ж(Икс, у) = xe−(Икс2 + у2) отображается в виде синих стрелок над псевдоцветным графиком функции.

Рассмотрим комнату, в которой температура задается скалярное поле, Т, поэтому в каждой точке (Икс, у, z) температура Т(Икс, у, z), независимо от времени. В каждой точке комнаты градиент Т в этой точке покажет направление, в котором температура растет быстрее всего, отодвигаясь от (Икс, у, z). Величина градиента определяет, насколько быстро температура повышается в этом направлении.

Рассмотрим поверхность, высота которой над уровнем моря в точке (Икс, у) является ЧАС(Икс, у). Градиент ЧАС в точке - это плоский вектор, указывающий в направлении наискорейшего склона или оценка в таком случае. Крутизна наклона в этой точке определяется величиной вектора градиента.

Градиент также можно использовать для измерения того, как скалярное поле изменяется в других направлениях, а не только в направлении наибольшего изменения, путем измерения скалярное произведение. Предположим, что самый крутой уклон холма составляет 40%. Дорога, идущая прямо в гору, имеет уклон 40%, но дорога, огибающая холм под углом, будет иметь более пологий уклон. Например, если дорога проходит под углом 60 ° к направлению подъема (когда оба направления проецируются на горизонтальную плоскость), то уклон вдоль дороги будет скалярным произведением между вектором градиента и единичный вектор вдоль дороги, а именно в 40% раз больше косинус 60 °, или 20%.

В более общем смысле, если функция высоты холма ЧАС является дифференцируемый, то градиент ЧАС пунктирный с единичный вектор дает наклон холма в направлении вектора, производная по направлению из ЧАС вдоль единичного вектора.

Определение

Градиент функции ж(Икс,у) = - (cos2Икс + cos2у)2 изображен как спроектированный векторное поле на нижней плоскости.

Градиент (или векторное поле градиента) скалярной функции ж(Икс1, Икс2, Икс3, ..., Иксп) обозначается ж или же ж куда (набла ) обозначает вектор дифференциальный оператор, дель. Обозначение град ж также обычно используется для представления градиента. Градиент ж определяется как уникальное векторное поле, скалярное произведение которого с любым вектор v в каждой точке Икс является производной по направлению от ж вдоль v. То есть,

Формально градиент двойной к производной; видеть связь с производной.

Когда функция также зависит от параметра, такого как время, градиент часто относится просто к вектору только его пространственных производных (см. Пространственный градиент ).

Величина и направление вектора градиента равны независимый особого координатное представление.[17][18]

Декартовы координаты

В трехмерном Декартова система координат с Евклидова метрика, градиент, если он существует, определяется выражением:

куда я, j, k являются стандарт единичные векторы в направлениях Икс, у и z координаты соответственно. Например, градиент функции

является

В некоторых приложениях принято представлять градиент в виде вектор строки или же вектор столбца его компонентов в прямоугольной системе координат; в этой статье принято, что градиент является вектором-столбцом, а производная - вектором-строкой.

Цилиндрические и сферические координаты

В цилиндрические координаты с евклидовой метрикой градиент определяется как:[19]

куда ρ осевое расстояние, φ азимутальный или азимутальный угол, z - осевая координата, а еρ, еφ и еz - единичные векторы, указывающие вдоль координатных направлений.

В сферические координаты, градиент определяется как:[19]

куда р радиальное расстояние, φ азимутальный угол и θ - полярный угол, а ер, еθ и еφ снова являются локальными единичными векторами, указывающими в направлениях координат (то есть нормализованные ковариантный базис ).

Для градиента в другом ортогональные системы координат, видеть Ортогональные координаты (Дифференциальные операторы в трех измерениях).

Общие координаты

Мы считаем общие координаты, который мы запишем как Икс1, ..., Икся, ..., Иксп, куда п - количество измерений домена. Здесь верхний индекс относится к позиции в списке координаты или компонента, поэтому Икс2 относится ко второму компоненту, а не к количеству Икс в квадрате. Индексная переменная я относится к произвольному элементу Икся. С помощью Обозначения Эйнштейна, тогда градиент можно записать как:

(Обратите внимание, что его двойной является ),

куда и обратитесь к ненормализованному локальному ковариантные и контравариантные базисы соответственно, это обратный метрический тензор, а соглашение Эйнштейна о суммировании подразумевает суммирование по я и j.

Если координаты ортогональны, мы можем легко выразить градиент (и дифференциал ) в терминах нормализованных базисов, которые мы называем и , используя масштабные коэффициенты (также известные как Коэффициенты Ламе )  :

( и ),

где нельзя использовать обозначения Эйнштейна, поскольку невозможно избежать повторения более двух индексов. Несмотря на использование верхних и нижних индексов, , , и не являются ни контравариантными, ни ковариантными.

Последнее выражение соответствует приведенным выше выражениям для цилиндрических и сферических координат.

Градиент и производная или дифференциал

Градиент тесно связан с (всего) производная ((общий) дифференциал ) : они есть транспонировать (двойной ) друг другу. Используя соглашение, что векторы в представлены вектор-столбец, и ковекторы (линейные отображения ) представлены векторы-строки,[а] градиент и производная выражаются как вектор-столбец и вектор-строка, соответственно, с одними и теми же компонентами, но транспонированы друг в друга:

;
.

Хотя у них обоих одинаковые компоненты, они различаются по типу математического объекта, который они представляют: в каждой точке производная представляет собой котангенс вектор, а линейная форма (ковектор ), который выражает, насколько (скалярный) вывод изменяется при заданном бесконечно малом изменении (вектора) ввода, в то время как в каждой точке градиент является касательный вектор, который представляет собой бесконечно малое изменение (вектора) ввода. В символах градиент - это элемент касательного пространства в точке, , а производная - это отображение касательного пространства на действительные числа, . Касательные пространства в каждой точке можно "естественно" идентифицировать[d] с векторным пространством само по себе, и аналогичным образом котангенсное пространство в каждой точке можно естественным образом отождествить с двойное векторное пространство ковекторов; таким образом, значение градиента в точке можно представить как вектор в исходном , а не только как касательный вектор.

Вычислительно, учитывая касательный вектор, вектор может быть умноженный по производной (в виде матриц), что равносильно взятию скалярное произведение с градиентом:

Дифференциальная или (внешняя) производная

Наилучшее линейное приближение дифференцируемой функции

в какой-то момент Икс в рп это линейная карта из рп к р который часто обозначается как dfИкс или же Df(Икс) и назвал дифференциал или же (общий) производная из ж в Икс. Функция df, который отображает Икс к dfИкс, называется (общий) дифференциал или же внешняя производная из ж и является примером дифференциальная 1-форма.

Подобно тому, как производная функции одной переменной представляет собой склон из касательная к график функции,[20] производная по направлению функции нескольких переменных представляет собой наклон касательной гиперплоскость в направлении вектора.

Градиент связан с дифференциалом формулой

для любого vрп, куда это скалярное произведение: получение скалярного произведения вектора с градиентом аналогично получению производной по направлению вдоль вектора.

Если рп рассматривается как пространство (измерение п) вектор-столбцы (действительных чисел), то можно рассматривать df как вектор-строку с компонентами

так что dfИкс(v) дан кем-то матричное умножение. В предположении стандартной евклидовой метрики на рп, тогда градиент является соответствующим вектором-столбцом, то есть

Линейное приближение к функции

Самый лучший линейное приближение к функции можно выразить через градиент, а не через производную. Градиент а функция ж из евклидова пространства рп к р в любой момент Икс0 в рп характеризует лучшее линейное приближение к ж в Икс0. Приближение выглядит следующим образом:

за Икс рядом с Икс0, куда (∇ж )Икс0 это градиент ж вычислено в Икс0, а точка обозначает скалярное произведение на рп. Это уравнение эквивалентно первым двум членам в многопараметрический ряд Тейлора расширение ж в Икс0.

Градиент как «производная»

Позволять U быть открытый набор в рп. Если функция ж : Uр является дифференцируемый, то дифференциал ж является производной (Фреше) от ж. Таким образом ж это функция от U в космос рп такой, что

где · - скалярное произведение.

Как следствие, обычные свойства производной сохраняются для градиента, хотя градиент сам по себе не является производной, а скорее двойственен производной:

Линейность

Градиент линейный в том смысле, что если ж и грамм - две действительные функции, дифференцируемые в точке арп, и α и β две константы, то αf + βg дифференцируема в а, и более того

Правило продукта

Если ж и грамм - действительные функции, дифференцируемые в точке арп, то правило продукта утверждает, что продукт фг дифференцируема в а, и

Правило цепи

Предположим, что ж : Ар является вещественной функцией, определенной на подмножестве А из рп, и это ж дифференцируема в точке а. Есть две формы цепного правила, применяемого к градиенту. Сначала предположим, что функция грамм это параметрическая кривая; то есть функция грамм : ярп отображает подмножество яр в рп. Если грамм дифференцируема в точке cя такой, что грамм(c) = а, тогда

где ∘ - оператор композиции: ( ж ∘ грамм)(Икс) = ж(грамм(Икс)).

В более общем смысле, если вместо этого ярk, то имеет место следующее:

куда (Dg)Т обозначает транспонирование Матрица якобиана.

Для второй формы цепного правила предположим, что час : яр является вещественной функцией на подмножестве я из р, и это час дифференцируема в точке ж(а) ∈ я. потом

Другие свойства и применения

Наборы уровней

Ровная поверхность, или изоповерхность, - это множество всех точек, в которых некоторая функция имеет заданное значение.

Если ж дифференцируема, то скалярное произведение (∇ж )Иксv градиента в точке Икс с вектором v дает производную по направлению от ж в Икс в направлении v. Отсюда следует, что в этом случае градиент ж является ортогональный к наборы уровней из ж. Например, поверхность уровня в трехмерном пространстве определяется уравнением вида F(Икс, у, z) = c. Градиент F тогда нормальна к поверхности.

В общем, любой встроенный гиперповерхность в римановом многообразии можно вырезать уравнением вида F(п) = 0 такой, что dF нигде не ноль. Градиент F тогда нормальна к гиперповерхности.

Точно так же аффинная алгебраическая гиперповерхность может быть определено уравнением F(Икс1, ..., Иксп) = 0, куда F является многочленом. Градиент F равен нулю в особой точке гиперповерхности (это определение особой точки). В неособой точке это ненулевой нормальный вектор.

Консервативные векторные поля и градиентная теорема

Градиент функции называется градиентным полем. (Непрерывное) градиентное поле всегда консервативное векторное поле: это линейный интеграл вдоль любого пути зависит только от конечных точек пути и может быть вычислен с помощью градиентной теоремы (основная теорема исчисления для линейных интегралов). И наоборот, (непрерывное) консервативное векторное поле всегда является градиентом функции.

Обобщения

В Матрица якобиана является обобщением градиента для векторных функций многих переменных и дифференцируемые карты между Евклидовы пространства или, в более общем смысле, коллекторы.[21][22] Дальнейшее обобщение функции между Банаховы пространства это Производная Фреше.

Градиент вектора

Поскольку полная производная векторного поля равна линейное отображение от векторов к векторам, это тензор количество.

В прямоугольных координатах градиент векторного поля ж = ( ж1, ж2, ж3) определяется:

(где Обозначение суммирования Эйнштейна используется и тензорное произведение векторов ея и еk это диадический тензор типа (2,0)). В целом, это выражение равно транспонированной матрице Якоби:

В криволинейных координатах или, в более общем смысле, на криволинейном многообразие, градиент включает Символы Кристоффеля:

куда граммjk компоненты обратного метрический тензор и ея - координатные базисные векторы.

Выражаясь более инвариантно, градиент векторного поля ж можно определить Леви-Чивита связь и метрический тензор:[23]

куда c это связь.

Римановы многообразия

Для любого гладкая функция ж на римановом многообразии (M, грамм), градиент ж векторное поле ж такое, что для любого векторного поля Икс,

то есть,

куда граммИкс( , ) обозначает внутренний продукт касательных векторов в Икс определяется метрикой грамм и Иксж это функция, которая принимает любую точку ИксM к производной по направлению ж в направлении Икс, оценивается в Икс. Другими словами, в карта координат φ из открытого подмножества M к открытому подмножеству рп, (∂Иксж )(Икс) дан кем-то:

куда Иксj обозначает jй компонент Икс в этой координатной таблице.

Итак, локальная форма градиента принимает вид:

Обобщая случай M = рп, градиент функции связан с ее внешней производной, поскольку

Точнее градиент ж - векторное поле, ассоциированное с дифференциальной 1-формой df с использованием музыкальный изоморфизм

(называемые «точными»), определяемые метрикой грамм. Связь между внешней производной и градиентом функции на рп является частным случаем этого, когда метрика является плоской метрикой, заданной скалярным произведением.

Смотрите также

Примечания

  1. ^ а б В этой статье используется соглашение о том, что вектор-столбец представляют векторы, и векторы-строки представляют собой ковекторы, но распространено и противоположное соглашение.
  2. ^ Строго говоря, градиент - это векторное поле , а значение градиента в точке равно касательный вектор в касательное пространство в таком случае, , а не вектор в исходном пространстве . Однако все касательные пространства можно естественным образом отождествить с исходным пространством , поэтому их не нужно различать; видеть § Определение и связь с производной.
  3. ^ Значение градиента в точке можно рассматривать как вектор в исходном пространстве. , в то время как значение производной в точке можно рассматривать как ковектор на исходном пространстве: линейную карту .
  4. ^ Неформально «естественно» идентифицировать означает, что это может быть сделано без каких-либо произвольных выборов. Это можно формализовать с помощью естественная трансформация.

Рекомендации

  • Бахман, Дэвид (2007), Демистификация Advanced Calculus, Нью-Йорк: Макгроу-Хилл, ISBN  978-0-07-148121-2
  • Beauregard, Raymond A .; Фрали, Джон Б. (1973), Первый курс линейной алгебры: с дополнительным введением в группы, кольца и поля, Бостон: Компания Houghton Mifflin, ISBN  0-395-14017-X
  • Даунинг, Дуглас, доктор философии. (2010), Исчисление Бэррона E-Z, Нью-Йорк: Barron's, ISBN  978-0-7641-4461-5
  • Дубровин, Б. А .; Фоменко, А. Т .; Новиков, С. П. (1991). Современная геометрия - методы и приложения: Часть I: Геометрия поверхностей, группы преобразований и поля. Тексты для выпускников по математике (2-е изд.). Springer. ISBN  978-0-387-97663-1.CS1 maint: ref = harv (связь)
  • Харпер, Чарли (1976), Введение в математическую физику, Нью-Джерси: Prentice-Hall, ISBN  0-13-487538-9
  • Крейсциг, Эрвин (1972), Высшая инженерная математика (3-е изд.), Нью-Йорк: Wiley, ISBN  0-471-50728-8
  • "Энциклопедия науки и технологий Макгроу Хилла". Энциклопедия науки и технологий Макгро-Хилла (10-е изд.). Нью-Йорк: Макгроу-Хилл. 2007. ISBN  978-0-07-144143-8.
  • Мойз, Эдвин Э. (1967), Исчисление: полное, Чтение: Эддисон-Уэсли
  • Protter, Murray H .; Морри младший, Чарльз Б. (1970), Вычисление колледжа с аналитической геометрией (2-е изд.), Литература: Эддисон-Уэсли, LCCN  76087042
  • Шей, Х. М. (1992). Div, Grad, Curl и все такое (2-е изд.). W. W. Norton. ISBN  0-393-96251-2. OCLC  25048561.CS1 maint: ref = harv (связь)
  • Стокер, Дж. Дж. (1969), Дифференциальная геометрия, Нью-Йорк: Wiley, ISBN  0-471-82825-4
  • Своковски, Эрл В .; Олиник, Майкл; Пенс, Деннис; Коул, Джеффри А. (1994), Исчисление (6-е изд.), Бостон: PWS Publishing Company, ISBN  0-534-93624-5

дальнейшее чтение

  • Корн, Тереза ​​М .; Корн, Гранино Артур (2000). Математический справочник для ученых и инженеров: определения, теоремы и формулы для справки и обзора. Dover Publications. С. 157–160. ISBN  0-486-41147-8. OCLC  43864234.CS1 maint: ref = harv (связь)

внешняя ссылка