Jump to content

Chain rule

This is a reviewed translation article. Click here for more information.
From DawoumWiki, the free Mathematics self-learning

미적분학(calculus)에서, 체인 규칙(chain rule)은 합성(composite) 함수(functions)도함수(derivative)를 계산하기 위한 공식(formula)입니다. 즉, 만약 fg가 함수이면, 체인 규칙은 fg함수의 곱(product of functions)의 도함수의 관점에서 그들의 합성 f gx으로 매핑하는 함수 — 의 도함수를 다음으로 표현합니다:

대안적으로, F = f g (동등하게, 모든 x에 대해 F(x) = f(g(x)))를 설정함으로써, 우리는 라그랑주의 표기법(Lagrange's notation)에서 체인 규칙을 다음으로 역시 쓸 수 있습니다:

체인 규칙은 다음 방법에서 라이프니츠의 표기법(Leibniz's notation)으로 역시 다시-쓸 수 있습니다. 만약 변수 z가 변수 y에 의존하며, 그것 자체로 변수 x에 의존하면 (즉, yz종속 변수(dependent variable)이면), z는, y의 중간 변수를 통해, 마찬가지로 x에 종속합니다. 이 경우에서, 체인 규칙은 다음임을 말합니다:

보다 정확하게, 각 도함수에서 그 점을 가리키기 위해 다음에서 평가됩니다:

.

라그랑주와 라이프니츠의 표기법에서 체인 규칙의 버전은 동등하며, 그 의미에서 만약 이므로, 이면, 다음입니다:

[1]

적분화(integration)에서, 체인 규칙에 대한 짝은 치환 규칙(substitution rule)입니다.

History

체인 규칙은 고트프리트 빌헬름 라이프니츠(Gottfried Wilhelm Leibniz)에 의해 처음 사용된 것으로 보입니다. 그는 제곱근 함수와 함수 의 합성으로 의 도함수를 계산하기 위해 그것을 사용했습니다. 그는 처음에 그것을 1676년 (계산에서 부호 오류를 갖는) 회고록에서 언급했습니다. 체인 규칙의 공통적인 표기법은 라이프니츠에 기인합니다.[2] 기욤 드 로피탈(Guillaume de l'Hôpital)은 그의 책 Analyse des infiniment petits에서 체인 규칙을 암시적으로 사용했습니다. 체인 규칙은, 비록 그들이 라이프니츠의 발견 후에 수백 년에 걸쳐 쓰였을지라도, 레온하르트 오일러(Leonhard Euler)의 해석학 책의 임의의 것에서 나타나지 않습니다.

One dimension

First example

스카이다이버가 비행기에서 뛰어 내린다고 상상해 보십시오. 점프 후 t 초, 미터에서 그의 해발 높이가 g(t) = 4000 − 4.9t2로 주어진다고 가정합니다. 높이 h에서 대기압(atmospheric pressure)에 대해 하나의 모델은 f(h) = 101325 e−0.0001h입니다. 이들 두 방정식은 다음 데이터를 생성하기 위한 다양한 방법에서 미분화되고 결합될 수 있습니다:

  • g′(t) = −9.8t는 시간 t에서 스카이다이버의 속도입니다.
  • f′(h) = −10.1325e−0.0001h는 높이 h에서 높이에 관한 대기압에서 변화율이고 해발 h 미터에서 스카이다이버에 작용하는 부력(buoyant force)에 비례합니다. (사실 부력은 스카이다이버의 부피에 의존합니다.)
  • (fg)(t)는 점프 후 t초 동안 스카이다이버가 경험한 대기압입니다.
  • (fg)′(t)는 스카이다이버의 점프 후 t초에서 시간에 관한 대기압에서 변화율이고, 그의 점프 후 t초에서 스카이다이버의 부력에 비례합니다.

여기서, 체인 규칙은 fg의 관점에서 (fg)′(t)를 계산하는 것에 대해 방법을 제공합니다. 합성 함수의 도함수를 계산하기 위해 도함수의 정의를 직접 적용하는 것이 항상 가능하지만, 이것은 보통 매우 어렵습니다. 체인 규칙의 유용성은 복잡한 도함수를 여러 쉬운 도함수로 바꾼다는 것입니다.

체인 규칙은, 적절한 조건 아래에서, 다음임을 말합니다:

이 예제에서, 이것은 다음과 같습니다:

체인 규칙의 명제에서, fg는 약간 다른 역할을 하는데, 왜냐하면 f'에서 평가되지만, g't에서 평가되기 때문입니다. 이것은 올바르게 작동하는 단위를 만들기 위해 필요합니다.

예를 들어, 우리는 스카이다이버가 점프한 후 10초 동안 대기압에서 변화율을 계산하기를 원한다고 가정합니다. 이것은 (fg)′(10)이고 초당 파스칼(pascals)의 단위를 가집니다. 체인 규칙에서 인수 g′(10)은 점프 후 10초에서 스카이다이버의 속도이고, 그것은 초당 미터로 표현됩니다. 는 높이 g(10)에서 높이에 관한 압력에서 변화이고 미터당 파스칼로 표현됩니다. 의 곱은 그러므로 초당 파스칼의 정확한 단위를 가집니다.

여기서, 다른 곳에서 f를 평가할 수 없음에 주목하십시오. 예를 들어, 문제에서 10은 10초를 나타내지만, 표현 은 10 미터의 높이에서 압력에서 변화를 나타낼 것이며, 이것은 우리가 원하는 것이 아닙니다. 비슷하게, g′(10) = −98은 초당 미터의 단위를 가지지만, 표현 f′(g′(10))은 −98 미터의 높이에서 압력에서 변화를 나타내며, 이것 역시 우리가 원하는 것이 아닙니다. 어쨌든, g(10)은 해발 3020 미터이고, 점프 후 10초에서 스카이다이버의 높이이고, 이것은 f에 대한 입력에 대해 정확한 단위를 가집니다.

Statement

체인 규칙의 가장-간단한 형식은 하나의 실수(real) 변수의 실수-값 함수에 대한 것입니다. 만약 g가 점 c에서 미분-가능한 함수 (즉, 도함수 g′(c)가 존재)이고 fg(c)에서 미분-가능한 함수이면, 합성 함수 f ∘ gc에서 미분-가능이고, 도함수는 다음입니다:[3]

체인은 때때로 다음으로 축약됩니다:

만약 y = f(u)u = g(x)이면, 이 축약된 형식은 라이프니츠 표기법(Leibniz notation)에서 다음으로 쓰입니다:

[1]

도함수가 평가되는 점은 다음임을 명시적으로 역시 말할 수 있습니다:

나아가서 같은 추론을 수행하면, 합성 함수 을 갖는 n 함수 가 주어지면, 만약 각 함수 가 그의 직접 입력에서 미분-가능이면, 합성 함수는 체인 규칙의 반복된 적용에 의해 역시 미분-가능이며, 여기서 도함수는 (라이프니츠의 표기법에서) 다음입니다:

[4]

Further examples

Absence of formulas

비록 미분-가능한 함수에 대해 공식이 없을 때일지라도 체인 규칙을 적용할 가능성이 있을 것입니다. 이것은 도함수가 직접 측정될 때 발생할 수 있습니다. 자동차가 높은 산 위로 몰고 있다고 가정해 보십시오. 자동차의 속력계는 직접 그의 속력을 측정합니다. 만약 경사각(grade)이 알려져 있으면, 오르막 비율은 삼각법(trigonometry)을 사용하여 계산될 수 있습니다. 차가 2.5 km/h로 올라가는 중이라고 가정합니다. 지구의 대기에 대한 표준 모델은 (소멸 비율(lapse rate:기온 감률)이라고 불리는) 온도가 올라간 킬로미터당 약 6.5 °C 떨어지는 것을 의미합니다. 시간당 온도 하락을 구하기 위해, 우리는 체인 규칙을 적용할 수 있습니다. 함수 g(t)를 시간 t에서 자동차의 고도로 놓고, 함수 f(h)를 해발 h 킬로미터 위의 온도로 놓습니다. fg는 정확하게 알려져 있지 않습니다: 예를 들어, 자동차가 출발하는 고도는 알려지지 않았고 산의 온도도 알려지지 않았습니다. 어쨌든, 그들의 도함수는 알려져 있습니다: f′은 −6.5 °C/km이고, g′은 2.5 km/h입니다. 체인 규칙은 합성 함수의 도함수가 f의 도함수와 g의 도함수의 곱임을 말합니다. 이것은 −6.5 °C/km2.5 km/h = −16.25 °C/h입니다.

이 계산이 왜 가능한지에 대한 이유 중 하나는 f이 상수 함수이기 때문입니다. 자동차 근처의 온도가 시간에 따라 어떻게 변하는지에 대한 보다 정확한 설명은 온도가 다른 고도에서 어떻게 변하는지에 대한 정확한 모델을 필요로 합니다. 이 모델은 상수 도함수를 가지지 않을 수 있습니다. 그러한 모델에서 온도 변화를 계산하기 위해, 단지 g이 아닌 g를 알아야 할 필요가 있는데, 왜냐하면 g를 아는 것없이 f을 어디서 평가해야 하는지를 알 수 없기 때문입니다.

Composites of more than two functions

체인 규칙은 두 함수보다 많은 합성에 적용될 수 있습니다. 두 함수보다 많은 합성의 도함수를 얻기 위해, (해당 순서에서) f, g, 및 h의 합성은 gh를 갖는 f의 합성임에 주의하십시오. 체인 규칙은 fgh의 도함수를 계산하기 위해, f의 도함수와 gh의 도함수를 계산하는 것으로 충분하다고 말합니다. f의 도함수는 직접 계산될 수 있고, gh의 도함수는 다시 체인 규칙을 적용함으로써 계산될 수 있습니다.

구체성을 위해, 다음 함수를 생각해 보십시오:

이것은 세 함수의 합성으로 분해될 수 있습니다:

그들 도함수는 다음입니다:

체인 규칙은 점 x = a에서 그들 합성의 도함수는 다음임을 말합니다:

라이프니츠 표기법에서, 이것은 다음입니다:

또는 짧게,

도함수 함수는 그러므로 다음입니다:

이 도함수를 계산하는 또 다른 방법은 fgh의 합성으로 합성 함수 fgh를 보는 것입니다. 이 방식에서 체인 규칙을 적용함으로써 다음을 산출합니다:

이것은 위에서 계산된 것과 같습니다. 이것은 예상되는 것인데 왜냐하면 (fg) ∘ h = f ∘ (gh)이기 때문입니다.

때때로 형식 의 임의의 긴 합성을 미분하는 것이 필요합니다. 이 경우에서, 다음을 정의합니다:

여기서 일 때 입니다. 그런-다음 체인 규칙은 다음 형식을 취합니다:

또는 라그랑주 표기법에서,

Quotient rule

체인 규칙은 잘-알려진 미분화 규칙을 유도하기 위해 사용될 수 있습니다. 예를 들어, 몫 규칙은 체인 규칙과 곱 규칙의 결과입니다. 이것을 보이기 위해, 함수 f(x)/g(x)를 곱 f(x) · 1/g(x)으로 씁니다. 먼저 곱 규칙을 적용합니다:

1/g(x)의 도함수를 계산하기 위해, 역수 함수, 즉, x1/x로 보내는 함수를 갖는 g의 합성임을 주목하십시오. 역수 함수의 도함수는 입니다. 체인 규칙을 적용함으로써, 마지막 표현은 다음이 됩니다:

이것이 몫 규칙에 대해 보통 공식입니다.

Derivatives of inverse functions

y = g(x)역함수(inverse function)를 가진다고 가정합니다. 그의 역함수 f하고 그래서 우리는 x = f(y)를 가집니다. g의 도함수의 관점에서 f의 도함수에 대해 공식이 있습니다. 이것을 보기 위해서, fg가 다음 공식을 만족하는 것에 주목하십시오:

함수 f(g(x))와 x는 같기 때문에, 그들 도함수는 반드시 같아야 합니다. x의 도함수는 값 1을 갖는 상수 함수이고, f(g(x))의 도함수는 체인 규칙에 의해 결정됩니다. 그러므로, 우리는 다음을 가집니다:

독립 변수 y의 함수로 f′을 표현하기 위해서, 우리는 그것이 나타날 때마다 x에 대해 f(y)를 대체합니다. 그러면 우리는 f′에 대해 풀 수 있습니다.

예를 들어, 함수 g(x) = ex를 생각해 보겠습니다. 그것은 역 f(y) = ln y를 가집니다. g′(x) = ex이기 때문에, 위의 공식은 다음을 말합니다:

이 공식은 g가 미분 가능히고 그의 역 f가 역시 미분 가능일 때마다 참입니다. 이 공식은 이러한 조건 중에 하나가 참이 아닐 때 실패할 것입니다. 예를 들어, g(x) = x3를 고려해 보겠습니다. 그의 역은 f(y) = y1/3이고, 영에서 미분 가능하지 않습니다. 만약 우리가 영에서 f의 도함수를 계산하기 위해 위의 공식을 사용하기 위해 시도하면, 우리는 1/g′(f(0))를 반드시 평가해야 합니다. f(0) = 0g′(0) = 0이므로, 우리는 1/0을 반드시 평가해야 하고, 그러나 이 값은 정의되지 않습니다. 그러므로, 공식은 이 경우에 실패합니다. 이것은, f가 영에서 미분 가능하지 않기 때문에 발생하는 것으로 놀라운 것은 아닙니다.

Higher derivatives

파 디 브루노(Faà di Bruno's formula)의 공식은 체인 규칙을 고차 도함수로 일반화합니다. y = f(u)u = g(x)임을 가정하면, 먼저 몇 개의 도함수는 다음입니다:

Proofs

First proof

체인 규칙의 한 증명은 도함수의 정의와 함께 시작합니다:

a 근처 임의의 x에 대해 와 같지 않다는 순간에 대해 가정합니다. 그런-다음 이전 표현은 두 인수의 곱과 같습니다:

만약 a 근처에서 진동하면, 그것이 a에 얼마나 가까운지 문제가 되지 않음을 발생할 수 있으며, 와 같음을 만족하는 월씬 더 가까운 x가 항상 존재합니다. 예를 들어, 이것은 점 a = 0 근처에서 g(x) = x2sin(1 / x)에 대해 발생합니다. 이것이 발생할 때마다, 위의 표현은 정의되지 않는데 왜냐하면 그것이 영에 의한 나눗셈(division by zero)을 포함하기 때문입니다. 이 문제를 해결하기 위해, 다음으로 함수 를 도입합니다:

우리는 fg에 대해 차이 몫(difference quotient)이 항상 다음과 같음을 보일 것입니다:

g(x)g(a)와 같지 않을 때마다, 이것은 분명한데 왜냐하면 g(x) − g(a)의 인수가 취소되기 때문입니다. g(x)g(a)와 같을 때, fg에 대해 차이 몫은 영인데 왜냐하면 f(g(x))f(g(a))와 같기 때문이고, 위의 곱은 영인데 왜냐하면 그것은 f′(g(a)) 곱하기 영이기 때문입니다. 그래서 위의 곱은 항상 차이 몫과 같고, a에서 fg의 도함수가 존재함을 보여주는 것, 및 그의 값을 결정하기 위해, 우리는 위의 곱의 xa로 갈 때 극한이 존재하고 그의 값을 결정함을 오직 보일 필요가 있습니다.

이것을 하기 위해, 만약 그의 인수의 극한이 존재하면 곱의 극한이 존재함을 상기하십시오. 이것이 발생할 때, 이들 두 인수의 곱의 극한은 인수의 극한의 곱과 같을 것입니다. 두 인수는 Q(g(x))(g(x) − g(a)) / (xa)입니다. 후자는 a에서 g에 대해 차이 몫이고, g가 가정에 의해 a에서 미분-가능이기 때문에, 그의 극한은 xa로 경향이 있을 때 존재하고 g′(a)와 같습니다.

Q(g(x))에 대해 이므로, Q는, f가 있는 어디에서든지, 정의됩니다. 게다가, f는 가정에 의해 g(a)에서 미분-가능이므로, Q는, 도함수의 정의에 의해, g(a)에서 연속입니다. ga에서 ㅇ녀속인데 왜냐하면 그것은 a에서 미분-가능이기 때문이고, 그러므로 Qga에서 연속입니다. 그래서 그의 극한은, xa로 경향일 때, 존재하고 Q(g(a))와 같으며, 이것은 f′(g(a))입니다.

이것은 두 인수의 극한이 존재하고 그들은, 각각, f′(g(a))g′(a)와 같음을 보입니다. 그러므로, a에서 fg의 도함수는 존재하고 f′(g(a))g′(a)와 같습니다.[4]

Second proof

체인 규칙을 입증하는 또 다른 방법은 도함수에 의해 결정된 선형 근사에서 오차를 측정하는 것입니다. 이 증명은 그것이 여러 변수로 일반화된다는 장점을 가집니다. 그것은 한 점에서 미분-가능성의 다음 동등한 정의에 의존합니다: 함수 g는, 만약 실수 g′(a)가 존재하고 h가 영으로 경향일 때 영으로 경향이 있는 함수 ε(h)가 존재할 때, a에서 미분-가능이고, 게다가 다음입니다:

여기서 왼쪽 변은 aa + h에서 g의 값 사이의 참 차이를 나타내지만, 오른쪽 변은 미분 더하기 오차 항에 의해 결정된 근사를 나타냅니다.

체인 규칙의 상황에서, 그러한 함수 ε가 존재하는데 왜냐하면 ga에서 미분-가능인 것으로 가정되기 때문입니다. 다시 가정에 의해, 비슷한 함수는 g(a)에서 f에 대해 역시 존재합니다. 이 함수를 η라고 호출하면, 우리는 다음을 가집니다:

위의 정의는, 비록 k가 영으로 경향일 때 η(k)가 영으로 경향인 것을 가정하지 않더라도, η(0)에 대한 구속-조건을 두지 않습니다. 만약 우리가 η(0) = 0을 설정하면, η은 0에서 연속입니다.

정리를 증명하는 것은 h가 영으로 경향일 때 차이 f(g(a + h)) − f(g(a))를 연구하는 것을 요구합니다. 첫 번째 단계는 a에서 g의 미분-가능성의 정의를 사용하여 g(a + h)를 치환하는 것입니다:

다음 단계는 g(a)에서 f의 미분-가능성의 정의를 사용하는 것입니다. 이것은 일부 k에 대해 형식 f(g(a) + k)의 항을 요구합니다. 위의 방정식에서, 정확한 kh와 함께 변합니다. kh = g′(a) h + ε(h) h를 설정하고 오른쪽 변은 f(g(a) + kh) − f(g(a))가 됩니다. 도함수의 정의를 적용하면 다음을 얻습니다:

h가 영으로 경향일 때 이 표현의 행동을 연구하기 위해, kh를 전개합니다. 항들을 다시-그룹한 후에, 오른쪽 변은 다음이 됩니다:

h가 영으로 경향일 때 ε(h)η(kh)은 영으로 경향이기 때문에, 대괄호 안의 처음 두 항은, h가 영으로 경향일 때, 영으로 경향이 있습니다. 첫 번째 증명에서처럼 극한의 곱에 대한 같은 정리를 적용하면, 대괄호 안의 세 번째 항은 역시 영으로 경향이 있습니다. 위의 표현이 차이 f(g(a + h)) − f(g(a))와 같기 때문에, 도함수의 정의에 의해 fga에서 미분-가능이고 그의 도함수는 f′(g(a)) g′(a)입니다.

첫 번째 증명에서 Q의 역할은 이 증명에서 η에 의해 수행됩니다. 그것들은 다음 방정식에 의해 관련됩니다:

g(a)에서 Q를 정의하기 위한 필요성은 영에서 η를 정의하기 위한 필요성과 아날로그입니다.

Third proof

함수의 미분 가능성의 콘스탄티노스 카라테오도리(Constantin Carathéodory)의 대안적인 정의는 체인 규칙의 우아한 증명을 제공하기 위해 사용될 수 있습니다.[5]

이 정의 아래에서, 함수 f는 점 a에서 미분-가능인 것과 f(x) − f(a) = q(x)(xa)을 만족하는 a에서 연속인 함수 q가 있는 것은 필요충분 조건입니다. 많아야 하나의 그러한 함수가 있고, 만약 fa에서 미분-가능이면, f ′(a) = q(a)입니다.

체인 규칙의 가정과 미분-가능한 함수와 연속 함수의 합성이 연속이라는 사실을 가정이 주어지면, 우리는, 다음을 만족하는, a에서 연속인 rg(a)에서 연속인 함수 q가 존재함을 가집니다:

그러므로,

그러나 h(x) = q(g(x))r(x)에 의해 주어진 함수는 a에서 연속이고, 우리는, 이 a에 대해, 다음을 얻습니다:

비슷한 접근은 많은 변수의 연속적으로 미분-가능한 (벡터-)함수에 대해 작용합니다. 인수화의 이 방법은, 도함수가 립시츠 연속(Lipschitz continuous), 횔더 연속(Hölder continuous) 등일 필요가 있을 때, 미분-가능성의 더 강한 형식의 통일된 접근을 역시 허용합니다. 미분화 자체는 다항식 나머지 정리(polynomial remainder theorem) (작은 베주(Bézout) 정리, 또는 인수 정리)로 보일 수 있으며, 함수의 적절한 클래스로 일반화될 수 있습니다.[citation needed]

Proof via infinitesimals

만약 이면 무한소 를 선택하면 우리가 해당하는 를 계산하고, 그런-다음 다음이 되도록

해당하는 를 계산하고, 표준 부분(standard part)을 적용하여 우리는 다음을 얻습니다:

이것이 체인 규칙입니다.

Multivariable case

다-변수 함수(multi-variable function)의 체인 규칙의 일반화는 꽤 기법적입니다. 어쨌든, 다음 형식의 함수의 경우에서 쓰는 것이 더 간단합니다:

이 경우는 단일 변수의 함수의 연구에서 종종 발생하므로, 분리해서 그것을 설명할 가치가 있습니다.

Case of f(g1(x), ... , gk(x))

다음 형식의 함수에 대한 체인 규칙을 쓰는 것에 대해

f(g1(x), ... , gk(x)),

우리는 그의 k 인수에 관한 f부분 도함수(partial derivative)가 필요합니다. 부분 도함수에 대해 보통 표기법은 함수 인수에 대해 이름을 포함합니다. 이들 인수는 위의 공식에서 이름짓지 않았으므로, 그의 i번째 인수에 관한 f의 다음 도함수

및, z에서 이 도함수의 값

에 의해 표시하는 것이 더 간단하고 더 명확합니다:

이 표기법과 함께, 체인 규칙은 다음입니다:

Example: arithmetic operations

만약 함수 f가 덧셈, 즉, 만약 다음이면,

입니다 (상수 함수 1입니다).

따라서, 체인 규칙은 다음을 제공합니다:

곱셈에 대해

부분 도함수는 입니다. 따라서,

지수의 경우

는 다소 보다 복잡한데, 왜냐하면

및, 이므로, 다음이기 때문입니다:

그것은 다음임을 따릅니다:

General rule

일반적인 경우에서 체인 규칙을 쓰는 것에 대해 가장-간단한 일반화는 전체 도함수(total derivative)를 사용하는 것이며, 이것은 단일 공식에서 모든 방향 도함수(directional derivative)를 포착하는 선형 변환입니다. 미분-가능한 함수 f : RmRkg : RnRm, 및 Rn에서 하나의 점 a를 생각해 보십시오. Da ga에서 g의 전체 도함수를 나타내고 Dg(a) fg(a)에서 f의 전체 도함수를 나타내는 것으로 놓습니다. 이들 두 도함수는, 각각, 선형 변환 RnRmRmRk이므로, 그들은 합성될 수 있습니다. 전체 도함수에 대해 체인 규칙은 그들 합성이 a에서 fg의 전체 도함수인 것입니다:

또는 짧게,

고-차원 체인 규칙은 위에서 주어진 두 번째 증명과 유사한 기법을 사용하여 입증될 수 있습니다.

전체 도함수가 선형 변환이기 때문에, 공식에서 나타나는 함수는 행렬로 다시-쓸 수 있습니다. 전체 도함수에 해당하는 행렬은 야코비 행렬(Jacobian matrix)로 불리고, 두 도함수의 합성은 그들 야코비 행렬의 곱에 해당합니다. 이 관점에서 체인 규칙은 그러므로 다음임을 말합니다:

또는 짧게,

즉, 합성 함수의 야코비는 (적절한 점에서 평가된) 합성된 함수의 야코비의 곱입니다.

고-차원 체인 규칙은 일-차원 체인 규칙의 일반화입니다. 만약 f : RRg : RR가 되도록, k, m, 및 n이 1이면, fg의 야코비 행렬은 1 × 1입니다. 특별히, 그들은 다음입니다:

fg의 야코비는 이들 1 × 1 행렬의 곱이므로, 일-차원 체인 규칙에서 예상된 것처럼, 그것은 f′(g(a))⋅g′(a)입니다. 선형 변환의 언어에서, Da(g)g′(a)에 의해 벡터를 스케일링하는 함수이고 Dg(a)(f)f′(g(a))의 인수에 의해 벡터를 스케일하는 함수입니다. 체인 규칙은 이들 두 선형 변환의 합성은 선형 변환 Da(fg)이고, 그러므로 그것은 f′(g(a))⋅g′(a)에 의해 벡터를 스케일하는 함수임을 말합니다.

체인 규칙을 쓰는 또 다른 방법은 fgy = f(u) = (f1(u), …, fk(u))u = g(x) = (g1(x), …, gm(x))로 그들 성분의 관점에서 표현될 때 사용됩니다. 이 경우에서, 야코비 행렬에 대해 위의 규칙은 보통 다음으로 쓰입니다:

전체 도함수에 대해 체인 규칙은 부분 도함수에 대해 체인 규칙을 의미합니다. 전체 도함수가 존재할 때임을 회상하고, i번째 좌표 방향에서 부분 도함수는 i번째 기저 벡터에 의해 야코비 행렬에 곱해짐으로써 발견됩니다. 위의 공식에 대해 이것을 행함으로써, 우리는 다음을 발견합니다:

야코비 행렬의 엔트리가 부분 도함수이므로, 우리는 다음을 얻기 위해 위의 공식을 단순화할 수 있습니다:

좀더 개념적으로, 이 규칙은, xi 방향에서 변화는 gm을 통해 g1의 모두를 변화시킬 수 있고, 이들 변화 중 임의의 것은 f에 영향을 미칠 수 있다는 사실을 나타냅니다.

k = 1인 특수한 경우에서, f가 실수-값 함수가 되도록, 이 공식은 훨씬 더 단순화됩니다:

이것은 점 곱(dot product)으로 다시-쓸 수 있습니다. u = (g1, …, gm)임을 회상하고, 부분 도함수 u / ∂xi는 역시 벡터이고, 체인 규칙은 다음임을 말합니다:

Example

x(r, t) = r sin(t)y(r,t) = sin2(t)u(x, y) = x2 + 2y가 주어지면, 체인 규칙을 사용하여 u / ∂ru / ∂t의 값을 결정합니다.

Higher derivatives of multivariable functions

일-변수 함수의 고-차 도함수에 대해 파 디 브루노의 공식은 다변수 경우에 대해 일반화됩니다. 만약 y = f(u)가 위에서 처럼 u = g(x)의 함수이면, fg의 이차 도함수는 다음입니다:

Further generalizations

미적분의 모든 확장은 체인 규칙을 가집니다. 이들의 대부분에서, 공식은, 비록 해당 공식의 의미는 크게 다를 수 있을지라도, 같은 것으로 남습니다.

하나의 일반화가 매니폴드(manifold)에 있습니다. 이 상황에서, 체인 규칙은, fg의 도함수는 f의 도함수와 g의 도함수의 합성이라는 사실을 나타냅니다. 이 정리는 위에서 주어진 고차원의 체인 규칙의 즉각적인 결과이고, 그것은 정확히 동일한 공식을 가집니다.

체인 규칙은 바나흐 공간(Banach space)에서 프레셰 도함수(Fréchet derivative)에 대해 역시 유효합니다. 같은 공식이 이전처럼 유지됩니다. 이 경우와 이전 경우는 바나흐 매니폴드(Banach manifold)에 대한 동시에 일어나는 일반화를 인정합니다.

추상 대수학(abstract algebra)에서, 도함수는 켈러 미분(Kähler differential)의 모듈의 사상으로 해석됩니다. 교환 링(commutative ring) f : RS링 준동형(ring homomorphism)은 원소 drd(f(r))에 보내는, f(r)의 외부 도함수, 켈러 미분 Df : ΩR → ΩS의 사상을 결정합니다. 공식 D(fg) = DfDg은 마찬가지로 이 문맥에서 유지됩니다.

이들 예제의 공통적인 특징은, 그들이, 도함수가 함수자(functor)의 일부라는 아이디어의 표현인 것입니다. 함수자는 공간 위의 연산이고 그들 사이의 함수입니다. 그것은 각 공간에 새로운 공간을 연결하고 두 공간 사이의 각 함수에 해당하는 새로운 공간 사이에 새로운 함수를 연결합니다. 위의 각 경우에서, 함수자는 각 공간을 그의 접 번들(tangent bundle)로 보내고 그것은 각 함수를 그의 도함수로 보냅니다. 예를 들어, 매니폴드의 경우에서, 도함수는 Cr-매니폴드를 Cr−1-매니폴드 (그의 접 번들)로 보내고, Cr-함수를 그의 전체 도함수로 보냅니다. 함수자가 되는 이것에 대해 하나의 요구 사항이 있습니다, 즉, 합성의 도함수는 반드시 도함수의 합성이어야 한다는 것입니다. 이것은 정확히 공식 D(fg) = DfDg입니다.

확률론적 미적분학(stochastic calculus)에서 체인 규칙이 역시 있습니다. 이들 중 하나, 이토의 보조-정리(Itō's lemma)는 두 번-미분 가능한 함수 f를 갖는 이토 프로세서 (또는 더 일반적으로 반마팅게일(semimartingale)) dXt의 합성을 표현합니다. 이토의 보조-정리에서, 합성 함수의 도함수는 dXtf의 도함수에 의존할 뿐만 아니라 f의 이차 도함수에 역시 의존합니다. 이차 도함수에 대한 의존성은 확률론적 프로세서의 비-영 이차 변동(quadratic variation)의 결과이며, 이것은 광범위하게 말하면 프로세서가 매우 거친 방향으로 위 및 아래로 움직일 수 있음을 의미합니다. 체인 규칙의 이 변형은 함수자의 예제가 아닌데 왜냐하면 합성되는 두 함수가 다른 유형의 것이기 때문입니다.

See also

References

  1. ^ a b "Chain Rule in Leibniz Notation". oregonstate.edu. Retrieved 2019-07-28.
  2. ^ Rodríguez, Omar Hernández; López Fernández, Jorge M. (2010). "A Semiotic Reflection on the Didactics of the Chain Rule". The Mathematics Enthusiast. 7 (2): 321–332. Retrieved 2019-08-04.
  3. ^ Apostol, Tom (1974). Mathematical analysis (2nd ed.). Addison Wesley. Theorem 5.5. {{cite book}}: Unknown parameter |nopp= ignored (|no-pp= suggested) (help)
  4. ^ a b "Chain Rule for Derivative". Math Vault. 2016-06-05. Retrieved 2019-07-28.
  5. ^ Kuhn, Stephen (1991). "The Derivative á la Carathéodory". The American Mathematical Monthly. 98 (1): 40–44. JSTOR 2324035.

External links