우리는 지난 포스팅에서 딥러닝 학습을 방해하는 안장점의 위협과 이를 극복하기 위한 최적화 알고리즘의 중요성을 확인했습니다.
수천, 수만 개의 파라미터가 동시에 변하는 인공지능 모델을 수학적으로 제어하기 위해서는 각 변수가 결과에 미치는 영향을 개별적으로 분리해 낼 줄 알아야 합니다.
이것이 바로 다변수 함수를 다루는 핵심 도구인 편미분이며, 라이프니츠가 고안한 분수 형태의 표기법은 이 복잡한 계산을 놀랍도록 단순한 기호의 결합으로 바꿔놓았습니다.

다차원 공간을 이해하는 창, 다변수 함수의 본질
우리가 수학 시간에 처음 접하는 함수는 입력값 x 하나에 결과값 y 하나가 대응되는 일변수 함수였습니다.
하지만 현실의 데이터는 온도, 습도, 풍속이 모여 날씨를 결정하듯 여러 입력값이 하나의 결과를 만들어내는 다변수 함수 형태를 띱니다.
인공지능 모델 역시 수많은 가중치(w)와 편향(b)이 입력되어 최종 오차(Loss)를 계산하는 거대한 다변수 함수입니다.
이처럼 입력 변수가 늘어나면 함수는 단순한 선이 아니라 복잡한 곡면이나 초곡면(Hypersurface)의 형태를 갖게 됩니다.
이 복잡한 지형에서 우리가 원하는 최적의 방향을 찾기 위해서는 각 변수 하나하나가 결과에 어떤 영향을 주는지 파악하는 것이 급선무입니다.
변수를 분리하여 관찰하는 편미분의 수학적 원리
편미분은 여러 변수 중 단 하나만을 변수로 취급하고, 나머지는 모두 상수(숫자)로 고정한 채 미분하는 기법입니다.
예를 들어 f(x, y)를 x에 대해 편미분한다는 것은, y의 위치를 고정시킨 채 x축 방향으로만 움직일 때의 기울기를 보겠다는 의미입니다.
수학적으로는 기호 ∂(라운드 디)를 사용하여 표현하며, 이를 통해 다차원 함수의 변화량을 축별로 쪼개어 분석할 수 있습니다.
개별 편미분 값들을 모으면 지난 글에서 다룬 그레디언트(Gradient) 벡터가 되며, 이것이 곧 인공지능이 나아갈 최적의 방향타가 됩니다.
라이프니츠 dy/dx 표기법이 가진 직관적 강점
뉴턴의 미분 표기법이 속도와 시간에 최적화되어 있다면, 라이프니츠의 표기법(dy/dx)은 연산의 논리적 흐름에 최적화되어 있습니다.
라이프니츠는 미분을 아주 작은 변화량(dy)과(dx)의 비율로 보았습니다.
이 분수 형태의 표기법은 단순히 기호를 넘어, 실제로 분수처럼 약분하거나 곱하는 식의 조작이 가능하다는 놀라운 특징을 가집니다.
덕분에 복잡한 합성 함수의 미분이나 매개변수 함수의 미분에서도 계산의 방향성을 잃지 않게 도와줍니다.
현대 딥러닝 라이브러리들이 내부적으로 연산 그래프를 그릴 때 라이프니츠의 철학을 따르는 이유가 바로 여기에 있습니다.
연쇄법칙(Chain Rule)과 라이프니츠 기호의 결합
인공지능 신경망은 여러 층(Layer)이 겹겹이 쌓인 구조이므로, 입력이 출력이 되기까지 수많은 함수를 거칩니다.
이때 최종 오차가 첫 번째 층의 가중치에 어떤 영향을 받는지 계산하려면 '연쇄법칙'이 필수적입니다.
라이프니츠 표기법을 사용하면 중간 매개체가 분수식에서 약분되는 것처럼 보여, 수식의 정당성을 직관적으로 확인할 수 있습니다.
이 직관성은 개발자가 수천 층의 신경망 오차를 전파할 때 논리적 오류를 범하지 않도록 막아주는 강력한 방어선이 됩니다.
딥러닝 역전파에서 발휘되는 미분 기호의 힘
실제 인공지능의 역전파(Backpropagation) 알고리즘은 이 연쇄법칙의 반복적인 적용에 불과합니다.
각 층에서 발생한 기울기 정보를 라이프니츠 식으로 연결하여 앞쪽 층으로 전달하는 과정입니다.
아래 표는 표기법에 따른 미분의 해석 차이를 정리한 내용입니다.
| 특징 | 라이프니츠 표기법 (dy/dx) | 뉴턴 표기법 (y') |
|---|---|---|
| 형태 | 분수 형태 (변화량의 비율) | 프라임 형태 (함수의 변화) |
| 변수 명시 | 어떤 변수로 미분하는지 명확함 | 생략되는 경우가 많아 모호함 |
| 연산 편의성 | 연쇄법칙 적용 시 매우 직관적 | 계산 과정 추적이 상대적으로 어려움 |
| 주요 활용 | 다변수 미분, 딥러닝, 공학 전반 | 물리학, 고전 역학, 시간 미분 |
기호 속에 담긴 논리적 연결의 중요성
우리가 라이프니츠의 미분 기호를 사용하는 것은 단순히 전통을 따르는 것이 아닙니다.
복잡한 세상을 단순한 기호의 관계로 정의하고, 이를 통해 인공지능과 같은 거대한 시스템을 설계하기 위함입니다.
다변수 함수와 편미분을 이해하는 것은 데이터들 사이의 보이지 않는 연결고리를 읽어내는 눈을 갖는 것과 같습니다.
지금까지 다변수 함수와 편미분, 그리고 라이프니츠 표기법이 복잡한 계산을 해결하는 원리를 알아보았습니다.
복잡한 기호 이면에는 변화를 쪼개어 분석하고 다시 연결하려는 거대한 논리적 흐름이 숨어 있습니다.
오늘 학습한 이 기호의 마법이 여러분의 데이터 분석과 인공지능 학습의 길을 더욱 선명하게 밝혀주길 바랍니다.