29가지 통계 개념 - 절대 오차와 평균 절대 오차(MAE)

절대 오차와 평균 절대 오차에 대해서 알아보자.

절대 오차(Absolute Error)란 무엇인가?

절대 오차(Absolute Error)는 측정값에서 오차의 크기를 말한다. 이는 측정값과 “실제값” 과의 차이이다. 예를 들어, 체중계 90 lbs 를 가리키고 있지만 본인의 몸무게가 89 lbs 임을 알고 있다면, 그 체중계는 90 lbs - 89 lbs = 1 lb 의 절대 오차가 있는 것이다.

이는 그 체중계가 여러분이 측정하고자 하는 값을 정확하게 측정하지 못함으로써 발생한다. 여러분의 체중계는 소숫점 첫째 자리에서 반올림을 해서 보여주는 것일 지도 모른다. 만약 본인의 몸무게가 89.6 lbs 라면 체중계는 “반올림을 해서” 90 lbs 를 보여줄 것이다. 이런 경우라면 절대 오차는 90 lbs - 89.6 lbs = 0.4 lbs 가 된다.

수식

절대 오차($\Delta x$) 는 다음과 같이 구할 수 있다:

\[\Delta x = x_i - x\]
  • $x_i$ 는 측정값이고,
  • $x$ 는 실제값이다.

첫 번째로 예를 든 몸무게를 가지고 절대 오차를 구하는 공식에 대입해서 값을 구하면 동일한 결과를 얻을 것이다:

$\Delta x = $ 90 lbs - 89 lbs = 1 lb

가끔은 이 공식을 절댓값을 나타내는 기호( | | )로 표기하는 경우도 있다. 이러한 방법은 다양한 측정값들을 다루는 경우에 종종 볼 수 있다:

\[\Delta x = |x_i - x|\]

절대값이 필요한 이유는 가끔 측정값이 더 작아서 오차의 값이 음수인 경우가 발생할 수 있기 때문이다. 예를 들자면, 체중계는 89 lbs 라고 했지만 실제 몸무게가 95 lbs 라면 그 차이는 89 lbs - 95 lbs = -5 lbs 가 된다. 이 값 하나만 있는 경우라면 아무런 문제가 없겠지만, 음수와 양수가 섞인 여러 값을 더하는 경우에는 문제가 발생한다. 일례로, 다음과 같은 값이 있다고 하자:

  • 89 lbs - 95 lbs = -6 lbs
  • 98 lbs - 92 lbs = 6 lbs

두 측정값은 모두 절대 오차가 6 lbs 이다. 이 둘을 더하는 경우에는 총 12 lbs 의 오차를 얻어야 마땅하겠지만, 음수 부호 때문에 실제로 얻는 값은 -6 lbs + 6 lbs = 0 lbs이다. 상당히 큰 오차가 있었는데 그 오차가 사라진 것이다. 우리는 이 문제를 각 결과에 절댓값을 취해서 더함으로써 해결할 수 있다:

|-6 lbs| + |6 lbs| = 12 lbs

절대 정확도 오차 (Absolute Accuracy Error)

절대 오차는 절대 정확도 오차 라고도 부른다. 아마 아래처럼 표기된 공식을 보기도 할 것이다:

\[E = x_{experimental} - x_{true}\]

공식은 완전히 같지만 이름만 조금 달라졌다. “$x_{experimental}$” 은 측정값이고, “$x_{true}$” 는 실젯값이다.

평균 절대 오차 (Mean Absolute Error)

평균 절대 오차(MAE) 는 모든 절대 오차의 평균이다. 공식은 다음과 같다:

\[MAE = \frac{1}{n} \sum_{i = 1}^n |x_i - x |\]
  • n = 오차의 갯수
  • $\sum$ = 합을 나타내는 기호
  • $|x_i - x|$ = 절대 오차

이 공식이 조금 무서워 보일 수는 있지만, 각 단계는 쉽다:

  1. 각 측정값과 실제값 사이의 절대 오차를 모두 구하라
  2. 구한 절대 오차들을 모두 더하라
  3. 이를 절대 오차의 갯수로 나눠라. 측정값이 10개라면 10으로 나누면 된다.

절대 정밀 오차 (Absolute Precision Error)

절대 정밀 오차는 전혀 다른 것이다. 이는 아래의 공식으로 구할 수 있는데, 측정값들의 표준 편차이다.

$s = \sqrt{\frac{\sum(x_i - \bar{x})^2}{N - 1}}$

  • $\sum$ = 합을 나타내는 기호
  • $x_i$ = $i$ 번째 값
  • $\bar{x}$ = 표본 평균
  • N = 표본의 크기

출처:

Absolute Error & Mean Absolute Error (MAE)

2020

사내 스터디에 대한 회고

1 minute read

회사 서비스의 추천 시스템을 개선하기 위해 팀 내에서 (아직까진 두 명이긴 하지만) 지난 두 달 동안 스터디를 진행했습니다. 얼마 전 두 번째 스터디가 끝났고 이에 대한 회고를 해보려고 합니다.

Back to top ↑

2019

GitHub 블로그에 Jupyter notebook 올리는 방법

3 minute read

여러분의 GitHub 블로그에 Jupyter notebook 을 바꿔서 올릴 수 있도록 도와줄 글이다. 직접 바꾸는 방법은 1회성 글들을 위해서 추가했고, 변환 과정과 파일 이동, 그리고 여러분의 블로그에 올리는 것까지 한 번에 할 수 있는 자동화 bash 를 만드는 자세한 방법...

Back to top ↑

less than 1 minute read

1 minute read

Back to top ↑