대각합(Trace)
•
행렬의 대각합(trace)는 정사각행렬 에서만 정의 가능하다.
•
행렬 의 대각합(trace)는 모든 대각성분의 합이고 로 표기한다.
•
대각합은 다음의 속성을 갖는다. 여기서 는 정사각 행렬이고 는 스칼라이다.
◦
마지막의 는 행렬 의 고유값을 의미한다. 행렬의 trace는 고윳값들의 합과 같다.
•
정사각 행렬 에 대해 다음이 성립하는데, 이것을 순환 순열 속성(cyclic permutation property)라 한다.
•
이를 이용하여 스칼라 내적 을 작성해서 trace trick을 유도할 수 있다. —벡터는 열 혹은 행이 인 행렬로 볼 수 있다.
•
때로 행렬 을 추정하는 것은 매우 비쌀 수 있다. 그러나 행렬-벡터 곱 를 추정하는 것은 저렴할 수 있다. 이 경우 는 인 확률 벡터로 가정한다. 그러면 다음의 항등식(identity)을 사용하여 몬테 카를로 근사를 에 만들 수 있다. 이것을 Hutchinson trace estimator라고 부른다.
행렬 노름(matrix norm)
•
행렬의 노름은 여러 형태로 정의가 가능한데, 널리 쓰이는 것은 제곱을 제곱근을 구하는 것이나 —이것은 frobenius 형식이다— 열이나 행에 대해 절대값의 합 중 최대값을 사용하는 방법 등이 있다. 아래는 행렬 노름에 대한 몇 가지 예시이다.
•
행렬 의 노름을 어떤 단위 노름(unit norm) 입력을 늘릴 수 있는 최대량으로 정의할 수 있다.
•
인 경우 다음과 같다.
◦
여기서 은 의 가장 큰 고유값(eigenvalue)이고, 는 번째 특이값(singular value)이다.
•
Trace 노름은 다음과 같이 정의된다.
•
여기서 는 행렬 제곱근이다. 특이값이 항상 음이 아니기 때문에 다음을 갖는다.
•
이를 regularizer로 사용하여 많은 특이값들을 0으로 만들 수 있고, low rank 행렬을 만들 수 있다.
•
더 일반적으로 Schatten p-norm을 다음처럼 정의한다.
•
만일 행렬을 벡터로 생각하면 행렬 노름을 벡터 노름의 측면에서 정의할 수 있다. .
◦
만일 벡터 노름이 2-노름이면, 이에 해당하는 행렬 노름은 Frobenius 노름이 된다.
•
만일 가 평가하기 비싼데, 는 (확률 벡터 에 대해) 저렴하다면, 다음과 같이 Hutchinson 추적 추정기를 사용하여 Frobenius 노름에 확률적 근사(stochastic approximation)을 생성 할 수 있다.
◦
아래 식에서
조건수(Condition numbers)
•
행렬 의 조건 수(condition number)는 를 포함한 모든 계산이 수치적으로 얼마나 안정적인지를 나타내는 척도이다. 다음과 같이 정의된다.
◦
여기서 는 행렬의 노름이다.
•
임을 보일 수 있다.(조건 수는 사용하는 노름에 의존한다. 달리 명시하지 않는한 노름을 가정한다.)
◦
이 작은 경우(1에 가까운) 조건이 양호하다고(well-conditioned) 말한다.
◦
이 크면 조건이 나쁘다고(ill-conditioned) 한다.
◦
큰 조건수의 의미는 가 특이(singular)라는 뜻이다.
•
이는 행렬식의 크기보다 특이점에 대한 근접성(nearness)를 더 잘 측정한다.
참조
•