선형대수학 기본 용어 -초보자편 1-

1. matrix 정의

 

1-1) 위키피디아에서는 행렬을 행과 열에 수나 기호 수식 등을 나열한 직사각형의 배열이라고 정의하고 있습니다.

 

예를 들어 $\begin{pmatrix}
1 &  9& -13\\
20 &  5& 16
\end{pmatrix}$

 

1-2) m개의 행과 n개의 열을 가지는 행렬 A는 수학적으로 $A  _{mn} = \left \{ a  _{ij} \right \}$라고 표현합니다.

 

여기서 $a  _{ij}$는 행렬 A의 $i$번째 행에 있고 동시에 $j$번째 열에 위치하는 원소를 의미합니다.

 

명백하게 행과 열의 수를 알 수 있다면 $A = \left \{ a  _{ij} \right \}$으로 행,열의 수를 생략하기도 합니다.

 

$a  _{ij} $는 간혹 $A[i,j]$나 $A  _{i,j}$등등으로 표현하는 사람도 있습니다.

 

예를 들어 $A=\begin{pmatrix}
1 &  9& -13\\
20 &  5& 16
\end{pmatrix}$이면 1번째 행에 있고 동시에 3번째 열에 위치한 원소
$a  _{13} =-13$입니다.

 

1-3) m=1인 경우, 즉 행이 1개인 행렬은 행벡터(row vector)라고 부르고 n=1인 경우, 즉 열이 1개인 행렬은 열벡터(column vector)라고 부릅니다.

 

보통 벡터는 소문자, 행렬은 대문자로 표현하며 열벡터를 기준 벡터로 삼습니다.

 

무슨 말이냐면 $a=\begin{pmatrix}
1\\ 
2\\ 
3
\end{pmatrix}$
이라고 표현하면 보통은 행벡터는 transpose표시를 붙여서

$b^T=\begin{pmatrix}
2 & 4 & 7
\end{pmatrix}$으로 씁니다.

 

왜냐하면 dot product가 행벡터와 열벡터의 곱인 $a^Tb=\begin{pmatrix}
1 & 2 & 3
\end{pmatrix}\begin{pmatrix}
2\\ 
4\\ 
7
\end{pmatrix}$
로 표현해서 그렇습니다.

 

 

2. 행렬의 분할

 

행렬은 행벡터와 열벡터로 분할해서 사용할 수 있습니다.

 

직관적으로 생각하면 매우 당연하며 파이썬의 리스트에 리스트가 들어가있으면 그 리스트를 변수로 축약해서 사용할 수 있다는 점을 생각하면 좋을 것 같습니다.

 

예를 들어볼게요. $n\times d$행렬 $ X $는 다음과 같이 쓸 수 있을 것입니다.

 

그림1. 행렬 X의 모습

 

열벡터 $x_{1}=\begin{pmatrix}x_{11}\\ 
x_{21}\\ 
\cdot \cdot \cdot \\ 
x_{n1}
\end{pmatrix}$ ,
$x_{2}=\begin{pmatrix}x_{12}\\ 
x_{22}\\ 
\cdot \cdot \cdot \\ 
x_{n2}
\end{pmatrix}$, ....... , $x_{k}=\begin{pmatrix}x_{1k}\\ 
x_{2k}\\ 
\cdot \cdot \cdot \\ 
x_{nk}
\end{pmatrix}$, ....... , $x_{d}=\begin{pmatrix}x_{1d}\\ 
x_{2d}\\ 
\cdot \cdot \cdot \\ 
x_{nd}
\end{pmatrix}$

 

로 마치 파이썬의 튜플을 하나의 변수에 넣는다고 생각하는 것처럼 생각해봅시다.

 

그렇다면 행렬 X는 아래와 같이 아주 간단하게 표현할 수 있습니다.  

 

그림2. 행렬 X를 열로 분할

파란색으로 동그라미 친 열에 집중해보면

 

$$ X=(x  _{1} ,x  _{2} ,x  _{3} , \cdots ,x  _{d} )$$

 

그런데 더 재미있는 점은 원래 행렬 Xn*d 행렬이지만 위와 같이 간단하게 표현하면 1*n 행렬로 생각할 수도 있다는 점입니다. 이것은 행렬 연산에서 연산을 간단하게 해줄 것입니다.

 

비슷하게 행벡터로 분할 할 수도 있는데

 

$x  _{1} ^{T} =(x  _{11} ,x  _{12} ,x  _{13} , \cdots  ,x  _{1d} )$ , $x  _{2} ^{T}=(x  _{21} ,x  _{22} ,x  _{23} , \cdots ,x  _{2d} )$, .... , $x  _{k} ^{T} =(x  _{k1} ,x  _{k2} ,x  _{k3} , \cdots ,x  _{kd} )$, .... , $x  _{n} ^{T}=(x  _{n1} ,x  _{n2} ,x  _{n3} , \cdots ,x  _{nd} )$ 이라고 하면,

 

$$X = \begin{pmatrix}
x_{1}^{T}\\ 
x_{2}^{T}\\ 
\vdots\\ 
x_{k}^{T}\\ 
\vdots\\ 
x_{n}^{T}
\end{pmatrix}$$

 

심지어 이 행렬은 n*1 행렬로도 생각할 수 있게 됩니다

 

3. 행렬의 기하학적 의미

 

3-1) 행렬은 데이터를 다루는 도구의 의미를 가집니다. 예를 들어 좌표평면 위에 존재하는 많은 점들을 하나의 행렬로 나타낼 수 있습니다.

 

그림3. 좌표평면 위의 3개의 점을 행렬로 나타냄

 

3-2) 모든 선형변환(linear transformation)은 모든 원소가 실수인 하나의 어떤 행렬로 나타낼 수 있습니다.

 

linear transformation은 수학적으로 다음과 같이 정의합니다.

 

vector space VW에 대하여 mapping $f:V -> W$linear mapping이려면

임의의 두 벡터 $u,v \in V$와 임의의 scalar c가 다음을 모두 만족시킨다

 

$$f(u+v)=f(u)+f(v)$$

$$f(cu)=cf(u)$$

 

이 정의로부터 모든 원소가 실수인 $m \times n$ 행렬 A는 $R  ^{n}$이라는 벡터 공간에 속하는 $n \times 1$ 열벡터 $x \in R  ^{n}$을 $R  ^{m}$의 벡터 공간으로 mapping시킵니다. 즉 $Ax$는 $R  ^{m}$에 속하는 $m \times 1$ 열벡터가 됩니다.

 

이 과정에서 행렬 A가 왜 linear transformation이 되냐면 임의의 $x,y \in R  ^{n}$에 대하여 $f(x)=Ax$라고 하면 $f(x+y)=A(x+y)=Ax+Ay$이고 $f(cx)=A(cx)=cAx$를 모두 만족시키기 때문입니다.

TAGS.

Comments