Processing math: 100%
 

선형대수학 기본 용어 -초보자편 1-

1. matrix 정의

 

1-1) 위키피디아에서는 행렬을 행과 열에 수나 기호 수식 등을 나열한 직사각형의 배열이라고 정의하고 있습니다.

 

예를 들어 (191320516)

 

1-2) m개의 행과 n개의 열을 가지는 행렬 A는 수학적으로 Amn={aij}라고 표현합니다.

 

여기서 aij는 행렬 Ai번째 행에 있고 동시에 j번째 열에 위치하는 원소를 의미합니다.

 

명백하게 행과 열의 수를 알 수 있다면 A={aij}으로 행,열의 수를 생략하기도 합니다.

 

aij는 간혹 A[i,j]Ai,j등등으로 표현하는 사람도 있습니다.

 

예를 들어 A=(191320516)이면 1번째 행에 있고 동시에 3번째 열에 위치한 원소 a13=13입니다.

 

1-3) m=1인 경우, 즉 행이 1개인 행렬은 행벡터(row vector)라고 부르고 n=1인 경우, 즉 열이 1개인 행렬은 열벡터(column vector)라고 부릅니다.

 

보통 벡터는 소문자, 행렬은 대문자로 표현하며 열벡터를 기준 벡터로 삼습니다.

 

무슨 말이냐면 a=(123)이라고 표현하면 보통은 행벡터는 transpose표시를 붙여서

bT=(247)으로 씁니다.

 

왜냐하면 dot product가 행벡터와 열벡터의 곱인 aTb=(123)(247)로 표현해서 그렇습니다.

 

 

2. 행렬의 분할

 

행렬은 행벡터와 열벡터로 분할해서 사용할 수 있습니다.

 

직관적으로 생각하면 매우 당연하며 파이썬의 리스트에 리스트가 들어가있으면 그 리스트를 변수로 축약해서 사용할 수 있다는 점을 생각하면 좋을 것 같습니다.

 

예를 들어볼게요. n×d행렬 X는 다음과 같이 쓸 수 있을 것입니다.

 

제목 없음.jpg
그림1. 행렬 X의 모습

 

열벡터 x1=(x11x21xn1) , x2=(x12x22xn2), ....... , xk=(x1kx2kxnk), ....... , xd=(x1dx2dxnd)

 

로 마치 파이썬의 튜플을 하나의 변수에 넣는다고 생각하는 것처럼 생각해봅시다.

 

그렇다면 행렬 X는 아래와 같이 아주 간단하게 표현할 수 있습니다.  

 

noname01.bmp
그림2. 행렬 X를 열로 분할

파란색으로 동그라미 친 열에 집중해보면

 

X=(x1,x2,x3,,xd)

 

그런데 더 재미있는 점은 원래 행렬 Xn*d 행렬이지만 위와 같이 간단하게 표현하면 1*n 행렬로 생각할 수도 있다는 점입니다. 이것은 행렬 연산에서 연산을 간단하게 해줄 것입니다.

 

비슷하게 행벡터로 분할 할 수도 있는데

 

xT1=(x11,x12,x13,,x1d) , xT2=(x21,x22,x23,,x2d), .... , xTk=(xk1,xk2,xk3,,xkd), .... , xTn=(xn1,xn2,xn3,,xnd) 이라고 하면,

 

X=(xT1xT2xTkxTn)

 

심지어 이 행렬은 n*1 행렬로도 생각할 수 있게 됩니다

 

3. 행렬의 기하학적 의미

 

3-1) 행렬은 데이터를 다루는 도구의 의미를 가집니다. 예를 들어 좌표평면 위에 존재하는 많은 점들을 하나의 행렬로 나타낼 수 있습니다.

 

noname01.bmp
그림3. 좌표평면 위의 3개의 점을 행렬로 나타냄

 

3-2) 모든 선형변환(linear transformation)은 모든 원소가 실수인 하나의 어떤 행렬로 나타낼 수 있습니다.

 

linear transformation은 수학적으로 다음과 같이 정의합니다.

 

vector space VW에 대하여 mapping f:V>Wlinear mapping이려면

임의의 두 벡터 u,vV임의의 scalar c가 다음을 모두 만족시킨다

 

f(u+v)=f(u)+f(v)

f(cu)=cf(u)

 

이 정의로부터 모든 원소가 실수인 m×n 행렬 ARn이라는 벡터 공간에 속하는 n×1 열벡터 xRnRm의 벡터 공간으로 mapping시킵니다. AxRm에 속하는 m×1 열벡터가 됩니다.

 

이 과정에서 행렬 A가 왜 linear transformation이 되냐면 임의의 x,yRn에 대하여 f(x)=Ax라고 하면 f(x+y)=A(x+y)=Ax+Ay이고 f(cx)=A(cx)=cAx를 모두 만족시키기 때문입니다.

728x90