矩阵乘法为什么定义为行乘以列？,矩阵,矩阵乘法-大学生社区-赛氪竞赛网-全国大学生比赛信息网，高含金量竞赛、权威竞赛都在赛氪

学线性代数的时候，听着懵懵的，一上来老师就开始讲逆序数、行列式，周围的小伙伴们都在记定理，背公式。后来经常逛博客，逐渐了解了线性代数中的一些定理的意义，上中科院李老师矩阵论时，李老师又深刻讲了一遍，下面是李老师的总结，分享给大家。

对于矩阵，我们今天简单说一下矩阵的乘法。设两个矩阵\({{\bf{A}}_{m \times p}} = [{a_{ij}}]\)，\({{\bf{B}}_{p \times n}} = [{b_{ij}}]\)，定义矩阵\({\bf{C}} = {\bf{AB}}\)为矩阵\({\bf{A}}\)和\({\bf{B}}\)的乘积，其中

\({{\bf{C}}_{m \times n}} = \left[ {{c_{ij}} = \sum\limits_{k = 1}^p {{a_{ik}}{b_{kj}}} } \right]\).

也就是说，矩阵\({\bf{C}}\)中每一个元素\({c_{ij}}\)为矩阵\({\bf{A}}\)的第i行与矩阵\({\bf{B}}\)的第j列相乘得到。这就是矩阵乘法的定义，在学习线性代数的时候，老师就是这么教的，而且大家也就这么习以为常，估计至今为止也没有人对这个定义有一点点的疑问。我的问题很简单，为什么矩阵乘法的定义是这样，而不是类似矩阵加法（对应元素相加）一样，矩阵的乘法定义为两个矩阵对应元素相乘？

相信每一个人被问到这个问题，都会说：“是啊，为什么？”那么下面我们就来说明一下为什么这样定义矩阵的乘法。

1855年，英国数学家Arthur Cayley (1821-1895) 把矩阵从行列式理论剥离出来，讨论了矩阵的相关运算，创立了矩阵理论。Cayley最早讨论矩阵相关运算是从线性函数开始的（矩阵和线性函数在某种意义上，可以一一对应的），比如下面两个线性函数：

\(f(x) = f\left( {\matrix{ {{x_1}} \cr {{x_2}} \cr } } \right) = \left( {\matrix{ {a{x_1} + b{x_2}} \cr {c{x_1} + d{x_2}} \cr } } \right)\),

\(g(x) = g\left( {\matrix{ {{x_1}} \cr {{x_2}} \cr } } \right) = \left( {\matrix{ {A{x_1} + B{x_2}} \cr {C{x_1} + D{x_2}} \cr } } \right)\).

复合这两个函数会得到

\(h(x) = f\left( {g\left( x \right)} \right) = f\left( {\matrix{ {A{x_1} + B{x_2}} \cr {C{x_1} + D{x_2}} \cr } } \right) = \left( {\matrix{ {(aA + bC){x_1} + (aB + bD){x_2}} \cr {(cA + dC){x_1} + (cB + dD){x_2}} \cr } } \right)\).

Cayley最早的想法是用矩阵表示这样的线性函数，即函数\(f,g,h\)可以分别表示为如下的矩阵形式：

\({\bf{F}} = \left( {\matrix{ a & b \cr c & d \cr } } \right),{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\bf{G}} = \left( {\matrix{ A & B \cr C & D \cr } } \right),{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\bf{H}} = \left( {\matrix{ {aA + bC} & {aB + bD} \cr {cA + dC} & {cB + dD} \cr } } \right)\).

当然了，矩阵\({\bf{H}}\)也被成为矩阵\({\bf{F}}\)和矩阵\({\bf{G}}\)的复合（或乘积），即：

\(\left( {\matrix{ a & b \cr c & d \cr } } \right)\left( {\matrix{ A & B \cr C & D \cr } } \right) = \left( {\matrix{ {aA + bC} & {aB + bD} \cr {cA + dC} & {cB + dD} \cr } } \right)\)，

这也正是我们现在熟知的矩阵乘积的定义。并且由于和线性函数的对应关系，使得这种定义更加实用。

相信，如果我们每一个人生活在19世纪——矩阵出现的时代，让你定义矩阵的乘法，你很自然地会想到用两个矩阵对应元素相乘来定义矩阵的乘法，毕竟这个是最自然、最直接的想法。但是它并不是最实用的。

大学的课程是不是很有意思呢？

问答详情

矩阵乘法为什么定义为行乘以列？

全部回答（0）