浅谈矩阵的一些形式论文定稿版(16)
时间:2025-04-05
时间:2025-04-05
毕业论文
应用4.5 矩阵还可以应用于分类.分类的关键是计算相关性.我们首先对两个文本计算出它们的内容词,或者说实词的向量,然后求这两个向量的夹角.当这两个向量夹角为零时,新闻就相关;当它们垂直或者说正交时,新闻则无关.当然,夹角的余弦等同于向量的内积.从理论上讲,这种算法非常好.但是计算时间特别长.通常,我们要处理的文章的数量都很大,至少在百万篇以上,二次回标又非常长,比如说有五十万个词(包括人名地名产品名称等等.如果想通过对一百万篇文章两篇两篇地成对比较,来找出所有共同主题的文章,就要比较五千亿对文章.现在的计算机一秒钟最多可以比较一千对文章,完成这一百万篇文章相关性比较就需要十五年时间.注意,要真正完成文章的分类还要反复重复上述计算.在文本分类中,另一种办法是利用矩阵运算中的奇异值分解.现在让我们来看看奇异值分解是怎么回事.首先,我们可以用一个大矩阵A来描述这一百万篇文章和五十万词的关联性.这个矩阵中,每一行对应一篇文 章,每一列对应一个词.奇异值分解就是把上面这样一个大矩阵,分解成三个小矩阵相乘,如下图所示.比如把上面的例子中的矩阵分解成一个一百万乘以一百的矩阵X,一个一百乘以一百的矩阵B,和一个一百乘以五十万的矩阵Y.这三个矩阵的元素总数加起来也不过1.5亿,仅仅是原来的三千分之一.相应的存储量和计算量都会小三个数量级以上. 上述仅仅是矩阵巨大应用价值中的几个典范例子,现在我们直观的感受下矩阵的应用实例:
应用4.6人口流动问题(矩阵高次幂的应用)
设某中小城市及郊区乡镇共有30万人从事农、工、商工作,假定这个总人数在若干年内保持不变,而社会调查表明:
(1) 在这30万就业人员中,目前约有15万人从事农业,9万人从事工业,6万
人经商;
(2) 在务农人员中,每年约有20%改为务工,10%改为经商; (3) 在务工人员中,每年约有20%改为务农,10%改为经商; (4) 在经商人员中,每年约有10%改为务农,10%改为务工.
现欲预测一、二年后从事各业人员的人数,以及经过多年之后,从事各业人员总数之发展趋势. 现做如下解答:
解 若用三维向量(xi,yi,zi)T 表示第i年后从事这三种职业的人员总数,则已知(x0,y0,z0)T=(15,9,6)T.而欲求(x1,y1,z1)T,(x2,y2,z2)T 并考察在n→∞时(xn,yn,zn)T的发展趋势.