20xx年5月10日@实验室lsi、矩阵分解、cuda技术gt内容摘要:
为:一个正交矩阵和一个上三角矩阵 3. LU分解 —— 拆解为:一个上三角矩阵和一个下三角矩阵 4. Cholesky分解 —— (?) 5. NMF分解 —— 拆解为:两个非负矩阵 6.。 我的问题: 是不是存在某种分解是基于另一种分解的。 比如先拆成两个矩阵,再把其中某个再拆解。 或者 .. Note: • 区分矩阵元素的正负 • 近似解 9 我的理解 2 我目前遇到的应用: • 图像降维重构 (?) • 数据挖掘算法:聚类 kmeans • 文本挖掘 • 社会网络分析 10 矩阵分解的具体算法 还没有学习。 海洋和远帅希望能做补充。 比如对稀疏( sparse)和密集( dense)矩阵不同的算法。 11 我的工作 矩阵分解 amp。 并行计算 —— 概况 • 常用的线性代数数学库 • 基于多核多处理器以及机群的数学库 • 基于 GPU并行加速的解决方案 12 常用的线性代数数学库 BLAS—— Basic Linear Algebra Subprograms(Fortran) 一个最基础的库,其他软件在对它进行优化 ATLAS—— Automatically Tuned Linear Algebra Software(C and Fortran) 对 BALS加强,提供更加灵活的接口 LAPACK—— Linear Algebra PACKage(C and Fortran) 对 BLAS进行封装,提供专门对矩阵的处理接口 比如: matrix factorizations (LU, Cholesky, QR, SVD, Schur, generalized Schur) 缺点:慢,调用难 CUBLAS—— NVIDIA CUDA Basic Linear Algebra Subroutines CUDA版本 的基础线性代数库 13 基于多核多处理器以及机群的数学库 基本上是根据硬件对 BLAS的进行定制: • MKL—— Intel174。 Math Kerne。20xx年5月10日@实验室lsi、矩阵分解、cuda技术gt
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。
用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。