OpenCV 4.11.0
开源计算机视觉库
|
该函数执行类似于 BLAS 3 级 gemm 函数的广义矩阵乘法:\(D = \alpha*AB+\beta*C\)
src1 | 指向以行主序存储的输入 \(M\times N\) 矩阵 \(A\) 或 \(A^T\) 的指针。 |
src1_step | 矩阵 \(A\) 或 \(A^T\) 两行之间的数据字节数。 |
src2 | 指向以行主序存储的输入 \(N\times K\) 矩阵 \(B\) 或 \(B^T\) 的指针。 |
src2_step | 矩阵 \(B\) 或 \(B^T\) 两行之间的数据字节数。 |
alpha | \(AB\) 之前的 \(\alpha\) 倍数 |
src3 | 指向以行主序存储的输入 \(M\times K\) 矩阵 \(C\) 或 \(C^T\) 的指针。 |
src3_step | 矩阵 \(C\) 或 \(C^T\) 两行之间的数据字节数。 |
beta | \(C\) 之前的 \(\beta\) 倍数 |
dst | 指向以行主序存储的输出 \(M\times K\) 矩阵 \(D\) 的指针。 |
dst_step | 矩阵 \(D\) 两行之间的数据字节数。 |
m | 矩阵 \(A\) 或 \(A^T\) 的行数,等于矩阵 \(D\) 的行数 |
n | 矩阵 \(A\) 或 \(A^T\) 的列数 |
k | 矩阵 \(B\) 或 \(B^T\) 的列数,等于矩阵 \(D\) 的列数 |
flags | 算法选项 (CV_HAL_GEMM_1_T,… 的组合)。 |
函数 | |
int | hal_ni_gemm32f (const float *src1, size_t src1_step, const float *src2, size_t src2_step, float alpha, const float *src3, size_t src3_step, float beta, float *dst, size_t dst_step, int m, int n, int k, int flags) |
int | hal_ni_gemm32fc (const float *src1, size_t src1_step, const float *src2, size_t src2_step, float alpha, const float *src3, size_t src3_step, float beta, float *dst, size_t dst_step, int m, int n, int k, int flags) |
int | hal_ni_gemm64f (const double *src1, size_t src1_step, const double *src2, size_t src2_step, double alpha, const double *src3, size_t src3_step, double beta, double *dst, size_t dst_step, int m, int n, int k, int flags) |
int | hal_ni_gemm64fc (const double *src1, size_t src1_step, const double *src2, size_t src2_step, double alpha, const double *src3, size_t src3_step, double beta, double *dst, size_t dst_step, int m, int n, int k, int flags) |
|
内联 |
#include <core/src/hal_replacement.hpp>
|
内联 |
#include <core/src/hal_replacement.hpp>
|
内联 |
#include <core/src/hal_replacement.hpp>
|
内联 |
#include <core/src/hal_replacement.hpp>