.section __TEXT,__text,regular,pure_instructions .build_version macos, 11, 0 sdk_version 11, 3 .globl __Z13Mat4x4MulF32_PfPKfS1_ ; -- Begin function _Z13Mat4x4MulF32_PfPKfS1_ .p2align 2 __Z13Mat4x4MulF32_PfPKfS1_: ; @_Z13Mat4x4MulF32_PfPKfS1_ .cfi_startproc ; %bb.0: ; InlineAsm Start ld1.4s { v0, v1, v2, v3 }, [x1] ; m_src1 ld1.4s { v4, v5, v6, v7 }, [x2] ; m_src2 ; Row 0 fmul.4s v16, v4, v0[0] ; v16 = v4 * v0.lane0 fmla.4s v16, v5, v0[1] ; v16 += v5 * v0.lane1 fmla.4s v16, v6, v0[2] ; v16 += v6 * v0.lane2 fmla.4s v16, v7, v0[3] ; v16 += v6 * v0.lane3 st1.4s { v16 }, [x0], #16 ; Row 1 fmul.4s v17, v4, v1[0] ; v17 = v4 * v1.lane0 fmla.4s v17, v5, v1[1] ; v17 += v5 * v1.lane1 fmla.4s v17, v6, v1[2] ; v17 += v6 * v1.lane2 fmla.4s v17, v7, v1[3] ; v17 += v6 * v1.lane3 st1.4s { v17 }, [x0], #16 ; Row 2 fmul.4s v18, v4, v2[0] ; v18 = v4 * v2.lane0 fmla.4s v18, v5, v2[1] ; v18 += v5 * v2.lane1 fmla.4s v18, v6, v2[2] ; v18 += v6 * v2.lane2 fmla.4s v18, v7, v2[3] ; v18 += v6 * v2.lane3 st1.4s { v18 }, [x0], #16 ; Row 3 fmul.4s v19, v4, v3[0] ; v19 = v4 * v3.lane0 fmla.4s v19, v5, v3[1] ; v19 += v5 * v3.lane1 fmla.4s v19, v6, v3[2] ; v19 += v6 * v3.lane2 fmla.4s v19, v7, v3[3] ; v19 += v6 * v3.lane3 st1.4s { v19 }, [x0], #16 ; InlineAsm End ret .cfi_endproc ; -- End function .subsections_via_symbols