Assembleur 80x86 | VP4DPWSSDS |
---|---|
INTEL AVX-512 | Dot Product of Signed Words with Dword Accumulation and Saturation |
Syntaxe
VP4DPWSSDS zmm1{k1}{z}, zmm2+3, m128 |
Description
Cette instruction permet de calculer 4 bloc source de registres séquentiel de deux opérandes de mot entier avec un accumulateur en double mot et une saturation de signe.
Algorithme
MODULE VP4DPWSSDS dest, src1, src2 (KL,VL) = (16,512) N ← 4 origdest ← dest src_base ← src_reg_id ∩ ~ (N - 1) * Pour l'opérande src1 BOUCLE POUR i ← 0 JUSQU'A KL-1 SI k1[i] OU pas d'écriture de masque ALORS BOUCLE POUR m ← 0 JUSQU'A N-1 t ← src2.dword[m] p1dword ← reg[src_base + m].word[2 x i] x t.word[0] p2dword ← reg[src_base + m].word[2 x i + 1] x t.word[1] dest.dword[i] ← SIGNED_DWORD_SATURATE(dest.dword[i] + p1dword + p2dword) FIN BOUCLE POUR m SINON SI remplit de zéro ALORS dest.dword[i] ← 0 SINON dest.dword[i] ← origdest.dword[i] FIN SI FIN BOUCLE POUR i dest[MAX_VL-1:VL] ← 0 |
Mnémonique
Instruction | Opcode | Description |
---|---|---|
VP4DPWSSDS zmm1{k1}{z}, zmm2+3, m128 | EVEX.DDS.512.F2.0F38.W0 53 /r | Cette instruction permet de calculer 4 bloc source de registres séquentiel de deux opérandes de mot entier avec un accumulateur en double mot et une saturation de signe. |
Exceptions
Message | Description |
---|---|
#UD | Si le bit de diffusion EVEX est fixé sur 1. |
#UD | Si le MODRM.mod = 0b11. |
Dernière mise à jour : Dimanche, le 23 avril 2017