Format du programme
Un programme en langage assembleur acceptable en entrée de l'assembleur consiste en une séquence d'instructions dans le format suivant :
line# label operation operand ;comment |
où un ou tous les champs peuvent être présents dans un cas particulier. Chaque instruction en langage assembleur se termine par un retour chariot et un saut de ligne (le saut de ligne est inséré automatiquement par le programme ED), ou par le caractère "!", étant traité comme une fin de ligne par l'assembleur (ainsi, plusieurs instructions en langage assembleur peuvent être écrites sur la même ligne physique si elles sont séparées par des symboles de point d'exclamation).
Le numéro de ligne est une valeur entière décimale facultative représentant le numéro de ligne du programme source, étant autorisé sur n'importe quelle ligne source pour maintenir la compatibilité avec le format Processor Technology. En général, ces numéros de ligne seront insérés si un éditeur orienté ligne est utilisé pour construire le programme d'origine, et donc ASM ignore ce champ s'il est présent.
Le champ d'étiquette prend l'une des formes suivantes :
identifier |
identifier: |
Le champ d'étiquette est facultatif, sauf indication contraire dans des types d'instructions particuliers. L'identifiant est une séquence de caractères alphanumériques où le premier caractère est alphabétique. Les identificateurs peuvent être librement utilisés par le programmeur pour étiqueter des éléments tels que des étapes de programme et des directives d'assembleur, mais ne peuvent pas dépasser 16 caractères. Tous les caractères sont significatifs dans un identifiant, à l'exception du symbole du dollar ($) intégré, pouvant être utilisé pour améliorer la lisibilité du nom. De plus, tous les caractères alphabétiques minuscules sont traités comme des majuscules. Notez que le ":" suivant l'identifiant dans une étiquette est facultatif (pour maintenir la compatibilité entre Intel et Processor Technology). Ainsi, les éléments suivants sont tous des instances valides d'étiquettes :
x | xy | long$name |
x: | yx1: | longer$named$data: |
X1Y2 | X1x2 | x234$5678$9012$3456: |
Le champ d'opération contient soit une directive assembleur ou une pseudo-opération, soit un code d'opération machine 8080. Les pseudo-opérations et les codes de fonctionnement de la machine sont décrits dans la page suivante.
Le champ opérande de l'instruction, en général, contient une expression formée de constantes et d'étiquettes, ainsi que des opérations arithmétiques et logiques sur ces éléments. Encore une fois, les détails complets des expressions correctement formées sont donnés dans la page suivante.
Le champ de commentaire contient des caractères arbitraires après le ";" jusqu'à la prochaine fin de ligne réelle ou logique. Ces caractères sont lus, répertoriés et autrement ignorés par l'assembleur. Afin de maintenir la compatibilité avec l'assembleur Processor Technology, l'assembleur CP/M traite également les instructions commençant par un "*" dans la première colonne comme des instructions de commentaire, étant répertoriées et ignorées dans le processus d'assemblage. Notez que l'assembleur Processor Technology a les caractères après que le champ d'opérande a été balayé. Cela provoque une situation ambiguë lorsque l'on tente d'être compatible avec le langage d'Intel, car se sont des expressions arbitraires dans ce cas. Par conséquent, les programmes utilisant cet effet secondaire pour introduire des commentaires doivent être modifiés pour placer un ";" avant ces champs afin d'assembler correctement.
Le programme en langage assembleur est formulé comme une séquence d'instructions de la forme ci-dessus, terminée par une instruction END facultative. Toutes les instructions suivant END sont ignorées par l'assembleur.