Section courante

A propos

Section administrative du site

Allocation de mémoire depuis DOS

Le système d'exploitation DOS subdivise le maximum de 640 Ko de mémoire en environ deux zones. La première zone est désignée comme étant la zone du système d'exploitation. Il commence à l'emplacement mémoire 0000:0000 et contient la table des vecteurs d'interruption, certaines tables internes, les tampons, la mémoire des variables et le code du système d'exploitation. Ce code conserve la partie résidente du processeur de commandes et les pilotes de périphériques résidents et installables. La taille de cette zone varie selon la version de DOS utilisée, la taille des pilotes de périphérique installés et d'autres facteurs tels que le nombre de tampons de disque disponibles.

La seconde zone est désignée sous le nom de TPA (Transient Program Area). Il contient des programmes et leurs blocs d'environnement pour l'exécution. Le TPA démarre après la fin de la zone du système d'exploitation. En fonction des besoins en mémoire des programmes individuels, DOS leur attribue différentes quantités de mémoire administrées via un bloc de données spécial précédant chaque intervalle de mémoire et connecté au bloc de données de l'intervalle de mémoire suivante. Ceci s'applique également à la mémoire non affectée à un programme.

Ce bloc de données, appelé bloc de contrôle de mémoire (ou MCB) est un bloc de 16 octets contenant diverses informations. Un MCB commence à l'une des adresses divisibles par 16 et contrôle l'allocation de mémoire. Le DOS recherche l'adresse de segment de l'intervalle de mémoire allouée et est aidé dans cette tâche par le MCB. Le tableau suivant montre la structure d'un MCB en mémoire :

Adresse Contenus Type
+00h Identificateur ("Z"-dernier MCB, "M"-autre MCB suivant) 1 octet
+01h Adresse de segment correspondant au PSP 1 mot
+03h Nombre de paragraphes dans l'intervalle allouée 1 mot
+05h Utilisé 11 octets
+10h Intervalle de mémoire allouée x paragraphes

Comme l'illustre le tableau ci-dessus, le MCB contient trois champs. Le premier champ indique si des MCB suivent le MCB actuel en cours d'analyse. Les lettres "M" (plus de MCB à suivre) et "Z" (dernier MCB) sont les initiales de l'un des créateurs de MS-DOS, Mark Zbikowski.

Le deuxième champ spécifie l'adresse de segment de la PSP du programme correspondant. Cela s'applique uniquement lorsque l'allocation de mémoire devient une partie de l'environnement du programme en cours de traitement auquel cas le PSP est indiqué par le contenu de ce champ. Dans la plupart des cas, ce champ indique simplement l'intervalle de mémoire nécessaire au programme.

Le troisième champ du MCB spécifie la taille de l'intervalle mémoire correspondante en paragraphes. Vient ensuite l'intervalle de mémoire elle-même, puis tout autre MCB après cela (à condition que le premier champ contienne une lettre d'identification "M"). Les MCB peuvent être reliés entre eux pour créer un groupe, comme illustré dans la figure ci-dessous :

Si le chargeur EXEC du DOS charge et exécute un programme, cette fonction demande immédiatement deux zones de données via une autre fonction DOS. La première de ces deux zones entrepose le bloc d'environnement, tandis que la seconde accepte le programme en cours et la PSP du programme. La taille de la zone mise à disposition d'un programme est difficile à estimer à partir du chargeur EXEC. Ceci est encore plus difficile pour les programmes COM que pour les programmes EXE car les programmes COM sont des copies du contenu de la mémoire et n'ont aucune information les précédant. Le DOS utilise donc par défaut le maximum et réserve la totalité de la mémoire disponible pour un programme COM.

Cette méthode fonctionnait bien au début du DOS, mais a créé d'autres problèmes. Alors qu'un seul programme pouvait exister en mémoire à la fois dans les premiers jours de DOS, il est maintenant courant qu'un programme charge et exécute un deuxième programme, ou même qu'un des programmes réside de manière permanente en mémoire. Cela ne peut pas être fait s'il n'y a pas de mémoire, comme ce serait le cas après le chargement d'un programme COM. C'est pourquoi un programme COM doit toujours libérer la mémoire dont il n'a plus besoin après son démarrage.

Un programme COM ne peut se charger que lorsqu'un intervalle de mémoire suffisamment grande pour accueillir le programme COM existe (plus 256 octets pour la PSP et au moins 2 octets pour la pile). Le programme COM garantit que suffisamment de mémoire est disponible. Dans les conditions minimales présentées ci-dessus, le programme ne fonctionnera probablement pas sans erreur, car peu de programmes peuvent fonctionner avec seulement une pile de 2 octets.

Les fichiers de programme EXE contiennent un ensemble d'informations créées par l'éditeur de liens. Le chargeur EXEC peut déterminer la quantité de mémoire requise pour le segment de code, les données et la pile à partir de ces informations. Le démarrage du programme EXE lui-même contient des informations supplémentaires sur la quantité de mémoire nécessaire pour le programme. Cette quantité définit une limite supérieure et inférieure de la mémoire supplémentaire, plutôt qu'un nombre spécifique d'octets. Le chargeur EXEC essaie de réserver la limite supérieure de mémoire s'il le peut. Si ce n'est pas possible, le chargeur EXEC utilise la limite inférieure ou réserve le reste de la mémoire. Si la limite inférieure de mémoire ne peut pas être allouée, le processus de chargement s'interrompt et le contrôle revient au programme ayant appelé le chargeur EXEC (dans la plupart des cas, le processeur de commande).

La même chose se produit après l'exécution du programme lorsque le chargeur EXEC libère l'espace mémoire réservé pour une utilisation ultérieure, sauf s'il est empêché par la fonction 31h de l'interruption 21h, appelée depuis le programme.

Maintenant que vous connaissez certains des aspects théoriques de la gestion de la mémoire DOS, voici les descriptions des plus importantes de ces fonctions DOS. Les fonctions 48h, 49h et 4Ah sont toutes appelées via l'interruption 21h. Le numéro de fonction est passé dans le registre AH.

La fonction 48h alloue de la mémoire. Le numéro de fonction est passé dans le registre AH et le nombre de paragraphes à réserver (16 octets par paragraphe) est passé dans le registre BX. Si le nombre de paragraphes demandé peut être réservé, la fonction revient avec le drapeau de retenue désactivé. Le registre AX indique l'adresse de segment de la mémoire réservée. Par conséquent, il commence à l'adresse AX:0000. Si le programme a nécessité plus de mémoire qu'il n'y en avait de disponible, le drapeau de retenue est activé suite à l'appel de la fonction et le registre AX contient un code d'erreur. Le registre BX contient la mémoire maximale disponible en paragraphes.

La fonction 49h effectue l'inverse de la fonction 48h. Cette fonction libère la mémoire précédemment réservée via la fonction 48h. L'adresse de segment de la zone mémoire à libérer est passée dans le registre ES. Cette adresse de segment a été transmise à l'origine dans le registre AX lorsque la fonction 48H a été appelée. Normalement, la fonction 49h doit s'exécuter sans erreur et le drapeau de retenue doit être réinitialisé après l'appel de la fonction. Si ce n'est pas le cas, cela peut être dû soit à un bloc de données détruit (placé devant une zone mémoire par DOS), soit à une adresse de segment passée dans le registre ES ne correspondant pas à une zone mémoire réservée.

Une troisième fonction modifie la taille de la zone mémoire qui avait été précédemment réservée. La zone de mémoire peut être agrandie ou réduite en utilisant la fonction 4Ah. L'adresse de segment de la zone à modifier est passée dans le registre ES. Le registre BX réserve le nombre de paragraphes (unités de 16 octets) que doit contenir la zone mémoire. Le contenu du registre suite à l'appel de la fonction est identique à celui de la fonction 48h.

Étant donné que l'appel de fonctions DOS est relativement facile en ce qui concerne la gestion de la mémoire et qu'aucune astuce particulière n'est requise, le programme suivant est dédié à un sujet différent, concernant également la gestion de la mémoire DOS. Nous parlons d'un programme qui fouine dans le système et vérifie toute la mémoire allouée ainsi que son contenu. Le programme est suffisamment intelligent pour différencier les zones d'entreposage contenant l'environnement d'un programme, une PSP ou d'autres informations.

L'affectation de ce programme est de parcourir la mémoire de MCB à MCB et d'examiner les zones de stockage allouées. Afin de passer au MCB suivant à chaque fois, il utilise le troisième champ d'un MCB, ce qui l'aide à pointer vers le MCB suivant. Cela configure une boucle s'exécutant jusqu'à ce que le dernier MCB soit découvert, qui aura la lettre "Z" dans son champ d'identificateur.

Mais pour se déplacer dans la chaîne des MCB, l'adresse du premier maillon, c'est-à-dire le premier MCB, doit être connue. Le DOS le répertorie dans une structure interne appelée DIB (DOS Information Block), n'étant normalement pas accessible aux programmes d'application, c'est-à-dire qu'il s'agit d'une fonctionnalité DOS non documentée. Cependant, nous pouvons trouver l'adresse de cette structure à l'aide de la fonction 52h, envoyant l'adresse à la paire de registres ES:BX lorsqu'elle sera appelée.

Curieusement, cette adresse pointe vers le second champ du MCB plutôt que vers le premier. Mais comme c'est le premier champ contenant l'adresse du premier MCB, l'information que nous recherchons se trouve derrière le pointeur. Comme le pointeur sur le premier MCB est composé d'une adresse de déplacement et d'une adresse de segment, il a une longueur de quatre octets et se trouve donc à l'adresse ES:(BX-4). Mais soyez prudent avec l'instruction d'adresse, car elle donne l'impression que tout ce que vous avez à faire est de soustraire 4 du contenu du registre BX afin d'obtenir l'adresse effective de l'information souhaitée dans la paire de registres ES:BX. Cela ne réussira que si l'adresse de déplacement dans le registre BX est supérieure ou égale à 4. Mais si elle est inférieure à 4, les conséquences sont désastreuses, car cela laisse un nombre négatif. Il n'existe pas d'adresse mémoire négative. Prenons un exemple pour clarifier cela :

Si la valeur 0 est renvoyée au registre BX comme adresse de déplacement de la DIB, la soustraction donnerait la valeur 0FFFCh. Avec les opérations arithmétiques, cela est interprété assez correctement comme -4. Cependant, lors d'un accès mémoire, celui-ci ne pointera pas sur l'adresse -4, mais bien sur 0FFFCh, et donc sur la fin plutôt que sur le début du segment d'accompagnement. Bien sûr, vous n'y trouverez pas ce que vous cherchez.

Le programme vous aidera ici, tout d'abord en décrémentant l'adresse de segment livrée de 1. Cela réduit l'adresse effective, que vous obtenez en ajoutant l'adresse de segment et l'adresse de décalage, de 16. Enfin, en ajoutant 12 à l'adresse de décalage , l'adresse effective est réduite de seulement 4 et pointe vers l'emplacement mémoire souhaité. L'adresse du premier MCB peut alors être extraite de cet emplacement mémoire sans aucun problème.

La boucle parcourant tous les MCB et les analysant commence par cette adresse. Tout d'abord, certaines informations d'état sur le MCB et la mémoire qu'il contrôle sont données. Ceci comprend :

Ensuite, le contenu de la zone d'entreposage lui appartenant est examiné. On obtient son adresse en incrémentant de 1 l'adresse de segment du MCB. La première chose que l'on détermine est de savoir s'il s'agit d'un bloc d'environnement dans cette zone d'entreposage. Nous saurons avec certitude si nous trouvons la chaîne de caractères COMSPEC= au début de la zone. Cette chaîne de caractères commence chaque bloc d'environnement. Si cette chaîne de caractères est trouvée, le programme procède comme s'il s'agissait bien d'un bloc d'environnement et il liste les chaînes d'environnement individuelles. Devant ceux-ci, il répertorie le nom du programme auquel appartient le bloc d'environnement, qui se trouve à la fin du bloc d'environnement pour DOS version 3.0 et supérieure.

Si la zone d'entreposage ne peut pas être identifiée comme un bloc d'environnement, il est possible qu'il s'agisse d'une PSP, et donc d'un programme transitoire ou résident. Le programme démarrera à partir d'ici s'il trouve la commande de langage machine INT 20H (code 0CDH, 020H) dans les deux premières positions de l'intervalle de mémoire. Cette commande démarre chaque PSP.



Dernière mise à jour : Lundi, le 23 janvier 2023