Section courante

A propos

Section administrative du site

Vectorisation et optimisation

Cette section décrit les éléments suivants :

Vectorisation

Le compilateur Pascal convertit certaines boucles FOR en séquences d'opérations vectorielles. Au moment de l'exécution, les boucles FOR vectorisées utilisent les registres vectoriels et les unités fonctionnelles du matériel Cray pour réduire considérablement le temps d'exécution. La vectorisation est activée par l'option de compilation V+, pouvant apparaître sur l'instruction d'appel Pascal ou dans une directive de compilation apparaissant entre les unités de compilation. (La vectorisation est activée par défaut.)

Bien que le compilateur Pascal tente de vectoriser chaque boucle FOR, toutes les boucles FOR ne peuvent pas être vectorisées. Certaines boucles, si elles sont vectorisées, produisent des résultats différents de ceux générés par le code scalaire; d'autres boucles contiennent des opérations ne pouvant pas être effectuées en mode vectoriel. Le compilateur Pascal effectue une analyse détaillée de chaque boucle FOR et ne vectorise pas les boucles pour lesquelles la transformation scalaire en vecteur ne peut pas être garantie en toute sécurité.

Les constructions suivantes inhibent la vectorisation dans une boucle FOR :

Exemple :

  1. VAR
  2.  a:ARRAY[1..n] OF REAL;
  3.  i,n:INTEGER;
  4.  x:REAL;
  5.  p:ARRAY[1..n] OF INTEGER;
  6.  r:ARRAY[1..n] OF RECORD
  7.   f,g:INTEGER;
  8.  END;
  9. BEGIN
  10.  FOR i:=1 TO n DO             (* Ligne 1 *)
  11.   BEGIN                       (* Ligne 2 *)
  12.    a[i]:=100.0;               (* Ligne 3 *)
  13.    IF P[i]=NIL THEN           (* Ligne 4 *)
  14.     r[i].f:=r[1].g            (* Ligne 5 *)
  15.    ELSE                       (* Ligne 6 *)
  16.     r[i].f:=r[i].f*p[i]^      (* Ligne 7 *)
  17.    END;                       (* Ligne 8 *)
  18. END;

Dans l'exemple précédent, les opérandes de la boucle sont classés comme suit :

Ligne Numéro Classe Opérande
1 Contrôle de boucle i
2 Constante 100.0
3 Définition vectorielle a[i]
3 Affectation vectorielle a[i]:=100.0
4 Définition vectorielle P[i]
4 Expression vectorielle P[i]=NIL
4-7 Vecteur IF IF P[i]=NIL THEN
r[i].f:=r[1].g
ELSE
r[i].f:=r[i].f*p[i]^
5 Constante 1
5 Invariante r[1].g
5 Définition vectorielle r[i].f
5 Affectation vectorielle r[i].f:=r[1].g
7 Définition vectorielle p[i]^
7 Définition vectorielle r[i].f
7 Expression vectorielle r[i].f*p[i]^
7 Affectation vectorielle r[i].f:=r[i].f*P[i]^

Les boucles FOR contenant des instructions IF, des indices de valeur de tableau (adressage indirect de tableaux) et un déréférencement de pointeur de valeur de tableau ne vectorisent que si l'attribut CIGS (spécifiant l'index compacté et le regroupement/la dispersion) est présent sur le paramètre CPU de l'instruction d'invocation Pascal, soit explicitement, soit en tant qu'attribut par défaut de la machine cible.

Si la directive VI est présente dans un commentaire avant une instruction FOR, Pascal ignore les indices ambigus et autres dépendances potentielles lors de l'analyse de la boucle.

Les exemples de boucles FOR vectorisables suivant supposent ces déclarations :

  1. CONST
  2.  n=1000;
  3. VAR
  4.  a,b:ARRAY[1..n] OF REAL;
  5.  c:ARRAY[1..10] OF 1..n;
  6.  d:ARRAY[1..n] OF PACKED RECORD
  7.    f:^ARRAY[1..10] OF INTEGER;
  8.    g:I24
  9.  END;
  10.  dot:REAL;
  11. BEGIN

Exemple 1, une boucle FOR vectorisable :

  1.  FOR i:=1 TO n DO BEGIN
  2.   a[i]:=0.0;
  3.   b[i]:=SQR(b[i])+1
  4.  END;

Exemple 2, une boucle FOR décalant les éléments d'un tableau :

  1.  FOR i:=1 TO n-1 DO a[i]:=a[i+1];

Exemple 3, une boucle FOR produisant le produit scalaire de deux vecteurs :

  1.  dot:=0.0;
  2.  FOR i:=1 TO n DO dot:=dot+a[i]*b[i];

Exemple 4, adressage complexe :

  1.  FOR i:=1 TO n DO d[i].f^[1]:=d[i].g;

Exemple 5, indexation indirecte nécessitant du matériel de collecte/diffusion pour la vectorisation :

  1.  FOR i:=1 TO 10 DO a[c[i]]:=b[c[i]];

Exemple 6, division sûre :

  1.  FOR i:=1 TO n DO IF a[i]<>0 THEN a[i]:=1/a[i];

Exemple 7, une instruction IF nécessitant du matériel de collecte/diffusion pour la vectorisation :

  1.  FOR i:=1 TO n DO IF a[i]>b[i] THEN b[i]:=0
  2.                                ELSE a[i]:=b[i];

L'exemple 8, le programme Sieve, est un exemple de programme avec plusieurs boucles vectorisables :

  1. PROGRAM sieve(OUTPUT);
  2.  
  3. CONST
  4.  size=1000000;
  5.  
  6. TYPE
  7.  flagarray=array[2..size] OF BOOLEAN;
  8.  
  9. VAR
  10.  flags:flagarray;
  11.  i,j:integer;
  12.  
  13. BEGIN
  14.  FOR i:=2 TO size DO flags[i]:=TRUE;
  15.  FOR i:=2 TO TRUNC(SQRT(size)) DO IF flags[i] THEN FOR j:=i+i TO size BY i DO flags[j]:=FALSE;
  16.  j:0;
  17.  FOR i:=2 TO size DO j:=j+ORD(flags[i]);
  18.  WRITELN('Fin du tamis Pascal vectorisé ;',j:0,' nombres premiers trouvés.')
  19. END.

Optimisation

Les optimisations de haut niveau sont effectuées avant la génération du code pour un programme Pascal. Les types d'optimisations suivants sont considérés comme des optimisations de haut niveau :

Les optimisations de bas niveau sont effectuées après la génération du code. Les types d'optimisations suivants sont considérés comme des optimisations de bas niveau :

Toutes les optimisations sont contrôlées par l'option de compilateur O. Les optimisations sont activées par O+ et désactivées par O-. Étant donné que les optimisations réduisent le temps d'exécution tout en augmentant le temps de compilation, utilisez O- lors du développement d'un programme et O+ pour les exécutions de production.

L'option de compilateur O peut être suivie d'un numéro pour affiner le planificateur d'instructions; l'option O+ est équivalente à l'option O3. Le nombre détermine le temps que le planificateur utilise pour rechercher la planification optimale des instructions. Le nombre spécifié a un effet direct sur le temps nécessaire à la compilation : les nombres élevés augmentent le temps de compilation et les petits nombres le diminuent.

Bien que les petits nombres réduisent le temps de compilation, la spécification d'un nombre trop petit peut entraîner une mauvaise planification du code. L'effet de la planification des instructions varie d'un programme Pascal à l'autre. Il peut être nécessaire d'expérimenter différentes valeurs numériques dans votre programme pour produire le meilleur compromis entre le temps de compilation et le temps d'exécution.



Dernière mise à jour : Vendredi, le 13 octobre 2017