Section courante

A propos

Section administrative du site

cuda_runtime_api.h.h

API d'exécution CUDA
CUDA (Compute Unified Device Architecture)

Description

Ce fichier d'entête contient les définitions de l'interface d'API de bas niveau de style langage C.

Liste des fonctions

Nom Prototype Description
CUDABINDTEXTURE cudaError_t cudaBindTexture(size_t* offset, const struct textureReference* texRef, const void* devPtr, const struct cudaChannelFormatDesc* desc, size_t size = UINT_MAX); Cette fonction permet de lier des structures de référence de texture de bas niveau.
CUDABINDTEXTURETOARRAY cudaError_t cudaBindTextureToArray( const struct textureReference* texRef, const struct cudaArray* array, const struct cudaChannelFormatDesc* desc) Cette fonction permet de lier des structures de référence de texture de bas niveau à partir d'un tableau.
CUDACONFIGURECALL cudaError_t cudaConfigureCall(dim3 gridDim, dim3 blockDim, size_t sharedMem = 0, int tokens = 0) Cette fonction permet de fixer la configuration d'exécution d'un périphérique.
CUDACREATECHANNELDESC struct cudaChannelFormatDesc cudaCreateChannelDesc(int x, int y, int z, int w, enum cudaChannelFormatKind f); Cette fonction permet de créer un objet de texture de bas niveau.
CUDAEVENTCREATE cudaError_t cudaEventCreate(cudaEvent_t* event) Cette fonction permet de créer un objet d'événement dans CUDA.
CUDAEVENTDESTROY cudaError_t cudaEventDestroy( cudaEvent_t event) Cette fonction permet d'enlever un objet d'événement dans CUDA.
CUDAEVENTELAPSEDTIME cudaError_t cudaEventElapsedTime( float* time, cudaEvent_t start, cudaEvent_t end ) Cette fonction permet de calculer le nombre de temps écoulé entre le début et la fin d'un événement.
CUDAEVENTQUERY cudaError_t cudaEventQuery( cudaEvent_t event ) Cette fonction permet d'effectuer une requête si un événement a été enregistré.
CUDAEVENTRECORD cudaError_t cudaEventRecord(cudaEvent_t event, CUstream stream) Cette fonction permet d'effectuer lancer un enregistrement d'événement dans CUDA.
CUDAEVENTSYNCHRONIZE cudaError_t cudaEventSynchronize(cudaEvent_t event) Cette fonction permet d'attendre qu'un événement soit complètement enregistré.
CUDAFREE cudaError_t cudaFree(void* devPtr) Cette fonction permet de libérer un emplacement de mémoire spécifié sur le GPU.
CUDAFREEARRAY cudaError_t cudaFreeArray( struct cudaArray* array ) Cette fonction permet de libérer de la mémoire dynamique sur le GPU selon un tableau de structures de données spécifiés.
CUDAFREEHOST cudaError_t cudaFreeHost( void* hostPtr ) Cette fonction permet de libérer des pages de mémoire verrouillés sur un hôte.
CUDAGETCHANNELDESC cudaError_t cudaGetChannelDesc(struct cudaChannelFormatDesc* desc, const struct cudaArray* array) Cette fonction permet de demander l'objet de texture de bas niveau.
CUDAGETDEVICE cudaError_t cudaGetDevice(int* dev) Cette fonction permet de retourner le périphériques dans lequel un processus léger hôte actif est en trait d'exécuter du code de périphérique.
CUDAGETDEVICECOUNT cudaError_t cudaGetDeviceCount(int* count) Cette fonction permet de retourner le nombre de périphériques capable d'effectuer des calculs.
CUDAGETDEVICEPROPERTIES cudaError_t cudaGetDeviceProperties( struct cudaDeviceProp* prop, int dev ) Cette fonction permet de retourner les informations sur le périphérique de calcul.
CUDAGETTEXTUREALIGNMENTOFFSET cudaError_t cudaGetTextureAlignmentOffset(size_t* offset, const struct textureReference* texRef) Cette fonction permet de demander l'alignement et le déplacement de la texture de bas niveau.
CUDAGETTEXTUREREFERENCE cudaError_t cudaGetTextureReference( struct textureReference** texRef, const char* symbol) Cette fonction permet de demander la structure de référence de texture de bas niveau à partir du symbole spécifié.
CUDAGLREGISTERBUFFEROBJECT cudaError_t cudaGLRegisterBufferObject(GLuint bufferObj) Cette fonction permet de fixer l'enregistrement de l'objet de tampon du OpenGL avec le périphérique CUDA.
CUDAGLSETGLDEVICE cudaError_t cudaGLSetGLDevice(int device) Cette fonction permet de fixer l'interopérabilité du OpenGL avec le périphérique CUDA.
CUDAMALLOC cudaError_t cudaMalloc( void** devPtr, size_t count ) Cette fonction permet d'allouer de la mémoire dynamique sur le GPU.
CUDAMALLOC3D cudaError_t cudaMalloc3D( struct cudaPitchedPtr* pitchDevPtr, struct cudaExtent extent ) Cette fonction permet d'allouer de la mémoire dynamique sur des objets logiques de 1 dimensions, 2 dimensions ou 3 dimensions sur le GPU.
CUDAMALLOC3DARRAY cudaError_t cudaMalloc3DArray( struct cudaArray** arrayPtr, const struct cudaChannelFormatDesc* desc, struct cudaExtent extent ) Cette fonction permet d'allouer de la mémoire dynamique un tableau en 3 dimensions sur le GPU.
CUDAMALLOCARRAY cudaError_t cudaMallocArray( struct cudaArray** array, const struct cudaChannelFormatDesc* desc, size_t width, size_t height ) Cette fonction permet d'allouer de la mémoire dynamique sur le GPU selon un tableau de structures de données spécifiés.
CUDAMALLOCHOST cudaError_t cudaMallocHost(void** hostPtr, size_t size) Cette fonction permet d'allouer des pages de mémoire verrouillés sur un hôte.
CUDAMALLOCPITCH cudaError_t cudaMallocPitch( void** devPtr, size_t* pitch, size_t widthInBytes, size_t height) Cette fonction permet d'allouer de la mémoire dynamique sur le GPU selon la dimension d'un tableau en 2 dimensions et de tailles de cellules spécifiés.
CUDAMEMCPY cudaError_t cudaMemcpy( void* dst, const void* src, size_t count, enum cudaMemcpyKind kind) Cette fonction permet de copier des données entre une zone de mémoire GPU et un hôte.
CUDAMEMCPY2D cudaError_t cudaMemcpy2D( void* dst, size_t dpitch, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind ) Cette fonction permet de copier un tableau en 2 dimensions entre une zone de mémoire GPU et un hôte.
CUDAMEMCPY2DARRAYTOARRAY cudaError_t cudaMemcpy2DArrayToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t width, size_t height, enum cudaMemcpyKind kind) Cette fonction permet de copier un tableau entre une zone de mémoire GPU et un hôte ou vice versa.
CUDAMEMCPY2DASYNC cudaError_t cudaMemcpy2DAsync( void* dst, size_t dpitch, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind, cudaStream_t stream ) Cette fonction permet de copier un tableau en 2 dimensions de façon synchronisé entre une zone de mémoire GPU et un hôte.
CUDAMEMCPY2DFROMARRAY cudaError_t cudaMemcpy2DFromArray(void* dst, size_t dpitch, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t width, size_t height, enum cudaMemcpyKind kind) Cette fonction permet de copier un tableau en 2 dimensions d'une zone de mémoire GPU vers un hôte.
CUDAMEMCPY2DFROMARRAYASYNC cudaError_t cudaMemcpy2DFromArrayAsync(void* dst, size_t dpitch, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t width, size_t height, enum cudaMemcpyKind kind, cudaStream_t stream) Cette fonction permet de copier un tableau en 2 dimensions de façon synchronisé d'une zone de mémoire GPU vers un hôte.
CUDAMEMCPY2DTOARRAY cudaError_t cudaMemcpy2DToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind) Cette fonction permet de copier un tableau en 2 dimensions d'une zone de mémoire GPU vers un hôte.
CUDAMEMCPY2DTOARRAYASYNC cudaError_t cudaMemcpy2DToArrayAsync(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind, cudaStream_t stream) Cette fonction permet de copier un tableau en 2 dimensions de façon synchronisé d'une zone de mémoire GPU vers un hôte.
CUDAMEMCPY3D cudaError_t cudaMemcpy3D( const struct cudaMemcpy3DParms *p ) Cette fonction permet de copier un tableau en 3 dimensions entre une zone de mémoire GPU et un hôte.
CUDAMEMCPY3DASYNC cudaError_t cudaMemcpy3DAsync( const struct cudaMemcpy3DParms *p, cudaStream_t stream ) Cette fonction permet de copier un tableau en 3 dimensions de façon synchronisé entre une zone de mémoire GPU et un hôte.
CUDAMEMCPYARRAYTOARRAY cudaError_t cudaMemcpyArrayToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t count, enum cudaMemcpyKind kind) Cette fonction permet de copier un tableau entre une zone de mémoire GPU et un hôte ou vice versa.
CUDAMEMCPYASYNC cudaError_t cudaMemcpyAsync( void* dst, const void* src, size_t count, enum cudaMemcpyKind kind, cudaStream_t stream ) Cette fonction permet de copier des données de façon synchronisé entre une zone de mémoire GPU et un hôte.
CUDAMEMCPYFROMARRAY cudaError_t cudaMemcpyFromArray(void* dst, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t count, enum cudaMemcpyKind kind) Cette fonction permet de copier un tableau d'un hôte vers une zone de mémoire GPU.
CUDAMEMCPYFROMARRAYASYNC cudaError_t cudaMemcpyFromArrayAsync(void* dst, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t count, enum cudaMemcpyKind kind, cudaStream_t stream) Cette fonction permet de copier un tableau de façon synchronisé d'un hôte vers une zone de mémoire GPU.
CUDAMEMCPYTOARRAY cudaError_t cudaMemcpyToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t count, enum cudaMemcpyKind kind) Cette fonction permet de copier un tableau d'une zone de mémoire GPU vers un hôte.
CUDAMEMCPYTOARRAYASYNC cudaError_t cudaMemcpyToArrayAsync(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t count, enum cudaMemcpyKind kind, cudaStream_t stream) Cette fonction permet de copier un tableau de façon synchronisé d'une zone de mémoire GPU vers un hôte.
CUDAMEMSET cudaError_t cudaMemset( void* devPtr, int value, size_t count ) Cette fonction permet de fixer une valeur de façon continue dans une zone de mémoire GPU.
CUDAMEMSET2D cudaError_t cudaMemset2D( void* dstPtr, size_t pitch, int value, size_t width, size_t height) Cette fonction permet de fixer une valeur dans chacune des celulles d'un tableau en 2 dimensions d'une zone de mémoire GPU.
CUDAMEMSET3D cudaError_t cudaMemset3D( struct cudaPitchedPtr dstPitchPtr, int value, struct cudaExtent extent) Cette fonction permet de fixer une valeur dans chacune des celulles d'un tableau en 3 dimensions d'une zone de mémoire GPU.
CUDASETUPARGUMENT cudaError_t cudaSetupArgument(void* arg, size_t count, size_t offset) Cette fonction permet de fixer les arguments d'exécution d'un périphérique.
CUDASETDEVICE cudaError_t cudaSetDevice(int dev) Cette fonction permet de fixer le périphériques à utiliser pour l'exécution par le GPU.
CUDASTREAMCREATE cudaError_t cudaStreamCreate(cudaStream_t* stream) Cette fonction permet de créer un flux sychronisé pour CUDA.
CUDASTREAMDESTROY cudaError_t cudaStreamDestroy(cudaStream_t stream) Cette fonction permet d'effacer de nettoyer les résidues de l'objet de flux dans CUDA.
CUDASTREAMQUERY cudaError_t cudaStreamQuery(cudaStream_t stream) Cette fonction permet d'effectuer une requête de flux afin d'atteindre un état précis.
CUDASTREAMSYNCHRONIZE cudaError_t cudaStreamSynchronize(cudaStream_t stream) Cette fonction permet d'attendre qu'une tâche de flux soit complété.
CUDATHREADEXIT cudaError_t cudaThreadExit(void) Cette fonction permet de faire sortir et d'enlever les processus lancés de CUDA.
CUDATHREADSYNCHRONIZE cudaError_t cudaThreadSynchronize(void) Cette fonction permet d'attendre que le périphérique de calcul est terminé ses opérations.
CUDAUNBINDTEXTURE cudaError_t cudaUnbindTexture( const struct textureReference* texRef); Cette fonction permet d'enlever le lien des structures de référence de texture de bas niveau.


Dernière mise à jour : Vendredi, le 2 août 2013