cuda_runtime_api.h.h |
API d'exécution CUDA |
---|---|
CUDA (Compute Unified Device Architecture) |
Description
Ce fichier d'entête contient les définitions de l'interface d'API de bas niveau de style langage C.
Liste des fonctions
Nom | Prototype | Description |
---|---|---|
CUDABINDTEXTURE | cudaError_t cudaBindTexture(size_t* offset, const struct textureReference* texRef, const void* devPtr, const struct cudaChannelFormatDesc* desc, size_t size = UINT_MAX); | Cette fonction permet de lier des structures de référence de texture de bas niveau. |
CUDABINDTEXTURETOARRAY | cudaError_t cudaBindTextureToArray( const struct textureReference* texRef, const struct cudaArray* array, const struct cudaChannelFormatDesc* desc) | Cette fonction permet de lier des structures de référence de texture de bas niveau à partir d'un tableau. |
CUDACONFIGURECALL | cudaError_t cudaConfigureCall(dim3 gridDim, dim3 blockDim, size_t sharedMem = 0, int tokens = 0) | Cette fonction permet de fixer la configuration d'exécution d'un périphérique. |
CUDACREATECHANNELDESC | struct cudaChannelFormatDesc cudaCreateChannelDesc(int x, int y, int z, int w, enum cudaChannelFormatKind f); | Cette fonction permet de créer un objet de texture de bas niveau. |
CUDAEVENTCREATE | cudaError_t cudaEventCreate(cudaEvent_t* event) | Cette fonction permet de créer un objet d'événement dans CUDA. |
CUDAEVENTDESTROY | cudaError_t cudaEventDestroy( cudaEvent_t event) | Cette fonction permet d'enlever un objet d'événement dans CUDA. |
CUDAEVENTELAPSEDTIME | cudaError_t cudaEventElapsedTime( float* time, cudaEvent_t start, cudaEvent_t end ) | Cette fonction permet de calculer le nombre de temps écoulé entre le début et la fin d'un événement. |
CUDAEVENTQUERY | cudaError_t cudaEventQuery( cudaEvent_t event ) | Cette fonction permet d'effectuer une requête si un événement a été enregistré. |
CUDAEVENTRECORD | cudaError_t cudaEventRecord(cudaEvent_t event, CUstream stream) | Cette fonction permet d'effectuer lancer un enregistrement d'événement dans CUDA. |
CUDAEVENTSYNCHRONIZE | cudaError_t cudaEventSynchronize(cudaEvent_t event) | Cette fonction permet d'attendre qu'un événement soit complètement enregistré. |
CUDAFREE | cudaError_t cudaFree(void* devPtr) | Cette fonction permet de libérer un emplacement de mémoire spécifié sur le GPU. |
CUDAFREEARRAY | cudaError_t cudaFreeArray( struct cudaArray* array ) | Cette fonction permet de libérer de la mémoire dynamique sur le GPU selon un tableau de structures de données spécifiés. |
CUDAFREEHOST | cudaError_t cudaFreeHost( void* hostPtr ) | Cette fonction permet de libérer des pages de mémoire verrouillés sur un hôte. |
CUDAGETCHANNELDESC | cudaError_t cudaGetChannelDesc(struct cudaChannelFormatDesc* desc, const struct cudaArray* array) | Cette fonction permet de demander l'objet de texture de bas niveau. |
CUDAGETDEVICE | cudaError_t cudaGetDevice(int* dev) | Cette fonction permet de retourner le périphériques dans lequel un processus léger hôte actif est en trait d'exécuter du code de périphérique. |
CUDAGETDEVICECOUNT | cudaError_t cudaGetDeviceCount(int* count) | Cette fonction permet de retourner le nombre de périphériques capable d'effectuer des calculs. |
CUDAGETDEVICEPROPERTIES | cudaError_t cudaGetDeviceProperties( struct cudaDeviceProp* prop, int dev ) | Cette fonction permet de retourner les informations sur le périphérique de calcul. |
CUDAGETTEXTUREALIGNMENTOFFSET | cudaError_t cudaGetTextureAlignmentOffset(size_t* offset, const struct textureReference* texRef) | Cette fonction permet de demander l'alignement et le déplacement de la texture de bas niveau. |
CUDAGETTEXTUREREFERENCE | cudaError_t cudaGetTextureReference( struct textureReference** texRef, const char* symbol) | Cette fonction permet de demander la structure de référence de texture de bas niveau à partir du symbole spécifié. |
CUDAGLREGISTERBUFFEROBJECT | cudaError_t cudaGLRegisterBufferObject(GLuint bufferObj) | Cette fonction permet de fixer l'enregistrement de l'objet de tampon du OpenGL avec le périphérique CUDA. |
CUDAGLSETGLDEVICE | cudaError_t cudaGLSetGLDevice(int device) | Cette fonction permet de fixer l'interopérabilité du OpenGL avec le périphérique CUDA. |
CUDAMALLOC | cudaError_t cudaMalloc( void** devPtr, size_t count ) | Cette fonction permet d'allouer de la mémoire dynamique sur le GPU. |
CUDAMALLOC3D | cudaError_t cudaMalloc3D( struct cudaPitchedPtr* pitchDevPtr, struct cudaExtent extent ) | Cette fonction permet d'allouer de la mémoire dynamique sur des objets logiques de 1 dimensions, 2 dimensions ou 3 dimensions sur le GPU. |
CUDAMALLOC3DARRAY | cudaError_t cudaMalloc3DArray( struct cudaArray** arrayPtr, const struct cudaChannelFormatDesc* desc, struct cudaExtent extent ) | Cette fonction permet d'allouer de la mémoire dynamique un tableau en 3 dimensions sur le GPU. |
CUDAMALLOCARRAY | cudaError_t cudaMallocArray( struct cudaArray** array, const struct cudaChannelFormatDesc* desc, size_t width, size_t height ) | Cette fonction permet d'allouer de la mémoire dynamique sur le GPU selon un tableau de structures de données spécifiés. |
CUDAMALLOCHOST | cudaError_t cudaMallocHost(void** hostPtr, size_t size) | Cette fonction permet d'allouer des pages de mémoire verrouillés sur un hôte. |
CUDAMALLOCPITCH | cudaError_t cudaMallocPitch( void** devPtr, size_t* pitch, size_t widthInBytes, size_t height) | Cette fonction permet d'allouer de la mémoire dynamique sur le GPU selon la dimension d'un tableau en 2 dimensions et de tailles de cellules spécifiés. |
CUDAMEMCPY | cudaError_t cudaMemcpy( void* dst, const void* src, size_t count, enum cudaMemcpyKind kind) | Cette fonction permet de copier des données entre une zone de mémoire GPU et un hôte. |
CUDAMEMCPY2D | cudaError_t cudaMemcpy2D( void* dst, size_t dpitch, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind ) | Cette fonction permet de copier un tableau en 2 dimensions entre une zone de mémoire GPU et un hôte. |
CUDAMEMCPY2DARRAYTOARRAY | cudaError_t cudaMemcpy2DArrayToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t width, size_t height, enum cudaMemcpyKind kind) | Cette fonction permet de copier un tableau entre une zone de mémoire GPU et un hôte ou vice versa. |
CUDAMEMCPY2DASYNC | cudaError_t cudaMemcpy2DAsync( void* dst, size_t dpitch, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind, cudaStream_t stream ) | Cette fonction permet de copier un tableau en 2 dimensions de façon synchronisé entre une zone de mémoire GPU et un hôte. |
CUDAMEMCPY2DFROMARRAY | cudaError_t cudaMemcpy2DFromArray(void* dst, size_t dpitch, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t width, size_t height, enum cudaMemcpyKind kind) | Cette fonction permet de copier un tableau en 2 dimensions d'une zone de mémoire GPU vers un hôte. |
CUDAMEMCPY2DFROMARRAYASYNC | cudaError_t cudaMemcpy2DFromArrayAsync(void* dst, size_t dpitch, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t width, size_t height, enum cudaMemcpyKind kind, cudaStream_t stream) | Cette fonction permet de copier un tableau en 2 dimensions de façon synchronisé d'une zone de mémoire GPU vers un hôte. |
CUDAMEMCPY2DTOARRAY | cudaError_t cudaMemcpy2DToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind) | Cette fonction permet de copier un tableau en 2 dimensions d'une zone de mémoire GPU vers un hôte. |
CUDAMEMCPY2DTOARRAYASYNC | cudaError_t cudaMemcpy2DToArrayAsync(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t spitch, size_t width, size_t height, enum cudaMemcpyKind kind, cudaStream_t stream) | Cette fonction permet de copier un tableau en 2 dimensions de façon synchronisé d'une zone de mémoire GPU vers un hôte. |
CUDAMEMCPY3D | cudaError_t cudaMemcpy3D( const struct cudaMemcpy3DParms *p ) | Cette fonction permet de copier un tableau en 3 dimensions entre une zone de mémoire GPU et un hôte. |
CUDAMEMCPY3DASYNC | cudaError_t cudaMemcpy3DAsync( const struct cudaMemcpy3DParms *p, cudaStream_t stream ) | Cette fonction permet de copier un tableau en 3 dimensions de façon synchronisé entre une zone de mémoire GPU et un hôte. |
CUDAMEMCPYARRAYTOARRAY | cudaError_t cudaMemcpyArrayToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t count, enum cudaMemcpyKind kind) | Cette fonction permet de copier un tableau entre une zone de mémoire GPU et un hôte ou vice versa. |
CUDAMEMCPYASYNC | cudaError_t cudaMemcpyAsync( void* dst, const void* src, size_t count, enum cudaMemcpyKind kind, cudaStream_t stream ) | Cette fonction permet de copier des données de façon synchronisé entre une zone de mémoire GPU et un hôte. |
CUDAMEMCPYFROMARRAY | cudaError_t cudaMemcpyFromArray(void* dst, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t count, enum cudaMemcpyKind kind) | Cette fonction permet de copier un tableau d'un hôte vers une zone de mémoire GPU. |
CUDAMEMCPYFROMARRAYASYNC | cudaError_t cudaMemcpyFromArrayAsync(void* dst, const struct cudaArray* srcArray, size_t srcX, size_t srcY, size_t count, enum cudaMemcpyKind kind, cudaStream_t stream) | Cette fonction permet de copier un tableau de façon synchronisé d'un hôte vers une zone de mémoire GPU. |
CUDAMEMCPYTOARRAY | cudaError_t cudaMemcpyToArray(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t count, enum cudaMemcpyKind kind) | Cette fonction permet de copier un tableau d'une zone de mémoire GPU vers un hôte. |
CUDAMEMCPYTOARRAYASYNC | cudaError_t cudaMemcpyToArrayAsync(struct cudaArray* dstArray, size_t dstX, size_t dstY, const void* src, size_t count, enum cudaMemcpyKind kind, cudaStream_t stream) | Cette fonction permet de copier un tableau de façon synchronisé d'une zone de mémoire GPU vers un hôte. |
CUDAMEMSET | cudaError_t cudaMemset( void* devPtr, int value, size_t count ) | Cette fonction permet de fixer une valeur de façon continue dans une zone de mémoire GPU. |
CUDAMEMSET2D | cudaError_t cudaMemset2D( void* dstPtr, size_t pitch, int value, size_t width, size_t height) | Cette fonction permet de fixer une valeur dans chacune des celulles d'un tableau en 2 dimensions d'une zone de mémoire GPU. |
CUDAMEMSET3D | cudaError_t cudaMemset3D( struct cudaPitchedPtr dstPitchPtr, int value, struct cudaExtent extent) | Cette fonction permet de fixer une valeur dans chacune des celulles d'un tableau en 3 dimensions d'une zone de mémoire GPU. |
CUDASETUPARGUMENT | cudaError_t cudaSetupArgument(void* arg, size_t count, size_t offset) | Cette fonction permet de fixer les arguments d'exécution d'un périphérique. |
CUDASETDEVICE | cudaError_t cudaSetDevice(int dev) | Cette fonction permet de fixer le périphériques à utiliser pour l'exécution par le GPU. |
CUDASTREAMCREATE | cudaError_t cudaStreamCreate(cudaStream_t* stream) | Cette fonction permet de créer un flux sychronisé pour CUDA. |
CUDASTREAMDESTROY | cudaError_t cudaStreamDestroy(cudaStream_t stream) | Cette fonction permet d'effacer de nettoyer les résidues de l'objet de flux dans CUDA. |
CUDASTREAMQUERY | cudaError_t cudaStreamQuery(cudaStream_t stream) | Cette fonction permet d'effectuer une requête de flux afin d'atteindre un état précis. |
CUDASTREAMSYNCHRONIZE | cudaError_t cudaStreamSynchronize(cudaStream_t stream) | Cette fonction permet d'attendre qu'une tâche de flux soit complété. |
CUDATHREADEXIT | cudaError_t cudaThreadExit(void) | Cette fonction permet de faire sortir et d'enlever les processus lancés de CUDA. |
CUDATHREADSYNCHRONIZE | cudaError_t cudaThreadSynchronize(void) | Cette fonction permet d'attendre que le périphérique de calcul est terminé ses opérations. |
CUDAUNBINDTEXTURE | cudaError_t cudaUnbindTexture( const struct textureReference* texRef); | Cette fonction permet d'enlever le lien des structures de référence de texture de bas niveau. |
Dernière mise à jour : Vendredi, le 2 août 2013