compass/latest/carma__obj_8h_source.html

 // -----------------------------------------------------------------------------

 //  This file is part of COMPASS <https://anr-compass.github.io/compass/>

 //

 //  Copyright (C) 2011-2023 COMPASS Team <https://github.com/ANR-COMPASS>

 //  All rights reserved.


 // -----------------------------------------------------------------------------


 #ifndef _CARMA_OBJ_H_

 #define _CARMA_OBJ_H_


 #include <carma_context.h>

 #include <carma_streams.h>

 #include <carma_utils.h>

 #include <curand.h>

 #include <curand_kernel.h>

 #include <iostream>

 #include <type_traits>

 #include <typeinfo>  // operator typeid


 /*

  create a memory object

  void *memory

  int  nb of reference


  create a class which contains :

  - d_data

  - ndims

  - dims

  - strides

  - type


  new()


  new(existing)


  and then

  modify CarmaObj so that it is :

  an object of the previous class

  all the methods of a CarmaObj


  */


 #define BLOCK_SZ 16


 enum MemType {

   MT_DEVICE,

   MT_DARRAY,

   MT_HOST,

   MT_PAGELOCK,

   MT_ZEROCPY,

   MT_PORTABLE,

   MT_WRICOMB,

   MT_GENEPIN

 };

 // should add texture ?


 template <class T_data>

 class CarmaData {

  protected:

   T_data *d_data;

   int ndims;

   int nb_elem;

   long *dims_data;

   int *strides;

   MemType malloc_type;


  public:

   T_data *get_data() { return d_data; }

   int get_ndims() { return ndims; }

   int get_nb_elem() { return nb_elem; }

   const long *get_dims_data() { return dims_data; }

   long get_dims_data(int i) { return dims_data[i]; }

   int *get_strides() { return strides; }

   int get_strides(int i) { return strides[i]; }

   MemType get_malloc_type() { return malloc_type; }

 };


 template <class T_data>

 class CarmaHostObj;


 template <class T_data>

 class CarmaObj {

  protected:

   T_data *d_data = nullptr;

   std::vector<T_data> h_data;

   T_data *o_data = nullptr;

   T_data *cub_data = nullptr;

   size_t cub_data_size = 0;  // optionnal for reduction

   int ndim = 0;

   long *dims_data = nullptr;

   int nb_elem = 0;

   int device = -1;

   CarmaContext *current_context;


   curandGenerator_t gen;

   curandState *d_states;


   int nb_threads;

   int nb_blocks;


   bool keys_only;      //< optional flag (used for sort)

   bool owner = true;  // Flag if d_data is created inside the CarmaObj


   unsigned int *values;

   size_t *d_num_valid;


   cufftHandle plan;

   cufftType type_plan;


   CarmaStreams *streams;


   void init(CarmaContext *current_context, const long *dims_data,

             const T_data *data, bool fromHost, int nb_streams);


  public:

   CarmaObj();

   CarmaObj(const CarmaObj<T_data> *obj);

   CarmaObj(CarmaContext *current_context, const long *dims_data);

   CarmaObj(CarmaContext *current_context, const std::vector<long> &dims);

   CarmaObj(CarmaContext *current_context, const CarmaObj<T_data> *obj);

   CarmaObj(CarmaContext *current_context, const long *dims_data,

             const T_data *data);

   CarmaObj(CarmaContext *current_context, const long *dims_data,

             int nb_streams);

   CarmaObj(CarmaContext *current_context, const CarmaObj<T_data> *obj,

             int nb_streams);

   CarmaObj(CarmaContext *current_context, const long *dims_data,

             const T_data *data, int nb_streams);

   CarmaObj(const CarmaObj &)=delete;

   ~CarmaObj();


   void sync_h_data() {

     if (h_data.empty()) h_data = std::vector<T_data>(nb_elem);

     device2host(h_data.data());

   }


   T_data *get_h_data() { return h_data.data(); }


   int get_nb_streams() const {

     return streams->get_nb_streams();

   }

   int add_stream() {

     this->streams->add_stream();

     return this->streams->get_nb_streams();

   }

   int add_stream(int nb) {

     this->streams->add_stream(nb);

     return this->streams->get_nb_streams();

   }

   int del_stream() {

     this->streams->del_stream();

     return this->streams->get_nb_streams();

   }

   int del_stream(int nb) {

     this->streams->del_stream(nb);

     return this->streams->get_nb_streams();

   }

   cudaStream_t get_cuda_stream(int stream) {

     return this->streams->get_stream(stream);

   }

   int wait_stream(int stream) {

     this->streams->wait_stream(stream);

     return EXIT_SUCCESS;

   }

   int wait_all_streams() {

     this->streams->wait_all_streams();

     return EXIT_SUCCESS;

   }

   void swap_ptr(T_data *ptr) {

     dealloc();

     d_data = ptr;

     owner = false;

   }


   void dealloc() {

     if (owner && d_data) cudaFree(d_data);

   }


   operator T_data *() { return d_data; }


   std::string to_string() {

     std::ostringstream stream;

     stream << *this;

     return stream.str();

   }


   operator std::string() { return this->to_string(); }

   // inline char const *c_str() { return this->to_string().c_str(); }

   const T_data operator[](int index) const {

     T_data tmp_float;

     carma_safe_call(cudaMemcpy(&tmp_float, &d_data[index], sizeof(T_data),

                              cudaMemcpyDeviceToHost));

     return tmp_float;

   }

   T_data *get_data() { return d_data; }

   T_data *get_data_at(int index) { return &d_data[index]; }

   T_data *get_o_data() { return o_data; }

   const T_data get_o_data_value() const {

     T_data tmp_float;

     carma_safe_call(

         cudaMemcpy(&tmp_float, o_data, sizeof(T_data), cudaMemcpyDeviceToHost));

     return tmp_float;

   }

   const long *get_dims() { return dims_data; }

   long get_dims(int i) { return dims_data[i]; }

   int get_nb_elements() { return nb_elem; }

   CarmaContext *get_context() { return current_context; }


   int get_device() { return device; }


   bool is_rng_init() { return (gen != NULL); }


   template <typename T_dest>

   int host2device(const T_dest *data);

   template <typename T_dest>

   int device2host(T_dest *data);


   int host2device_async(const T_data *data, cudaStream_t stream);

   int device2host_async(T_data *data, cudaStream_t stream);

   int device2host_opt(T_data *data);

   int host2device_vect(const T_data *data, int incx, int incy);

   int device2host_vect(T_data *data, int incx, int incy);

   int host2device_mat(const T_data *data, int lda, int ldb);

   int device2host_mat(T_data *data, int lda, int ldb);


   int copy_into(T_data *data, int nb_elem);

   int copy_from(const T_data *data, int nb_elem);

   int copy_from_async(const T_data *data, int nb_elem, cudaStream_t stream);


 #ifdef USE_OCTOPUS

   int copy_into(ipc::Cacao<T_data> *cacaoInterface);

   int copy_from(ipc::Cacao<T_data> *cacaoInterface);

 #endif


   inline int reset() {

     return cudaMemset(this->d_data, 0, this->nb_elem * sizeof(T_data));

   }


   inline int reset(cudaStream_t stream) {

     return cudaMemsetAsync(this->d_data, 0, this->nb_elem * sizeof(T_data), stream);

   }


   inline int memset(T_data value) {

     return fill_array_with_value(

         this->d_data, value, this->nb_elem,

         this->current_context->get_device(this->device));

   }

   cufftHandle *get_plan() { return &plan; }

   cufftType get_type_plan() { return type_plan; }


   unsigned int *get_values() { return values; }


   T_data sum();

   void init_reduceCub();

   void reduceCub(cudaStream_t stream);

   void reduceCub() {reduceCub(0);};


   void clip(T_data min, T_data max, cudaStream_t stream);

   void clip(T_data min, T_data max) {clip(min, max, 0);};


   int transpose(CarmaObj<T_data> *source);

   // CarmaObj<T_data>& operator= (const CarmaObj<T_data>& obj);


   /*

    *  ____  _        _    ____  _

    * | __ )| |      / \  / ___|/ |

    * |  _ \| |     / _ \ \___ \| |

    * | |_) | |___ / ___ \ ___) | |

    * |____/|_____/_/   \_\____/|_|

    *

    */


   int aimax(int incx);

   int aimin(int incx);

   T_data asum(int incx);

   T_data nrm2(int incx);

   T_data dot(CarmaObj<T_data> *source, int incx, int incy);

   void scale(T_data alpha, int incx);

   void swap(CarmaObj<T_data> *source, int incx, int incy);

   void copy(CarmaObj<T_data> *source, int incx, int incy);

   void axpy(T_data alpha, CarmaObj<T_data> *source, int incx, int incy,

             int offset = 0);

   void rot(CarmaObj<T_data> *source, int incx, int incy, T_data sc, T_data ss);


   /*

    *  ____  _        _    ____ ____

    * | __ )| |      / \  / ___|___ \

    * |  _ \| |     / _ \ \___ \ __) |

    * | |_) | |___ / ___ \ ___) / __/

    * |____/|_____/_/   \_\____/_____|

    *

    */


   void gemv(char trans, T_data alpha, CarmaObj<T_data> *matA, int lda,

             CarmaObj<T_data> *vectx, int incx, T_data beta, int incy);

   void ger(T_data alpha, CarmaObj<T_data> *vectx, int incx,

            CarmaObj<T_data> *vecty, int incy, int lda);

   void symv(char uplo, T_data alpha, CarmaObj<T_data> *matA, int lda,

             CarmaObj<T_data> *vectx, int incx, T_data beta, int incy);


   /*

    *  ____  _        _    ____ _____

    * | __ )| |      / \  / ___|___ /

    * |  _ \| |     / _ \ \___ \ |_ \

    * | |_) | |___ / ___ \ ___) |__) |

    * |____/|_____/_/   \_\____/____/

    *

    */


   void gemm(char transa, char transb, T_data alpha, CarmaObj<T_data> *matA,

             int lda, CarmaObj<T_data> *matB, int ldb, T_data beta, int ldc);

   void symm(char side, char uplo, T_data alpha, CarmaObj<T_data> *matA,

             int lda, CarmaObj<T_data> *matB, int ldb, T_data beta, int ldc);

   void syrk(char uplo, char transa, T_data alpha, CarmaObj<T_data> *matA,

             int lda, T_data beta, int ldc);

   void syrkx(char uplo, char transa, T_data alpha, CarmaObj<T_data> *matA,

              int lda, CarmaObj<T_data> *matB, int ldb, T_data beta, int ldc);

   void geam(char transa, char transb, T_data alpha, CarmaObj<T_data> *matA,

             int lda, T_data beta, CarmaObj<T_data> *matB, int ldb, int ldc);

   void dgmm(char side, CarmaObj<T_data> *matA, int lda,

             CarmaObj<T_data> *vectx, int incx, int ldc);


   int init_prng();

   int init_prng(long seed);

   int destroy_prng();

   int prng(T_data *output, char gtype, float alpha, float beta);

   int prng(T_data *output, char gtype, float alpha);

   int prng(char gtype, float alpha, float beta);

   int prng(char gtype, float alpha);

   int prng(char gtype);


   int prng_montagn(float init_montagn);


   int init_prng_host(int seed);

   int prng_host(char gtype);

   int prng_host(char gtype, T_data stddev);

   int prng_host(char gtype, T_data stddev, T_data alpha);

   int destroy_prng_host();

 };

 typedef CarmaObj<int> CarmaObjI;

 typedef CarmaObj<unsigned int> CarmaObjUI;

 typedef CarmaObj<uint16_t> CarmaObjUSI;

 typedef CarmaObj<float> CarmaObjS;

 typedef CarmaObj<double> CarmaObjD;

 typedef CarmaObj<float2> CarmaObjS2;

 typedef CarmaObj<double2> CarmaObjD2;

 typedef CarmaObj<cuFloatComplex> CarmaObjC;

 typedef CarmaObj<cuDoubleComplex> CarmaObjZ;

 // typedef CarmaObj<tuple_t<float>> CarmaObjTF;


 #ifdef CAN_DO_HALF

 typedef CarmaObj<half> CarmaObjH;

 #endif


 template <class T_data>

 std::ostream &operator<<(std::ostream &os, CarmaObj<T_data> &obj) {

   os << "-----------------------" << std::endl;

   os << "CarmaObj<" << typeid(T_data).name() << "> object on GPU"

      << obj.get_device() << std::endl;

   long ndims = obj.get_dims(0);

   os << "ndims = " << ndims << std::endl;

   for (long dim = 0; dim < ndims; dim++) {

     os << "dim[" << dim << "] = " << obj.get_dims(dim + 1) << std::endl;

   }

   os << "nbElem = " << obj.get_nb_elements() << std::endl;

   os << "sizeof(" << typeid(T_data).name() << ") = " << sizeof(T_data)

      << std::endl;

   os << "-----------------------" << std::endl;

   return os;

 }


 // CU functions clip

 template <class T_data>

 void clip_array(T_data *d_data, T_data min, T_data max, int N,

                 CarmaDevice *device, cudaStream_t stream);


 // CU functions sum

 template <class T_data>

 void reduce(int size, int threads, int blocks, T_data *d_idata,

             T_data *d_odata);

 template <class T_data>

 T_data reduce(T_data *data, int N);


 template <class T_data>

 void init_reduceCubCU(T_data *&cub_data, size_t &cub_data_size, T_data *data,

                       T_data *&o_data, int N);

 template <class T_data>

 void reduceCubCU(T_data *cub_data, size_t cub_data_size, T_data *data,

                  T_data *o_data, int N, cudaStream_t stream=0);


 // CU functions transpose

 template <class T_data>

 int transposeCU(T_data *d_idata, T_data *d_odata, long N1, long N2);


 // CU functions generic

 template <class T_data>

 int launch_generic1d(T_data *d_idata, T_data *d_odata, int N,

                      CarmaDevice *device);

 template <class T_data>

 int launch_generic2d(T_data *d_odata, T_data *d_idata, int N1, int N2);


 // CU functions curand

 int carma_prng_init(int *seed, const int nb_threads, const int nb_blocks,

                     curandState *state);

 template <class T>

 int carma_prng_cu(T *results, const int nb_threads, const int nb_blocks,

                   curandState *state, char gtype, int n, float alpha,

                   float beta);

 template <class T>

 int carma_curand_montagn(curandState *state, T *d_odata, int N,

                          CarmaDevice *device);


 // CU functions fft

 template <class T_in, class T_out>

 cufftType carma_select_plan();

 template <class T_in, class T_out>

 void carma_initfft(const long *dims_data, cufftHandle *plan, cufftType type_plan);

 template <class T_in, class T_out>

 int CarmaFFT(T_in *input, T_out *output, int dir, cufftHandle plan);


 // CU functions generic

 template <class T_data>

 int fillindex(T_data *d_odata, T_data *d_idata, int *indx, int N,

               CarmaDevice *device);

 template <class T_data>

 int fillvalues(T_data *d_odata, T_data *val, int N, CarmaDevice *device);

 template <class T>

 int getarray2d(T *d_odata, T *d_idata, int x0, int Ncol, int NC, int N,

                CarmaDevice *device);

 template <class T>

 int fillarray2d(T *d_odata, T *d_idata, int x0, int Ncol, int NC, int N,

                 CarmaDevice *device);

 template <class T>

 int fillarray2d2(T *d_odata, T *d_idata, int x0, int Ncol, int NC, int N,

                  CarmaDevice *device);

 template <class T>

 int fill_sym_matrix(char src_uplo, T *d_data, int Ncol, int N,

                     CarmaDevice *device);

 template <class T>

 int carma_plus(T *d_odata, T elpha, int N, CarmaDevice *device);

 template <class T>

 int carma_plusai(T *d_odata, T *i_data, int i, int sgn, int N,

                  CarmaDevice *device);


 // CU functions fftconv

 // int fftconv_unpad(float *d_odata, float *d_idata, int fftW, int dataH,

 //                   int dataW, int N, int n, int nim);

 // int carma_initfftconv(CarmaObjS *data_in, CarmaObjS *kernel_in, CarmaObjS *padded_data,

 //                       CarmaObjC *padded_spectrum, int kernelY, int kernelX);

 // // CPP functions fftconv

 // int carma_fftconv(CarmaObjS *data_out, CarmaObjS *padded_data,

 //                   CarmaObjC *padded_spectrum, int kernelY, int kernelX);


 #ifdef CAN_DO_HALF

 int custom_half_axpy(half alpha, half *source, int incx, int incy, int N,

                      half *dest, CarmaDevice *device);

 #endif


 template <class T>

 int extract(T *d_smallimg, const T *d_fullimg, int fullimg_size, int center_pos,

             int extract_size, bool roll);


 #endif  // _CARMA_OBJ_H_

carma_context.h

fill_sym_matrix
int fill_sym_matrix(char src_uplo, T *d_data, int Ncol, int N, CarmaDevice *device)

carma_select_plan
cufftType carma_select_plan()

CarmaObjUSI
CarmaObj< uint16_t > CarmaObjUSI
Definition: carma_obj.h:362

launch_generic1d
int launch_generic1d(T_data *d_idata, T_data *d_odata, int N, CarmaDevice *device)

CarmaObjD2
CarmaObj< double2 > CarmaObjD2
Definition: carma_obj.h:366

carma_initfft
void carma_initfft(const long *dims_data, cufftHandle *plan, cufftType type_plan)

operator<<
std::ostream & operator<<(std::ostream &os, CarmaObj< T_data > &obj)
Definition: carma_obj.h:376

transposeCU
int transposeCU(T_data *d_idata, T_data *d_odata, long N1, long N2)

CarmaObjS2
CarmaObj< float2 > CarmaObjS2
Definition: carma_obj.h:365

CarmaObjUI
CarmaObj< unsigned int > CarmaObjUI
Definition: carma_obj.h:361

CarmaObjI
CarmaObj< int > CarmaObjI
Definition: carma_obj.h:360

reduceCubCU
void reduceCubCU(T_data *cub_data, size_t cub_data_size, T_data *data, T_data *o_data, int N, cudaStream_t stream=0)

getarray2d
int getarray2d(T *d_odata, T *d_idata, int x0, int Ncol, int NC, int N, CarmaDevice *device)

CarmaObjC
CarmaObj< cuFloatComplex > CarmaObjC
Definition: carma_obj.h:367

fillindex
int fillindex(T_data *d_odata, T_data *d_idata, int *indx, int N, CarmaDevice *device)

init_reduceCubCU
void init_reduceCubCU(T_data *&cub_data, size_t &cub_data_size, T_data *data, T_data *&o_data, int N)

carma_plus
int carma_plus(T *d_odata, T elpha, int N, CarmaDevice *device)

fillarray2d2
int fillarray2d2(T *d_odata, T *d_idata, int x0, int Ncol, int NC, int N, CarmaDevice *device)

reduce
void reduce(int size, int threads, int blocks, T_data *d_idata, T_data *d_odata)

extract
int extract(T *d_smallimg, const T *d_fullimg, int fullimg_size, int center_pos, int extract_size, bool roll)
Kernel to extract a part of the image centred on center_pos.

carma_prng_cu
int carma_prng_cu(T *results, const int nb_threads, const int nb_blocks, curandState *state, char gtype, int n, float alpha, float beta)

fillarray2d
int fillarray2d(T *d_odata, T *d_idata, int x0, int Ncol, int NC, int N, CarmaDevice *device)

CarmaObjD
CarmaObj< double > CarmaObjD
Definition: carma_obj.h:364

carma_plusai
int carma_plusai(T *d_odata, T *i_data, int i, int sgn, int N, CarmaDevice *device)

MemType
MemType
Definition: carma_obj.h:55

MT_PORTABLE
@ MT_PORTABLE
Definition: carma_obj.h:61

MT_DARRAY
@ MT_DARRAY
Definition: carma_obj.h:57

MT_GENEPIN
@ MT_GENEPIN
Definition: carma_obj.h:63

MT_DEVICE
@ MT_DEVICE
Definition: carma_obj.h:56

MT_PAGELOCK
@ MT_PAGELOCK
Definition: carma_obj.h:59

MT_HOST
@ MT_HOST
Definition: carma_obj.h:58

MT_WRICOMB
@ MT_WRICOMB
Definition: carma_obj.h:62

MT_ZEROCPY
@ MT_ZEROCPY
Definition: carma_obj.h:60

clip_array
void clip_array(T_data *d_data, T_data min, T_data max, int N, CarmaDevice *device, cudaStream_t stream)

CarmaObjZ
CarmaObj< cuDoubleComplex > CarmaObjZ
Definition: carma_obj.h:368

fillvalues
int fillvalues(T_data *d_odata, T_data *val, int N, CarmaDevice *device)

CarmaFFT
int CarmaFFT(T_in *input, T_out *output, int dir, cufftHandle plan)

carma_curand_montagn
int carma_curand_montagn(curandState *state, T *d_odata, int N, CarmaDevice *device)

CarmaObjS
CarmaObj< float > CarmaObjS
Definition: carma_obj.h:363

launch_generic2d
int launch_generic2d(T_data *d_odata, T_data *d_idata, int N1, int N2)

carma_prng_init
int carma_prng_init(int *seed, const int nb_threads, const int nb_blocks, curandState *state)

carma_streams.h

carma_utils.h
this file provides tools to CarmaObj

fill_array_with_value
int fill_array_with_value(T_data *d_data, T_data value, int N, CarmaDevice *device)

carma_safe_call
#define carma_safe_call(err)
Definition: carma_utils.h:108

CarmaContext
this class provides the context in which CarmaObj are created
Definition: carma_context.h:79

CarmaContext::get_device
CarmaDevice * get_device(int dev)
Definition: carma_context.h:107

CarmaData
Definition: carma_obj.h:68

CarmaData::get_malloc_type
MemType get_malloc_type()
Definition: carma_obj.h:85

CarmaData::get_data
T_data * get_data()
Definition: carma_obj.h:78

CarmaData::strides
int * strides
Strides for each dimension.
Definition: carma_obj.h:74

CarmaData::d_data
T_data * d_data
Pointer to data.
Definition: carma_obj.h:70

CarmaData::get_dims_data
const long * get_dims_data()
Definition: carma_obj.h:81

CarmaData::get_strides
int get_strides(int i)
Definition: carma_obj.h:84

CarmaData::get_ndims
int get_ndims()
Definition: carma_obj.h:79

CarmaData::ndims
int ndims
Number of dimensions.
Definition: carma_obj.h:71

CarmaData::get_dims_data
long get_dims_data(int i)
Definition: carma_obj.h:82

CarmaData::malloc_type
MemType malloc_type
type of alloc
Definition: carma_obj.h:75

CarmaData::get_strides
int * get_strides()
Definition: carma_obj.h:83

CarmaData::get_nb_elem
int get_nb_elem()
Definition: carma_obj.h:80

CarmaData::dims_data
long * dims_data
Dimensions.
Definition: carma_obj.h:73

CarmaData::nb_elem
int nb_elem
Number of elements.
Definition: carma_obj.h:72

CarmaDevice
Definition: carma_context.h:33

CarmaHostObj
this class provides wrappers to the generic carma host object
Definition: carma_host_obj.h:43

CarmaObj
this class provides wrappers to the generic carma object
Definition: carma_obj.h:92

CarmaObj::get_cuda_stream
cudaStream_t get_cuda_stream(int stream)
Definition: carma_obj.h:170

CarmaObj::dealloc
void dealloc()
Definition: carma_obj.h:187

CarmaObj::CarmaObj
CarmaObj(CarmaContext *current_context, const long *dims_data, int nb_streams)

CarmaObj::nb_elem
int nb_elem
number of elements in the array
Definition: carma_obj.h:101

CarmaObj::cub_data
T_data * cub_data
optional data (used for scan / reduction)
Definition: carma_obj.h:97

CarmaObj::get_data_at
T_data * get_data_at(int index)
Definition: carma_obj.h:209

CarmaObj::device2host_opt
int device2host_opt(T_data *data)

CarmaObj::prng_host
int prng_host(char gtype, T_data stddev, T_data alpha)

CarmaObj::get_context
CarmaContext * get_context()
Definition: carma_obj.h:220

CarmaObj::CarmaObj
CarmaObj()

CarmaObj::copy
void copy(CarmaObj< T_data > *source, int incx, int incy)

CarmaObj::CarmaObj
CarmaObj(const CarmaObj< T_data > *obj)

CarmaObj::streams
CarmaStreams * streams
Definition: carma_obj.h:120

CarmaObj::get_h_data
T_data * get_h_data()
Definition: carma_obj.h:147

CarmaObj::get_type_plan
cufftType get_type_plan()
FFT plan type.
Definition: carma_obj.h:264

CarmaObj::get_dims
long get_dims(int i)
Definition: carma_obj.h:218

CarmaObj::CarmaObj
CarmaObj(CarmaContext *current_context, const long *dims_data)

CarmaObj::syrk
void syrk(char uplo, char transa, T_data alpha, CarmaObj< T_data > *matA, int lda, T_data beta, int ldc)

CarmaObj::wait_stream
int wait_stream(int stream)
Definition: carma_obj.h:173

CarmaObj::CarmaObj
CarmaObj(const CarmaObj &)=delete

CarmaObj::prng
int prng(char gtype)

CarmaObj::operator[]
const T_data operator[](int index) const
Definition: carma_obj.h:202

CarmaObj::aimax
int aimax(int incx)

CarmaObj::CarmaObj
CarmaObj(CarmaContext *current_context, const std::vector< long > &dims)

CarmaObj::current_context
CarmaContext * current_context
Definition: carma_obj.h:103

CarmaObj::init_reduceCub
void init_reduceCub()

CarmaObj::reduceCub
void reduceCub()
Definition: carma_obj.h:272

CarmaObj::nb_blocks
int nb_blocks
Definition: carma_obj.h:109

CarmaObj::axpy
void axpy(T_data alpha, CarmaObj< T_data > *source, int incx, int incy, int offset=0)

CarmaObj::host2device_mat
int host2device_mat(const T_data *data, int lda, int ldb)

CarmaObj::swap_ptr
void swap_ptr(T_data *ptr)
Definition: carma_obj.h:181

CarmaObj::CarmaObj
CarmaObj(CarmaContext *current_context, const long *dims_data, const T_data *data, int nb_streams)

CarmaObj::gemm
void gemm(char transa, char transb, T_data alpha, CarmaObj< T_data > *matA, int lda, CarmaObj< T_data > *matB, int ldb, T_data beta, int ldc)

CarmaObj::dgmm
void dgmm(char side, CarmaObj< T_data > *matA, int lda, CarmaObj< T_data > *vectx, int incx, int ldc)

CarmaObj::device2host
int device2host(T_dest *data)

CarmaObj::sum
T_data sum()

CarmaObj::init_prng_host
int init_prng_host(int seed)

CarmaObj::device2host_mat
int device2host_mat(T_data *data, int lda, int ldb)

CarmaObj::symm
void symm(char side, char uplo, T_data alpha, CarmaObj< T_data > *matA, int lda, CarmaObj< T_data > *matB, int ldb, T_data beta, int ldc)

CarmaObj::values
unsigned int * values
optional data (used for sort)
Definition: carma_obj.h:114

CarmaObj::d_num_valid
size_t * d_num_valid
used for compact
Definition: carma_obj.h:115

CarmaObj::copy_from
int copy_from(const T_data *data, int nb_elem)

CarmaObj::aimin
int aimin(int incx)

CarmaObj::prng_host
int prng_host(char gtype)

CarmaObj::nrm2
T_data nrm2(int incx)

CarmaObj::copy_from_async
int copy_from_async(const T_data *data, int nb_elem, cudaStream_t stream)

CarmaObj::clip
void clip(T_data min, T_data max, cudaStream_t stream)

CarmaObj::CarmaObj
CarmaObj(CarmaContext *current_context, const long *dims_data, const T_data *data)

CarmaObj::dot
T_data dot(CarmaObj< T_data > *source, int incx, int incy)

CarmaObj::geam
void geam(char transa, char transb, T_data alpha, CarmaObj< T_data > *matA, int lda, T_data beta, CarmaObj< T_data > *matB, int ldb, int ldc)

CarmaObj::owner
bool owner
Definition: carma_obj.h:112

CarmaObj::destroy_prng
int destroy_prng()

CarmaObj::CarmaObj
CarmaObj(CarmaContext *current_context, const CarmaObj< T_data > *obj, int nb_streams)

CarmaObj::symv
void symv(char uplo, T_data alpha, CarmaObj< T_data > *matA, int lda, CarmaObj< T_data > *vectx, int incx, T_data beta, int incy)

CarmaObj::memset
int memset(T_data value)
Definition: carma_obj.h:257

CarmaObj::del_stream
int del_stream(int nb)
Definition: carma_obj.h:166

CarmaObj::get_plan
cufftHandle * get_plan()
FFT plan.
Definition: carma_obj.h:262

CarmaObj::swap
void swap(CarmaObj< T_data > *source, int incx, int incy)

CarmaObj::prng
int prng(char gtype, float alpha)

CarmaObj::del_stream
int del_stream()
Definition: carma_obj.h:162

CarmaObj::is_rng_init
bool is_rng_init()
Definition: carma_obj.h:224

CarmaObj::gemv
void gemv(char trans, T_data alpha, CarmaObj< T_data > *matA, int lda, CarmaObj< T_data > *vectx, int incx, T_data beta, int incy)

CarmaObj::asum
T_data asum(int incx)

CarmaObj::syrkx
void syrkx(char uplo, char transa, T_data alpha, CarmaObj< T_data > *matA, int lda, CarmaObj< T_data > *matB, int ldb, T_data beta, int ldc)

CarmaObj::device2host_async
int device2host_async(T_data *data, cudaStream_t stream)

CarmaObj::copy_into
int copy_into(T_data *data, int nb_elem)

CarmaObj::init_prng
int init_prng()

CarmaObj::host2device
int host2device(const T_dest *data)

CarmaObj::to_string
std::string to_string()
Definition: carma_obj.h:194

CarmaObj::prng
int prng(char gtype, float alpha, float beta)

CarmaObj::d_data
T_data * d_data
Input data => change to vector.
Definition: carma_obj.h:94

CarmaObj::keys_only
bool keys_only
Definition: carma_obj.h:111

CarmaObj::prng_montagn
int prng_montagn(float init_montagn)

CarmaObj::get_nb_streams
int get_nb_streams() const
Definition: carma_obj.h:149

CarmaObj::transpose
int transpose(CarmaObj< T_data > *source)

CarmaObj::device2host_vect
int device2host_vect(T_data *data, int incx, int incy)

CarmaObj::type_plan
cufftType type_plan
FFT plan type.
Definition: carma_obj.h:118

CarmaObj::get_data
T_data * get_data()
Definition: carma_obj.h:208

CarmaObj::add_stream
int add_stream()
Definition: carma_obj.h:154

CarmaObj::scale
void scale(T_data alpha, int incx)

CarmaObj::host2device_async
int host2device_async(const T_data *data, cudaStream_t stream)

CarmaObj::destroy_prng_host
int destroy_prng_host()

CarmaObj::nb_threads
int nb_threads
Definition: carma_obj.h:108

CarmaObj::sync_h_data
void sync_h_data()
Definition: carma_obj.h:142

CarmaObj::ger
void ger(T_data alpha, CarmaObj< T_data > *vectx, int incx, CarmaObj< T_data > *vecty, int incy, int lda)

CarmaObj::ndim
int ndim
Definition: carma_obj.h:99

CarmaObj::reset
int reset(cudaStream_t stream)
Definition: carma_obj.h:253

CarmaObj::add_stream
int add_stream(int nb)
Definition: carma_obj.h:158

CarmaObj::wait_all_streams
int wait_all_streams()
Definition: carma_obj.h:177

CarmaObj::device
int device
device where the CarmaObj is allocate
Definition: carma_obj.h:102

CarmaObj::~CarmaObj
~CarmaObj()

CarmaObj::dims_data
long * dims_data
dimensions of the array
Definition: carma_obj.h:100

CarmaObj::reset
int reset()
Definition: carma_obj.h:249

CarmaObj::CarmaObj
CarmaObj(CarmaContext *current_context, const CarmaObj< T_data > *obj)

CarmaObj::prng
int prng(T_data *output, char gtype, float alpha, float beta)

CarmaObj::h_data
std::vector< T_data > h_data
Definition: carma_obj.h:95

CarmaObj::init
void init(CarmaContext *current_context, const long *dims_data, const T_data *data, bool fromHost, int nb_streams)

CarmaObj::cub_data_size
size_t cub_data_size
Definition: carma_obj.h:98

CarmaObj::rot
void rot(CarmaObj< T_data > *source, int incx, int incy, T_data sc, T_data ss)

CarmaObj::o_data
T_data * o_data
optional data (used for scan / reduction)
Definition: carma_obj.h:96

CarmaObj::get_values
unsigned int * get_values()
optional data (used for sort)
Definition: carma_obj.h:267

CarmaObj::gen
curandGenerator_t gen
Definition: carma_obj.h:105

CarmaObj::get_o_data
T_data * get_o_data()
Definition: carma_obj.h:210

CarmaObj::plan
cufftHandle plan
FFT plan.
Definition: carma_obj.h:117

CarmaObj::get_o_data_value
const T_data get_o_data_value() const
Definition: carma_obj.h:211

CarmaObj::host2device_vect
int host2device_vect(const T_data *data, int incx, int incy)

CarmaObj::get_dims
const long * get_dims()
Definition: carma_obj.h:217

CarmaObj::get_nb_elements
int get_nb_elements()
Definition: carma_obj.h:219

CarmaObj::get_device
int get_device()
Definition: carma_obj.h:222

CarmaObj::d_states
curandState * d_states
Definition: carma_obj.h:106

CarmaStreams
this class provides the stream features to CarmaObj
Definition: carma_streams.h:24

CarmaStreams::wait_stream
int wait_stream(int stream)

CarmaStreams::get_nb_streams
int get_nb_streams()

CarmaStreams::wait_all_streams
int wait_all_streams()

CarmaStreams::add_stream
int add_stream()

CarmaStreams::del_stream
int del_stream()

CarmaStreams::get_stream
cudaStream_t get_stream(int stream)

roll
int roll(T *idata, int N, int M, int nim, CarmaDevice *device)