tachyon/doxygen/threads_8h_source.html

 /*
  * threads.h - platform-dependent CPU feature query, threads, and atomic ops
  *
  * (C) Copyright 1994-2022 John E. Stone
  * SPDX-License-Identifier: BSD-3-Clause
  *
  * $Id: threads.h,v 1.67 2022/02/21 16:45:19 johns Exp $
  *
  */

 /*
  * XXX will need to rename threads.[ch] src to avoid collision with
  * the new headers included in the C11 standard and later
  */

 #ifndef RT_THREADS_INC
 #define RT_THREADS_INC 1

 #ifdef __cplusplus
 extern "C" {
 #endif

 /* define which thread calls to use */
 #if defined(USEPOSIXTHREADS) && defined(USEUITHREADS)
 #error You may only define USEPOSIXTHREADS or USEUITHREADS, but not both
 #endif

 /* POSIX Threads */
 #if defined(_AIX) || defined(__APPLE__) || defined(_CRAY) || defined(__hpux) || defined(__irix) || defined(__linux) || defined(__osf__) ||  defined(__PARAGON__)
 #if !defined(USEUITHREADS) && !defined(USEPOSIXTHREADS)
 #define USEPOSIXTHREADS
 #endif
 #endif

 /* Unix International Threads */
 #if defined(SunOS)
 #if !defined(USEPOSIXTHREADS) && !defined(USEUITHREADS)
 #define USEUITHREADS
 #endif
 #endif

 /*
  * CPU capability flags
  */
 #define CPU_SMTDEPTH_UNKNOWN           0
 #define CPU_UNKNOWN           0x00000001
 /* Intel x86 CPU features we may need at runtime */
 #define CPU_HT                0x00000010
 #define CPU_HYPERVISOR        0x00000020
 #define CPU_SSE2              0x00000100
 #define CPU_SSE4_1            0x00000200
 #define CPU_F16C              0x00000400
 #define CPU_FMA               0x00000800
 #define CPU_AVX               0x00001000
 #define CPU_AVX2              0x00002000
 #define CPU_AVX512F           0x00010000
 #define CPU_AVX512CD          0x00020000
 #define CPU_AVX512ER          0x00040000
 #define CPU_AVX512PF          0x00080000
 #define CPU_KNL         (CPU_AVX512F | CPU_AVX512CD | \
                          CPU_AVX512ER | CPU_AVX512PF)
 /* ARM CPU features we may need at runtime */
 #define CPU_ARM64_CPUID       0x00000010
 #define CPU_ARM64_CRC32       0x00000020
 #define CPU_ARM64_FP          0x00000080
 #define CPU_ARM64_HPFP        0x00000080
 #define CPU_ARM64_AES         0x00000100
 #define CPU_ARM64_ATOMICS     0x00000200
 #define CPU_ARM64_ASIMD       0x00000400
 #define CPU_ARM64_ASIMDDP     0x00000800
 #define CPU_ARM64_ASIMDHP     0x00001000
 #define CPU_ARM64_ASIMDRDM    0x00002000
 #define CPU_ARM64_ASIMDFHM    0x00004000
 #define CPU_ARM64_SVE         0x00008000
 #define CPU_ARM64_SHA512      0x00010000
 #define CPU_ARM64_SHA1        0x00020000
 #define CPU_ARM64_SHA2        0x00040000
 #define CPU_ARM64_SHA3        0x00080000
 typedef struct rt_cpu_caps_struct {
   unsigned int flags;
   int smtdepth;
 } rt_cpu_caps_t;


 #ifdef THR
 #ifdef USEPOSIXTHREADS
 #include <pthread.h>

 typedef pthread_t        rt_thread_t;
 typedef pthread_mutex_t   rt_mutex_t;
 typedef pthread_cond_t     rt_cond_t;
 typedef struct rwlock_struct {
   pthread_mutex_t lock;
   int rwlock;
   pthread_cond_t  rdrs_ok;
   unsigned int waiting_writers;
   pthread_cond_t  wrtr_ok;
 } rt_rwlock_t;

 #endif

 #ifdef USEUITHREADS
 #include <thread.h>

 typedef thread_t  rt_thread_t;
 typedef mutex_t   rt_mutex_t;
 typedef cond_t    rt_cond_t;
 typedef rwlock_t  rt_rwlock_t;
 #endif


 #ifdef _MSC_VER
 #include <windows.h>
 typedef HANDLE rt_thread_t;
 typedef CRITICAL_SECTION rt_mutex_t;

 #if 0 && (NTDDI_VERSION >= NTDDI_WS08 || _WIN32_WINNT > 0x0600)
 /* Use native condition variables only with Windows Server 2008 and newer... */
 #define RTUSEWIN2008CONDVARS 1
 typedef CONDITION_VARIABLE rt_cond_t;
 #else
 /* Every version of Windows prior to Vista/WS2008 must emulate */
 /* variables using manually resettable events or other schemes */

 /* For higher performance, use interlocked memory operations   */
 /* rather than locking/unlocking mutexes when manipulating     */
 /* internal state.                                             */
 #if 1
 #define RTUSEINTERLOCKEDATOMICOPS 1
 #endif
 #define RT_COND_SIGNAL    0
 #define RT_COND_BROADCAST 1
 typedef struct {
   LONG waiters;
   CRITICAL_SECTION waiters_lock;
   HANDLE events[2];
 } rt_cond_t;
 #endif

 typedef struct rwlock_struct {
   rt_mutex_t lock;
   int rwlock;
   rt_cond_t  rdrs_ok;
   unsigned int waiting_writers;
   rt_cond_t  wrtr_ok;
 } rt_rwlock_t;

 #endif
 #endif /* _MSC_VER */


 #ifndef THR
 typedef int rt_thread_t;
 typedef int rt_mutex_t;
 typedef int rt_cond_t;
 typedef int rt_rwlock_t;
 #endif

 #if defined(USENETBSDATOMICS)
 #include <sys/atomic.h>
 #elif defined(USESOLARISATOMICS)
 #include <atomic.h>
 #endif

 typedef struct atomic_int_struct {
   int padding1[8];
   rt_mutex_t lock;
 #if defined(USENETBSDATOMICS)
   unsigned int val;
 #elif defined(USESOLARISATOMICS)
   unsigned int val;
 #elif defined(USEWIN32ATOMICS)
   LONG val;
 #else
   int val;
 #endif
   int padding2[8];
 } rt_atomic_int_t;


 typedef struct barrier_struct {
   int padding1[8];
   rt_mutex_t lock;
   int n_clients;
   int n_waiting;
   int phase;
   int sum;
   int result;
   rt_cond_t wait_cv;
   int padding2[8];
 } rt_barrier_t;


 typedef struct rt_run_barrier_struct {
   int padding1[8];
   rt_mutex_t lock;
   int n_clients;
   int n_waiting;
   int phase;
   void * (*fctn)(void *);
   void * parms;
   void * (*rslt)(void *);
   void * rsltparms;
   rt_cond_t wait_cv;
   int padding2[8];
 } rt_run_barrier_t;


 /*
  * Routines for querying processor counts, and managing CPU affinity
  */
 int rt_thread_numphysprocessors(void);

 int rt_thread_numprocessors(void);

 int rt_cpu_capability_flags(rt_cpu_caps_t *cpucaps);

 /* A return value of zero means we don't know */
 int rt_cpu_smt_depth(void);

 int * rt_cpu_affinitylist(int *cpuaffinitycount);

 int rt_thread_set_self_cpuaffinity(int cpu);

 int rt_thread_setconcurrency(int);


 /*
  * Thread management
  */
 int rt_thread_create(rt_thread_t *, void * fctn(void *), void *);

 int rt_thread_join(rt_thread_t, void **);


 /*
  * Mutex management
  */
 int rt_mutex_init(rt_mutex_t *);

 int rt_mutex_lock(rt_mutex_t *);

 int rt_mutex_trylock(rt_mutex_t *);

 int rt_mutex_spin_lock(rt_mutex_t *);

 int rt_mutex_unlock(rt_mutex_t *);

 int rt_mutex_destroy(rt_mutex_t *);


 /*
  * Condition variable management
  */
 int rt_cond_init(rt_cond_t *);

 int rt_cond_destroy(rt_cond_t *);

 int rt_cond_wait(rt_cond_t *, rt_mutex_t *);

 int rt_cond_signal(rt_cond_t *);

 int rt_cond_broadcast(rt_cond_t *);


 /*
  * Atomic operations on integers
  */
 int rt_atomic_int_init(rt_atomic_int_t * atomp, int val);

 int rt_atomic_int_destroy(rt_atomic_int_t * atomp);

 int rt_atomic_int_set(rt_atomic_int_t * atomp, int val);

 int rt_atomic_int_get(rt_atomic_int_t * atomp);

 int rt_atomic_int_fetch_and_add(rt_atomic_int_t * atomp, int inc);

 int rt_atomic_int_add_and_fetch(rt_atomic_int_t * atomp, int inc);


 /*
  * Reader/writer lock management
  */
 int rt_rwlock_init(rt_rwlock_t *);

 int rt_rwlock_readlock(rt_rwlock_t *);

 int rt_rwlock_writelock(rt_rwlock_t *);

 int rt_rwlock_unlock(rt_rwlock_t *);


 /*
  * counting barrier
  */
 rt_barrier_t * rt_thread_barrier_init(int n_clients);

 int rt_thread_barrier_init_proc_shared(rt_barrier_t *, int n_clients);

 void rt_thread_barrier_destroy(rt_barrier_t *barrier);

 int rt_thread_barrier(rt_barrier_t *barrier, int increment);


 /*
  * This is a symmetric barrier routine designed to be used
  * in implementing a sleepable thread pool.
  */
 int rt_thread_run_barrier_init(rt_run_barrier_t *barrier, int n_clients);

 void rt_thread_run_barrier_destroy(rt_run_barrier_t *barrier);

 void * (*rt_thread_run_barrier(rt_run_barrier_t *barrier,
                                 void * fctn(void*),
                                 void * parms,
                                 void **rsltparms))(void *);

 int rt_thread_run_barrier_poll(rt_run_barrier_t *barrier);


 typedef struct rt_tasktile_struct {
   int start;
   int end;
 } rt_tasktile_t;


 /*
  * tile stack
  */
 #define RT_TILESTACK_EMPTY -1

 typedef struct {
   rt_mutex_t mtx;
   int growthrate;
   int size;
   int top;
   rt_tasktile_t *s;
 } rt_tilestack_t;

 int rt_tilestack_init(rt_tilestack_t *s, int size);

 void rt_tilestack_destroy(rt_tilestack_t *);

 int rt_tilestack_compact(rt_tilestack_t *);

 int rt_tilestack_push(rt_tilestack_t *, const rt_tasktile_t *);

 int rt_tilestack_pop(rt_tilestack_t *, rt_tasktile_t *);

 int rt_tilestack_popall(rt_tilestack_t *);

 int rt_tilestack_empty(rt_tilestack_t *);


 #define RT_SCHED_DONE     -1
 #define RT_SCHED_CONTINUE  0
 typedef struct rt_shared_iterator_struct {
   rt_mutex_t mtx;
   int start;
   int end;
   int current;
   int fatalerror;
 } rt_shared_iterator_t;

 int rt_shared_iterator_init(rt_shared_iterator_t *it);

 int rt_shared_iterator_destroy(rt_shared_iterator_t *it);

 int rt_shared_iterator_set(rt_shared_iterator_t *it, rt_tasktile_t *tile);

 int rt_shared_iterator_next_tile(rt_shared_iterator_t *it, int reqsize,
                                  rt_tasktile_t *tile);

 int rt_shared_iterator_setfatalerror(rt_shared_iterator_t *it);

 int rt_shared_iterator_getfatalerror(rt_shared_iterator_t *it);


 /*
  * Thread pool.
  */
 #define RT_THREADPOOL_DEVLIST_CPUSONLY NULL

 #define RT_THREADPOOL_DEVID_CPU -1

 typedef struct rt_threadpool_workerdata_struct {
   int padding1[8];
   rt_shared_iterator_t *iter;
   rt_tilestack_t *errorstack;
   int threadid;
   int threadcount;
   int devid;
   float devspeed;
   void *parms;
   void *thrpool;
   int padding2[8];
 } rt_threadpool_workerdata_t;


 typedef struct rt_threadpool_struct {
   int workercount;
   int *devlist;
   rt_shared_iterator_t iter;
   rt_tilestack_t errorstack;
   rt_thread_t *threads;
   rt_threadpool_workerdata_t *workerdata;
   rt_run_barrier_t runbar;
 } rt_threadpool_t;


 rt_threadpool_t * rt_threadpool_create(int workercount, int *devlist);

 int rt_threadpool_launch(rt_threadpool_t *thrpool,
                          void *fctn(void *), void *parms, int blocking);

 int rt_threadpool_wait(rt_threadpool_t *thrpool);

 int rt_threadpool_destroy(rt_threadpool_t *thrpool);

 int rt_threadpool_get_workercount(rt_threadpool_t *thrpool);

 int rt_threadpool_worker_getid(void *voiddata, int *threadid, int *threadcount);

 int rt_threadpool_worker_getdevid(void *voiddata, int *devid);

 int rt_threadpool_worker_setdevspeed(void *voiddata, float speed);

 int rt_threadpool_worker_getdevspeed(void *voiddata, float *speed);

 int rt_threadpool_worker_devscaletile(void *voiddata, int *tilesize);

 int rt_threadpool_worker_getdata(void *voiddata, void **clientdata);

 int rt_threadpool_sched_dynamic(rt_threadpool_t *thrpool, rt_tasktile_t *tile);

 int rt_threadpool_next_tile(void *thrpool, int reqsize, rt_tasktile_t *tile);

 int rt_threadpool_tile_failed(void *thrpool, rt_tasktile_t *tile);

 int rt_threadpool_setfatalerror(void *thrparms);

 int rt_threadpool_getfatalerror(void *thrparms);


 typedef struct rt_threadlaunch_struct {
   int padding1[8];
   rt_shared_iterator_t *iter;
   int threadid;
   int threadcount;
   void * clientdata;
   int padding2[8];
 } rt_threadlaunch_t;

 int rt_threadlaunch(int numprocs, void *clientdata, void * fctn(void *),
                     rt_tasktile_t *tile);

 int rt_threadlaunch_getid(void *thrparms, int *threadid, int *threadcount);

 int rt_threadlaunch_getdata(void *thrparms, void **clientdata);

 int rt_threadlaunch_next_tile(void *voidparms, int reqsize,
                               rt_tasktile_t *tile);

 int rt_threadlaunch_setfatalerror(void *thrparms);


 #ifdef __cplusplus
 }
 #endif

 #endif
rt_threadlaunch_struct::padding1
int padding1[8]
avoid false sharing, cache aliasing
Definition: threads.h:584

rt_threadpool_workerdata_struct::iter
rt_shared_iterator_t * iter
dynamic work scheduler
Definition: threads.h:485

rt_tilestack_t::mtx
rt_mutex_t mtx
Mutex lock for the structure.
Definition: threads.h:402

rt_threadpool_struct::devlist
int * devlist
per-worker CPU/GPU device IDs
Definition: threads.h:500

rt_shared_iterator_struct
iterator used for dynamic load balancing
Definition: threads.h:440

barrier_struct::n_clients
int n_clients
Number of threads to wait for at barrier.
Definition: threads.h:198

rt_rwlock_writelock
int rt_rwlock_writelock(rt_rwlock_t *)
set writer lock
Definition: threads.c:1270

rt_mutex_unlock
int rt_mutex_unlock(rt_mutex_t *)
unlock a mutex
Definition: threads.c:807

rt_cpu_affinitylist
int * rt_cpu_affinitylist(int *cpuaffinitycount)
query CPU affinity of the calling process (if allowed by host system)
Definition: threads.c:483

rt_tilestack_empty
int rt_tilestack_empty(rt_tilestack_t *)
query if the task tile stack is empty or not
Definition: threads.c:1675

rt_threadlaunch_struct::clientdata
void * clientdata
worker parameters
Definition: threads.h:588

barrier_struct::result
int result
Answer to be returned by barrier_wait.
Definition: threads.h:202

rt_run_barrier_struct::lock
rt_mutex_t lock
Mutex lock for the structure.
Definition: threads.h:211

rt_threadpool_worker_devscaletile
int rt_threadpool_worker_devscaletile(void *voiddata, int *tilesize)
worker thread calls this to scale max tile size by worker speed as determined by the SM/core count an...
Definition: threads.c:2008

rt_threadlaunch_struct
Routines to generate a pool of threads which then grind through a dynamically load balanced work queu...
Definition: threads.h:583

rt_tasktile_t
struct rt_tasktile_struct rt_tasktile_t
Task tile struct for stack, iterator, and scheduler routines; &#39;start&#39; is inclusive, &#39;end&#39; is exclusive.

rt_mutex_lock
int rt_mutex_lock(rt_mutex_t *)
lock a mutex
Definition: threads.c:742

rt_tilestack_push
int rt_tilestack_push(rt_tilestack_t *, const rt_tasktile_t *)
push a task tile onto the stack
Definition: threads.c:1608

rt_cpu_capability_flags
int rt_cpu_capability_flags(rt_cpu_caps_t *cpucaps)
CPU optional instruction set capability flags.
Definition: threads.c:281

atomic_int_struct::padding2
int padding2[8]
Pad to avoid false sharing, cache aliasing.
Definition: threads.h:190

rt_cond_t
int rt_cond_t
Definition: threads.h:167

rt_threadpool_sched_dynamic
int rt_threadpool_sched_dynamic(rt_threadpool_t *thrpool, rt_tasktile_t *tile)
Set dynamic scheduler state to half-open interval defined by tile.
Definition: threads.c:2034

rt_mutex_init
int rt_mutex_init(rt_mutex_t *)
initialize a mutex
Definition: threads.c:721

rt_run_barrier_struct::padding1
int padding1[8]
Pad to avoid false sharing, cache aliasing.
Definition: threads.h:210

rt_tasktile_struct
Task tile struct for stack, iterator, and scheduler routines; &#39;start&#39; is inclusive, &#39;end&#39; is exclusive.
Definition: threads.h:387

rt_threadpool_workerdata_t
struct rt_threadpool_workerdata_struct rt_threadpool_workerdata_t
thread-specific handle data for workers

rt_threadpool_destroy
int rt_threadpool_destroy(rt_threadpool_t *thrpool)
join all worker threads and free resources
Definition: threads.c:1917

rt_threadpool_workerdata_struct::devspeed
float devspeed
speed scaling for this device
Definition: threads.h:490

rt_shared_iterator_init
int rt_shared_iterator_init(rt_shared_iterator_t *it)
initialize a shared iterator
Definition: threads.c:1700

rt_run_barrier_struct::rsltparms
void * rsltparms
parms to return to barrier wait callers
Definition: threads.h:218

rt_tilestack_init
int rt_tilestack_init(rt_tilestack_t *s, int size)
initialize task tile stack (to empty)
Definition: threads.c:1552

rt_threadlaunch_setfatalerror
int rt_threadlaunch_setfatalerror(void *thrparms)
worker thread calls this to indicate that an unrecoverable error occured
Definition: threads.c:2193

rt_cond_broadcast
int rt_cond_broadcast(rt_cond_t *)
signal a condition variable, waking all threads
Definition: threads.c:1003

rt_threadlaunch_t
struct rt_threadlaunch_struct rt_threadlaunch_t
Routines to generate a pool of threads which then grind through a dynamically load balanced work queu...

rt_shared_iterator_getfatalerror
int rt_shared_iterator_getfatalerror(rt_shared_iterator_t *it)
master thread calls this to query for fatal errors
Definition: threads.c:1785

rt_tilestack_destroy
void rt_tilestack_destroy(rt_tilestack_t *)
destroy task tile stack
Definition: threads.c:1575

rt_tilestack_t::size
int size
current allocated stack size
Definition: threads.h:404

rt_threadpool_struct::workerdata
rt_threadpool_workerdata_t * workerdata
per-worker data
Definition: threads.h:504

rt_thread_numprocessors
int rt_thread_numprocessors(void)
number of processors available, subject to user override
Definition: threads.c:202

rt_thread_setconcurrency
int rt_thread_setconcurrency(int)
set the concurrency level and scheduling scope for threads
Definition: threads.c:618

rt_shared_iterator_struct::mtx
rt_mutex_t mtx
mutex lock
Definition: threads.h:441

barrier_struct::wait_cv
rt_cond_t wait_cv
Clients wait on condition variable to proceed.
Definition: threads.h:203

rt_cpu_smt_depth
int rt_cpu_smt_depth(void)
CPU logical processors (SMT depth / aka hyperthreading)
Definition: threads.c:466

barrier_struct::padding2
int padding2[8]
Pad to avoid false sharing, cache aliasing.
Definition: threads.h:204

rt_threadpool_getfatalerror
int rt_threadpool_getfatalerror(void *thrparms)
master thread calls this to query for fatal errors
Definition: threads.c:2077

rt_rwlock_t
int rt_rwlock_t
Definition: threads.h:168

rt_threadpool_workerdata_struct::padding2
int padding2[8]
avoid false sharing
Definition: threads.h:493

rt_tilestack_t::s
rt_tasktile_t * s
stack of task tiles
Definition: threads.h:406

rt_thread_numphysprocessors
int rt_thread_numphysprocessors(void)
number of physical processors available
Definition: threads.c:114

rt_tilestack_t::top
int top
index of top stack element
Definition: threads.h:405

rt_shared_iterator_setfatalerror
int rt_shared_iterator_setfatalerror(rt_shared_iterator_t *it)
worker thread calls this to indicate a fatal error
Definition: threads.c:1772

rt_atomic_int_add_and_fetch
int rt_atomic_int_add_and_fetch(rt_atomic_int_t *atomp, int inc)
fetch an atomic int and add inc to it, returning new value
Definition: threads.c:1180

rt_threadpool_worker_getdata
int rt_threadpool_worker_getdata(void *voiddata, void **clientdata)
worker thread can call this to get its client data pointer
Definition: threads.c:2024

rt_shared_iterator_struct::end
int end
ending value (exlusive)
Definition: threads.h:443

rt_run_barrier_struct::n_clients
int n_clients
Number of threads to wait for at barrier.
Definition: threads.h:212

rt_thread_barrier_init_proc_shared
int rt_thread_barrier_init_proc_shared(rt_barrier_t *, int n_clients)
When rendering in the CAVE we use a special synchronization mode so that shared memory mutexes and co...
Definition: threads.c:1379

rt_threadpool_tile_failed
int rt_threadpool_tile_failed(void *thrpool, rt_tasktile_t *tile)
worker thread calls this when it fails computing a tile after it has already taken it from the schedu...
Definition: threads.c:2062

rt_threadpool_wait
int rt_threadpool_wait(rt_threadpool_t *thrpool)
wait for all worker threads to complete their work
Definition: threads.c:1900

rt_thread_join
int rt_thread_join(rt_thread_t, void **)
join (wait for completion of, and merge with) a thread
Definition: threads.c:688

rt_atomic_int_set
int rt_atomic_int_set(rt_atomic_int_t *atomp, int val)
set an atomic int variable
Definition: threads.c:1087

rt_threadpool_get_workercount
int rt_threadpool_get_workercount(rt_threadpool_t *thrpool)
query number of worker threads in the pool
Definition: threads.c:1951

rt_threadpool_struct::runbar
rt_run_barrier_t runbar
master/worker run barrier
Definition: threads.h:505

rt_thread_run_barrier_poll
int rt_thread_run_barrier_poll(rt_run_barrier_t *barrier)
non-blocking poll to see if peers are already at the barrier
Definition: threads.c:1536

rt_barrier_t
struct barrier_struct rt_barrier_t
barrier sync object with padding to prevent false sharing

rt_rwlock_readlock
int rt_rwlock_readlock(rt_rwlock_t *)
set reader lock
Definition: threads.c:1241

rt_thread_create
int rt_thread_create(rt_thread_t *, void *fctn(void *), void *)
create a new child thread
Definition: threads.c:645

rt_thread_run_barrier
void *(*)(void *) rt_thread_run_barrier(rt_run_barrier_t *barrier, void *fctn(void *), void *parms, void **rsltparms)
sleeping barrier synchronization for thread pool
Definition: threads.h:373

rt_cpu_caps_struct::flags
unsigned int flags
Definition: threads.h:89

rt_threadpool_workerdata_struct::errorstack
rt_tilestack_t * errorstack
stack of tiles that failed
Definition: threads.h:486

rt_threadpool_workerdata_struct
thread-specific handle data for workers
Definition: threads.h:483

rt_atomic_int_get
int rt_atomic_int_get(rt_atomic_int_t *atomp)
get an atomic int variable
Definition: threads.c:1123

rt_shared_iterator_set
int rt_shared_iterator_set(rt_shared_iterator_t *it, rt_tasktile_t *tile)
Set shared iterator state to half-open interval defined by tile.
Definition: threads.c:1719

rt_tilestack_pop
int rt_tilestack_pop(rt_tilestack_t *, rt_tasktile_t *)
pop a task tile off of the stack
Definition: threads.c:1637

rt_cpu_caps_struct
Definition: threads.h:88

rt_threadlaunch_getdata
int rt_threadlaunch_getdata(void *thrparms, void **clientdata)
worker thread can call this to get its client data pointer
Definition: threads.c:2175

rt_threadlaunch_getid
int rt_threadlaunch_getid(void *thrparms, int *threadid, int *threadcount)
worker thread can call this to get its ID and number of peers
Definition: threads.c:2162

rt_tasktile_struct::end
int end
ending task ID (exclusive)
Definition: threads.h:389

rt_shared_iterator_destroy
int rt_shared_iterator_destroy(rt_shared_iterator_t *it)
destroy a shared iterator
Definition: threads.c:1710

rt_thread_t
int rt_thread_t
Definition: threads.h:165

atomic_int_struct::val
int val
Integer value to be atomically manipulated.
Definition: threads.h:188

rt_shared_iterator_t
struct rt_shared_iterator_struct rt_shared_iterator_t
iterator used for dynamic load balancing

rt_mutex_spin_lock
int rt_mutex_spin_lock(rt_mutex_t *)
lock a mutex by spinning only
Definition: threads.c:784

barrier_struct::sum
int sum
Sum of arguments passed to barrier_wait.
Definition: threads.h:201

rt_shared_iterator_struct::fatalerror
int fatalerror
cancel processing immediately for all threads
Definition: threads.h:445

rt_threadpool_workerdata_struct::threadcount
int threadcount
total number of worker threads
Definition: threads.h:488

rt_mutex_trylock
int rt_mutex_trylock(rt_mutex_t *)
try to lock a mutex
Definition: threads.c:763

barrier_struct::lock
rt_mutex_t lock
Mutex lock for the structure.
Definition: threads.h:197

rt_tasktile_struct::start
int start
starting task ID (inclusive)
Definition: threads.h:388

rt_thread_barrier_destroy
void rt_thread_barrier_destroy(rt_barrier_t *barrier)
destroy counting barrier primitive
Definition: threads.c:1416

rt_mutex_destroy
int rt_mutex_destroy(rt_mutex_t *)
destroy a mutex
Definition: threads.c:828

rt_mutex_t
int rt_mutex_t
Definition: threads.h:166

rt_threadpool_workerdata_struct::parms
void * parms
fctn parms for this worker
Definition: threads.h:491

rt_tilestack_t
stack of work tiles, for error handling
Definition: threads.h:401

rt_rwlock_init
int rt_rwlock_init(rt_rwlock_t *)
initialize a reader/writer lock
Definition: threads.c:1212

rt_thread_run_barrier_destroy
void rt_thread_run_barrier_destroy(rt_run_barrier_t *barrier)
destroy thread pool barrier
Definition: threads.c:1478

rt_run_barrier_struct::n_waiting
int n_waiting
Number of currently waiting threads.
Definition: threads.h:213

rt_threadlaunch
int rt_threadlaunch(int numprocs, void *clientdata, void *fctn(void *), rt_tasktile_t *tile)
launch up to numprocs threads using shared iterator as a load balancer
Definition: threads.c:2085

atomic_int_struct
atomic int structure with padding to prevent false sharing
Definition: threads.h:178

atomic_int_struct::padding1
int padding1[8]
Pad to avoid false sharing, cache aliasing.
Definition: threads.h:179

rt_threadpool_struct::iter
rt_shared_iterator_t iter
dynamic work scheduler
Definition: threads.h:501

rt_threadpool_worker_setdevspeed
int rt_threadpool_worker_setdevspeed(void *voiddata, float speed)
Worker thread calls this to set relative speed of this device as determined by the SM/core count and ...
Definition: threads.c:1985

rt_threadpool_worker_getdevid
int rt_threadpool_worker_getdevid(void *voiddata, int *devid)
worker thread can call this to get its CPU/GPU device ID
Definition: threads.c:1970

barrier_struct::padding1
int padding1[8]
Pad to avoid false sharing, cache aliasing.
Definition: threads.h:196

rt_threadpool_next_tile
int rt_threadpool_next_tile(void *thrpool, int reqsize, rt_tasktile_t *tile)
worker thread calls this to get its next work unit iterate the shared iterator, returns -1 if no iter...
Definition: threads.c:2042

rt_threadpool_workerdata_struct::thrpool
void * thrpool
void ptr to thread pool struct
Definition: threads.h:492

rt_tilestack_t::growthrate
int growthrate
stack growth chunk size
Definition: threads.h:403

rt_threadpool_struct::errorstack
rt_tilestack_t errorstack
stack of tiles that failed
Definition: threads.h:502

rt_tilestack_compact
int rt_tilestack_compact(rt_tilestack_t *)
shrink memory buffers associated with task tile stack if possible
Definition: threads.c:1584

rt_tilestack_popall
int rt_tilestack_popall(rt_tilestack_t *)
pop all of the task tiles off of the stack
Definition: threads.c:1660

barrier_struct::n_waiting
int n_waiting
Number of currently waiting threads.
Definition: threads.h:199

rt_threadpool_setfatalerror
int rt_threadpool_setfatalerror(void *thrparms)
worker thread calls this to indicate that an unrecoverable error occured
Definition: threads.c:2069

rt_threadlaunch_struct::padding2
int padding2[8]
avoid false sharing, cache aliasing
Definition: threads.h:589

rt_run_barrier_t
struct rt_run_barrier_struct rt_run_barrier_t
run-barrier sync object with padding to prevent false sharing

rt_cond_wait
int rt_cond_wait(rt_cond_t *, rt_mutex_t *)
wait on a condition variable
Definition: threads.c:912

barrier_struct
barrier sync object with padding to prevent false sharing
Definition: threads.h:195

rt_threadpool_worker_getdevspeed
int rt_threadpool_worker_getdevspeed(void *voiddata, float *speed)
Worker thread calls this to get relative speed of this device as determined by the SM/core count and ...
Definition: threads.c:1996

rt_threadpool_create
rt_threadpool_t * rt_threadpool_create(int workercount, int *devlist)
create a thread pool with a specified number of worker threads
Definition: threads.c:1822

rt_atomic_int_t
struct atomic_int_struct rt_atomic_int_t
atomic int structure with padding to prevent false sharing

atomic_int_struct::lock
rt_mutex_t lock
Mutex lock for the structure.
Definition: threads.h:180

rt_atomic_int_init
int rt_atomic_int_init(rt_atomic_int_t *atomp, int val)
initialize an atomic int variable
Definition: threads.c:1043

rt_shared_iterator_struct::start
int start
starting value (inclusive)
Definition: threads.h:442

rt_threadpool_struct::workercount
int workercount
number of worker threads
Definition: threads.h:499

rt_threadpool_launch
int rt_threadpool_launch(rt_threadpool_t *thrpool, void *fctn(void *), void *parms, int blocking)
launch threads onto a new function, with associated parms
Definition: threads.c:1882

rt_run_barrier_struct::padding2
int padding2[8]
Pad to avoid false sharing, cache aliasing.
Definition: threads.h:220

rt_cond_destroy
int rt_cond_destroy(rt_cond_t *)
destroy a condition variable
Definition: threads.c:888

rt_threadlaunch_struct::iter
rt_shared_iterator_t * iter
dynamic scheduler iterator
Definition: threads.h:585

rt_threadpool_worker_getid
int rt_threadpool_worker_getid(void *voiddata, int *threadid, int *threadcount)
worker thread can call this to get its ID and number of peers
Definition: threads.c:1957

rt_run_barrier_struct::wait_cv
rt_cond_t wait_cv
Clients wait on condition variable to proceed.
Definition: threads.h:219

rt_shared_iterator_struct::current
int current
current value
Definition: threads.h:444

barrier_struct::phase
int phase
Flag to separate waiters from fast workers.
Definition: threads.h:200

rt_atomic_int_fetch_and_add
int rt_atomic_int_fetch_and_add(rt_atomic_int_t *atomp, int inc)
fetch an atomic int and add inc to it, returning original value
Definition: threads.c:1152

rt_cpu_caps_t
struct rt_cpu_caps_struct rt_cpu_caps_t

rt_run_barrier_struct::parms
void * parms
parms for fctn pointer
Definition: threads.h:216

rt_rwlock_unlock
int rt_rwlock_unlock(rt_rwlock_t *)
unlock reader/writer lock
Definition: threads.c:1305

rt_cond_init
int rt_cond_init(rt_cond_t *)
initialize a condition variable
Definition: threads.c:852

rt_thread_barrier
int rt_thread_barrier(rt_barrier_t *barrier, int increment)
synchronize on counting barrier primitive
Definition: threads.c:1425

rt_threadlaunch_next_tile
int rt_threadlaunch_next_tile(void *voidparms, int reqsize, rt_tasktile_t *tile)
worker thread calls this to get its next work unit iterate the shared iterator, returns -1 if no iter...
Definition: threads.c:2185

rt_threadpool_struct::threads
rt_thread_t * threads
worker threads
Definition: threads.h:503

rt_threadlaunch_struct::threadid
int threadid
ID of worker thread.
Definition: threads.h:586

rt_thread_run_barrier_init
int rt_thread_run_barrier_init(rt_run_barrier_t *barrier, int n_clients)
initialize thread pool barrier
Definition: threads.c:1462

rt_threadpool_workerdata_struct::threadid
int threadid
worker thread&#39;s id
Definition: threads.h:487

rt_threadpool_workerdata_struct::padding1
int padding1[8]
avoid false sharing
Definition: threads.h:484

rt_run_barrier_struct
run-barrier sync object with padding to prevent false sharing
Definition: threads.h:209

rt_threadpool_workerdata_struct::devid
int devid
worker CPU/GPU device ID
Definition: threads.h:489

rt_threadpool_t
struct rt_threadpool_struct rt_threadpool_t
persistent thread pool

rt_atomic_int_destroy
int rt_atomic_int_destroy(rt_atomic_int_t *atomp)
destroy an atomic int variable
Definition: threads.c:1066

rt_threadlaunch_struct::threadcount
int threadcount
number of workers
Definition: threads.h:587

rt_run_barrier_struct::phase
int phase
Flag to separate waiters from fast workers.
Definition: threads.h:214

rt_shared_iterator_next_tile
int rt_shared_iterator_next_tile(rt_shared_iterator_t *it, int reqsize, rt_tasktile_t *tile)
iterate the shared iterator with a requested tile size, returns the tile received, and a return code of -1 if no iterations left or a fatal error has occured during processing, canceling all worker threads.
Definition: threads.c:1736

rt_thread_set_self_cpuaffinity
int rt_thread_set_self_cpuaffinity(int cpu)
set the CPU affinity of the current thread (if allowed by host system)
Definition: threads.c:572

rt_cpu_caps_struct::smtdepth
int smtdepth
Definition: threads.h:90

rt_thread_barrier_init
rt_barrier_t * rt_thread_barrier_init(int n_clients)
initialize counting barrier primitive
Definition: threads.c:1355

rt_threadpool_struct
persistent thread pool
Definition: threads.h:498

rt_cond_signal
int rt_cond_signal(rt_cond_t *)
signal a condition variable, waking at least one thread
Definition: threads.c:971