Posix Thread 基础

线程概念

一个线程包含在进程中表示一个 execution context 的必要信息，包括 thread ID, a set of register values, a stack, a scheduling priority and policy, a signal mask, an errno variable, and thread-specific data.

进程中的所有东西都是线程间共享的，包括 text of the executable program, the programs’s global and heap memory, the stacks, and the file descriptors.

线程 ID

每个进程都有一个 系统内 唯一的ID，由pid_t类型表示，类似的，每个线程都一个 进程内 唯一的ID, 由pthread_t类型表示。pthread_t的具体类型由实现决定，可能是整数、指针或者结构体，所以不能之间判断两个pthread_t是否相等，需要用pthread_equal函数：

int pthread_equal(pthread_t tid1, pthread_t tid2);
				Returns nonzeron if equal, 0 otherwise.

一个线程可以通过pthread_self函数获取自己的ID:

pthread_t pthread_t_self(void);

线程创建

int pthread_create(pthread_t *tidp,
                  const pthread_attr_t *attr,
                  void *(*start_routine)(void *),
                   void *arg);
									Returns: 0 if OK, error number on failure

tidp被设置为新创建的线程的ID，attr参数用来控制线程的属性，这里用NULL表示使用默认的属性。

新创建的线程从 start_routine函数处开始执行，这个函数接受一个无类型的指针 void* arg.

无类型指针（通用指针），只记录了内存的起始地址，指向的目标的大小并不知道，所以不能dereference，只能将它强制转换为其他类型的指针，此时目标的大小已经知道，所以可以dereference，然后对内存做各种操作。

当线程创建完成后，并没有保证是调用pthread_create的线程先执行还是新创建的线程先执行。所以如果pthread_create的第一个参数是一个全局变量，那么当新线程开始执行时，主线程可能还有从pthread_create中返回，也就是说全局变量可能还没有赋值，所以新线程访问到的全局变量可能是未初始化的变量。

线程终止

任何一个线程调用exit, _exit 或 Exit, 都会导致整个进程终止。当默认行为是终止进程时，比如一个信号发给一个线程，也会终止整个进程。

一个线程可以以三种方式终止而不用终止整个进程：

线程routine执行到return语句，return值会作为线程的exit code
线程被同一个进程中的其他线程 cancel
线程自己调用pthread_exit，其参数作为 exit code

int pthread_exit(void *rval_ptr)

exit code 可以被其他调用 pthread_join的线程获取：

int pthread_join(pthread_t thread, void ** rval_ptr);
								Return: 0 if OK, error number on failure

调用pthread_join的线程会阻塞直到其等待的线程退出。如果被等待的线程正常退出(return)，rval_ptr将是 return code。如果被等待的线程是被 canceled，rval_ptr会被设为 PTHREAD_CANCELED(-1).

线程可以cancel自己吗？

通过调用pthread_join，被等待的线程会被置为 detached state, 所以其资源？。如果被等待的线程已经是 detached state, 那么pthread_join会失败，返回EINVAL。

一个线程可以调用pthread_cancel来请求同一个进程中的另一个线程 be canceled：

int pthread_cancel(pthread_t tid);
									Returns: 0 if OK, error number on failure

默认情况下，pthread_cancel会导致 tid指定的线程就像自己以参数PTHREAD_CANCELED调用pthread_exit一样。但是，一个线程可以选择忽略或者控制自己如果 cancel。pthread_cancel函数并不等待线程tid退出，它仅仅发出这个cancel请求。

线程退出时做清理：

void pthread_cleanup_push(void (*routine)(void *),void *arg);
void pthread_cleanup_pop(int execute);

默认情况下，线程的退出状态会被一直保留，直到为它调用pthread_join ，而一个 detached 线程的储存空间可能会被立即回收。如果一个线程已经detached, 那么我们无法为其调用pthread_join，为一个detached thread 调用 pthread_join会导致未定义行为。

通过pthread_detach，我们可以将一个线程 detach：

int pthread_deatch(pthread_t tid);

线程同步

如果所有的操作都只需要一个 memory cycle，那么就不会有不一致的问题。如果修改变量的操作是原子的，那么也不会有竞争的问题。那么也不需要同步。但实际情况不是这样。

Mutex
一个 mutex 是一个互斥锁，当我们访问一个共享资源时设置它，当访问完成时释放它。当 mutex is set, 所有其他试图set它的线程都会被block直到有人release它。当它被释放时，所有等待它的线程都变为可运行的，第一个运行的 will be able to set the lock，其他的线程继续等到它available again。这样，每次只能有一个线程 proceed。
这种互斥只有在所有线程都遵守相同的访问规则时才有效，比如说所有人在访问变量之前都必须获取锁。如果允许一个线程在访问前不获取锁，那么即使其他线程正在持有锁，它也依然可以访问到变量，这可能造成不一致。
一个互斥变量由 pthread_mutex_t表示，使用前必须初始化。要么初始化为常量PTHREAD_MUTEX_INITIALIZER (只用于静态分配的mutex)，要么使用pthreat_mutex_init (动态分配的mutex，free mutex前必须调用pthread_mutex_destroy):
```
int pthread_mutex_init(pthread_mutex_t *mutex,
                const pthread_mutexattr_t *attr);
int pthread_mutex_destroy(pthread_mutex_t *mutex);
```
要锁定一个 mutex，我们调用 pthread_mutex_lock，如果这个 mutex 已经被锁定，那么调用的线程被阻塞，直到 mutex 被解锁。解锁一个 mutex 我们调用 pthread_mutex_unlock ：
```
int pthread_mutex_lock(pthread_mutex_t *mutex);
int pthread_mutex_unlock(pthread_mutex_t *mutex);
int pthread_mtuex_trylock(pthread_mutex_t *mutex);
```
如果线程不想被阻塞，它可以调用 pthread_mutex_trylock，如果 mutex 没有被锁，那么调用 pthread_mutex_trylock会锁定这个 mutex，返回0，否则调用会失败，返回EBUSY，不阻塞，且不会锁定这个mutex。

死锁避免

一个线程试图锁定一个 mutex 两次会造成死锁。

如果程序中使用了多个 mutex，当一个线程持有一个 mutex 的锁并且试图锁定第二个 mutex，同时另外一个线程持有第二个 mutex的锁并且试图锁定一个 mutex 时，就会造成死锁。

小心的控制加锁的顺序可以避免死锁。

如果一个线程持有一个锁，并且调用pthread_mutex_trylock成功，那么线程可以继续，否则线程就释放自己持有的所有的锁，clean up, try again later。

参考资料

APUE.3e

线程概念#

线程 ID#

线程创建#

线程终止#

线程同步#

死锁避免#

参考资料#