多线程并发编程的基本问题 - 博客

[{"createTime":1735734952000,"id":1,"img":"hwy_ms_500_252.jpeg","link":"https://activity.huaweicloud.com/cps.html?fromacct=261f35b6-af54-4511-a2ca-910fa15905d1&utm_source=V1g3MDY4NTY=&utm_medium=cps&utm_campaign=201905","name":"华为云秒杀","status":9,"txt":"华为云38元秒杀","type":1,"updateTime":1735747411000,"userId":3},{"createTime":1736173885000,"id":2,"img":"txy_480_300.png","link":"https://cloud.tencent.com/act/cps/redirect?redirect=1077&cps_key=edb15096bfff75effaaa8c8bb66138bd&from=console","name":"腾讯云秒杀","status":9,"txt":"腾讯云限量秒杀","type":1,"updateTime":1736173885000,"userId":3},{"createTime":1736177492000,"id":3,"img":"aly_251_140.png","link":"https://www.aliyun.com/minisite/goods?userCode=pwp8kmv3","memo":"","name":"阿里云","status":9,"txt":"阿里云2折起","type":1,"updateTime":1736177492000,"userId":3},{"createTime":1735660800000,"id":4,"img":"vultr_560_300.png","link":"https://www.vultr.com/?ref=9603742-8H","name":"Vultr","status":9,"txt":"Vultr送$100","type":1,"updateTime":1735660800000,"userId":3},{"createTime":1735660800000,"id":5,"img":"jdy_663_320.jpg","link":"https://3.cn/2ay1-e5t","name":"京东云","status":9,"txt":"京东云特惠专区","type":1,"updateTime":1735660800000,"userId":3},{"createTime":1735660800000,"id":6,"img":"new_ads.png","link":"https://www.iodraw.com/ads","name":"发布广告","status":9,"txt":"发布广告","type":1,"updateTime":1735660800000,"userId":3},{"createTime":1735660800000,"id":7,"img":"yun_910_50.png","link":"https://activity.huaweicloud.com/discount_area_v5/index.html?fromacct=261f35b6-af54-4511-a2ca-910fa15905d1&utm_source=aXhpYW95YW5nOA===&utm_medium=cps&utm_campaign=201905","name":"底部","status":9,"txt":"高性能云服务器2折起","type":2,"updateTime":1735660800000,"userId":3}]

这是个老掉牙的话题，但基本上绝大多数的讨论都跑偏了。

绝大多数讨论的核心在于如何设计一把锁来同步共享变量的访问。这事实上完全是本末倒置：

* 我们需要设计的一个立交桥，而不是为了设计一个红绿灯！
事实上，多线程编程就不应该访问共享变量，如果真的要在多线程访问共享变量，唯一高效的方案就是严格控制时序。
嗯，先来后到是唯一的方法。至于说设计这样那样的锁，那完全是惰政，只是为了防止出问题而已。

早在100多年前，就可以在同一根电话线上传输不同的话路，这得益于严格的时隙分配和复用机制，后来时代进步了，事情反而变得糟糕了，这完全是由于另一种时隙复用方式引起的，那便是时隙统计复用。现代操作系统和现代分组交换网是这种复用方式的忠实践行者。

我并不认为统计复用是一种高效的方式，它也许只是面对多样化场景而不得不采用的一种方案。在我看来，若单单讨论高效，没有什么比严格的时隙复用更好的了。

我来举一个例子。4个线程访问共享变量。

首先看一个稍微严格的方案，严格分配访问顺序：
#include <stdio.h> #include <pthread.h> #include <semaphore.h> sem_t sem1;
sem_t sem2; sem_t sem3; sem_t sem4; unsigned long cnt = 0; #define TARGET
0xffffff void do_work() { int i; for(i = 0; i < TARGET; i++) { cnt ++; } } void
worker_thread1(void) { sem_wait(&sem1); do_work(); sem_post(&sem2); } void
worker_thread2(void) { sem_wait(&sem2); do_work(); sem_post(&sem3); } void
worker_thread3(void) { sem_wait(&sem3); do_work(); sem_post(&sem4); } void
worker_thread4(void) { sem_wait(&sem4); do_work(); printf("%lx\n", cnt); exit(0)
; } int main() { pthread_t id1 ,id2, id3, id4; sem_init(&sem1, 0, 0); sem_init(&
sem2, 0, 0); sem_init(&sem3, 0, 0); sem_init(&sem4, 0, 0); pthread_create(&id1,
NULL, (void *)worker_thread1, NULL); pthread_create(&id2, NULL, (void *)
worker_thread2, NULL); pthread_create(&id3, NULL, (void *)worker_thread3, NULL);
pthread_create(&id4, NULL, (void *)worker_thread4, NULL); sem_post(&sem1);
getchar(); return 0; }
然后我们看看更加普遍的做法，即加锁的方案：
#include <stdio.h> #include <pthread.h> pthread_spinlock_t spinlock; unsigned
long cnt = 0; #define TARGET 0xffffff void do_work() { int i; for(i = 0; i <
TARGET; i++) { pthread_spin_lock(&spinlock); cnt ++; pthread_spin_unlock(&
spinlock); } if (cnt == 4*TARGET) { printf("%lx\n", cnt); exit(0); } } void
worker_thread1(void) { do_work(); } void worker_thread2(void) { do_work(); }
void worker_thread3(void) { do_work(); } void worker_thread4(void) { do_work();
} int main() { pthread_t id1 ,id2, id3, id4; pthread_spin_init(&spinlock, 0);
pthread_create(&id1, NULL, (void *)worker_thread1, NULL); pthread_create(&id2,
NULL, (void *)worker_thread2, NULL); pthread_create(&id3, NULL, (void *)
worker_thread3, NULL); pthread_create(&id4, NULL, (void *)worker_thread4, NULL);
getchar(); }
现在比较一下二者的效率差异：
[root@localhost linux]# time ./pv 3fffffc real 0m0.171s user 0m0.165s sys
0m0.005s[root@localhost linux]# time ./spin 3fffffc real 0m4.852s user
0m19.097s sys 0m0.035s
和直觉相反，也许你会觉得，第一个例子那不就是退化成串行操作了吗？多处理器的优势岂不是无法发挥了？第二个才是多线程编程正确的姿势啊！

事实上，对于共享变量，无论如何它都是必须要串行访问的。这种代码根本就无法多线程化。所以，真正的多线程程序设计：

* 一定要消除共享变量。
* 若非要共享变量，那就一定严格控制访问时序，而不是靠抢锁来控制并发。
现在来看看Linux内核，大量的spinlock并不是真的让内核多线程化了，而纯粹是为了 “如果不引入spinlock就会出问题…”

RSS，percpu
spinlock似乎是正确的把式，但若要将已经被揉成乱麻的Linux内核彻底抽丝剥茧般的共享变量串行化，似乎并不容易，更何况，中断是无法控制其时序的，那么中断处理线程化如何呢？似乎效果也不是很好。

遇到并发效率问题，如果你去设计一把牛逼的锁，那事实上你是承认了问题的所在但并不想去解决问题，这是一种消极的应对。

锁，万恶之源。取消共享变量或者控制时序才是真理。

那么，差别是什么？差别只是一套西服。

浙江温州皮鞋湿，下雨进水不会胖。

技术

Java1212 篇
Python927 篇
开发语言608 篇
c语言463 篇
算法461 篇
MySQL438 篇
数据库394 篇
前端387 篇
更多...