C++线程与可见性问题 - 常见的工程实践是什么?

C++ threading vs. visibility issues - what's the common engineering practice?

本文关键字:程实践 是什么 常见 线程 可见性问题 C++      更新时间:2023-10-16

通过我的研究,我了解了饥饿、死锁、公平和其他并发问题的概念。然而,在某种程度上,理论与实践不同,真正的工程任务往往比学术上的废话更详细。。。

作为一名C++开发人员,我关心线程问题已经有一段时间了。。。

假设您有一个共享变量x,它引用了程序内存的较大部分。该变量在两个线程AB之间共享。

现在,如果我们考虑AB线程对x的读/写操作,可能同时需要同步这些操作,对吧?因此,对x的访问需要某种形式的同步,例如可以通过使用互斥来实现。

现在让我们考虑另一个场景,其中x最初由线程A编写,然后传递给线程B(不知何故),而该线程只读取x。线程B然后产生对x的响应,称为y,并将其传递回线程A(同样,不知何故)。我的问题是:我应该使用什么同步原语来确保这个场景的线程安全。我读过原子论,更重要的是,内存围栏——这些是我应该依赖的工具吗?

这不是一个典型的场景,其中有一个"关键部分"。相反,一些数据在线程之间传递,不可能在同一内存位置并发写入。因此,在写入数据之后,应该首先以某种方式"刷新"数据,以便其他线程在读取之前可以看到它处于有效和一致的状态。它在文献中是如何被称为"可见性"的?

pthread_once和它的Boost/std对应物call_once呢。如果xy都通过一种通过"一次"功能访问的"消息队列"在线程之间传递,会有帮助吗。AFAIK它是一种记忆围栏,但我找不到任何证实。

CPU缓存及其一致性如何?从工程学的角度来看,我应该知道什么?这些知识对上述场景或C++开发中常见的任何其他场景有帮助吗?

我知道我可能会混合很多主题,但我想更好地了解什么是常见的工程实践,这样我就可以重用已知的模式。

这个问题主要与C++03中的情况有关,因为这是我的日常工作环境。由于我的项目主要涉及Linux,所以我可能只使用pthreads和Boost,包括Boost.Atomic。但我也很感兴趣的是,随着C++11的出现,这些问题是否发生了变化。

我知道这个问题很抽象,没有那么精确,但任何输入都可能有用。

您有一个共享变量x

这就是你做错的地方。如果您使用某种线程安全的消费者-生产者队列来移交工作项的所有权,并且从程序的其他部分(包括所有业务逻辑)的角度来看,没有任何东西是共享的,那么线程化会容易得多。

消息传递还有助于防止缓存冲突(因为除了生产者-消费者队列本身之外,没有真正的共享,如果工作单元很大,这对性能的影响很小,并且将数据组织成消息有助于减少错误共享)。

当您将问题划分为子问题时,并行性的扩展性最好。小个子问题也更容易推理。

您似乎已经在思考这些问题,但不是,像原子、互斥和围栏这样的线程原语对于使用消息传递的应用程序来说不是很好。找到一个真正的队列实现(队列、圆环、Disruptor,它们有不同的名称,但都满足相同的需求)。基元将在队列实现中使用,但应用程序代码永远不会使用。