Linux下Rust并发编程实战技巧

Linux 下 Rust 并发编程实战技巧

一模型选型与适用场景

多线程并行：使用 std::thread 直接映射为 OS 线程（1:1），适合 CPU 密集型任务；注意控制线程数量，通常接近 CPU 物理核心数 更合适。
异步并发：使用 async/await 与 Tokio 运行时，适合 I/O 密集型高并发；避免在异步上下文中执行同步阻塞操作。
数据并行：使用 Rayon 的并行迭代器，适合对数组/集合的 map/reduce 类计算。

并发模型对照：

模型	适用场景	关键原语/库	注意点
多线程	CPU 密集	std::thread、Arc、Mutex/RwLock、Atomic	线程过多增加调度开销；锁粒度要小
异步	I/O 密集	Tokio（async/await、Semaphore、Barrier、Notify）	禁止在 async 中阻塞；控制并发度
数据并行	计算并行	Rayon	自动负载均衡，缓存友好
以上要点与示例在 Linux 环境下均适用，Tokio 为生产级异步运行时，Rayon 提供高层并行抽象。

二同步与共享内存的正确姿势

优先消息传递：用 std::sync::mpsc 或 tokio::sync::mpsc 在线程/任务间传递数据，减少共享可变状态。
共享可变状态：用 Arc<Mutex> 或 Arc<RwLock> 包装；读多写少优先 RwLock，写多或临界区较长优先 Mutex。
原子与无锁：简单计数/状态用 AtomicUsize/AtomicU64；高并发计数器可用“分片原子计数器”降低争用，并对齐缓存行避免 伪共享。
异步锁：在异步代码中长期持锁会阻塞 executor，优先使用 tokio::sync::Mutex/RwLock 或将逻辑改为无锁/消息传递。

示例（分片原子计数器，避免伪共享）：

use std::sync::atomic::{AtomicU64, Ordering};
use std::sync::Arc;
use std::thread;

const SHARD: usize = 64;
#[repr(align(64))]
struct AlignedCounter(AtomicU64);

struct ShardedCounter {
    shards: Vec<AlignedCounter>,
}

impl ShardedCounter {
    fn new() -> Self {
        Self { shards: (0..SHARD).map(|_| AlignedCounter(AtomicU64::new(0))).collect() }
    }
    fn inc(&self) {
        let idx = (thread::current().id().as_u64().get() as usize) % SHARD;
        self.shards[idx].0.fetch_add(1, Ordering::Relaxed);
    }
    fn total(&self) -> u64 {
        self.shards.iter().map(|s| s.0.load(Ordering::Relaxed)).sum()
    }
}

fn main() {
    let c = Arc::new(ShardedCounter::new());
    let mut hs = vec![];
    for _ in 0..8 {
        let c = Arc::clone(&c);
        hs.push(thread::spawn(move || {
            for _ in 0..100_000 { c.inc(); }
        }));
    }
    for h in hs { h.join().unwrap(); }
    println!("total = {}", c.total());
}

以上做法在 Linux 上实测有效，能显著降低锁争用与缓存一致性开销。

三异步并发与任务调度要点

禁止在 async 中执行同步阻塞：CPU 密集或同步 I/O 使用 tokio::task::spawn_blocking 放到专用线程池，避免饿死事件循环。
控制并发度：用 Semaphore 或 buffer_unordered(N) 限制同时运行的任务数，防止连接风暴与内存暴涨。
有界通道与背压：用 tokio::sync::mpsc::channel(N) 设置容量，配合 try_send/超时 实现优雅的流量控制。
运行时配置：根据负载选择 multi_thread 运行时并设置 worker_threads，I/O 密集可适当增多 worker，CPU 密集接近核心数。

示例（并发限流与有界通道）：

use tokio::sync::Semaphore;
use tokio::sync::mpsc;
use tokio::time::{sleep, Duration};

#[tokio::main(flavor = "multi_thread", worker_threads = 8)]
async fn main() {
    let sem = Arc::new(Semaphore::new(10)); // 最多 10 并发
    let (tx, mut rx) = mpsc::channel(100); // 有界通道

    // 生产者
    let p = tokio::spawn({
        let sem = sem.clone();
        let tx = tx.clone();
        async move {
            for i in 0..100 {
                let permit = sem.clone().acquire_owned().await.unwrap();
                tx.send(i).await.unwrap();
                tokio::spawn(async move { drop(permit); });
                sleep(Duration::from_millis(5)).await;
            }
        }
    });

    // 消费者
    let c = tokio::spawn(async move {
        while let Some(i) = rx.recv().await {
            // 模拟处理
            sleep(Duration::from_millis(20)).await;
            println!("processed {}", i);
        }
    });

    p.await.unwrap();
    c.await.unwrap();
}

以上模式适用于高并发网络/爬虫/数据处理场景，能有效控压与提升稳定性。

四性能优化与常见陷阱

减少锁争用：拆分为 分片锁/分段锁，或改为 无锁/消息传递；读多写少用 RwLock，写多尽量用 原子/局部计算后合并。
避免伪共享：对热点计数器/状态使用 #[repr(align(64))]，让变量独占 缓存行（通常 64 字节）。
任务粒度：避免过细粒度的 async 任务导致频繁调度；过粗又会阻塞 executor，必要时进行 批量/分组。
大对象与 Future 大小：避免在 Future 中持有大缓冲区，使用 Box::pin 或将大对象移出 Future 状态机。
背压与合并：管道化处理时用 有界通道 + 批量处理，减少系统调用与调度开销。

示例（分区并行 + 合并，规避大锁）：

use std::thread;

fn main() {
    let mut handles = Vec::with_capacity(8);
    for i in 0..8 {
        handles.push(thread::spawn(move || {
            let mut local = Vec::with_capacity(100_000);
            for j in 0..100_000 { local.push(i * j); }
            local
        }));
    }
    let result: Vec<_> = handles.into_iter()
        .flat_map(|h| h.join().unwrap())
        .collect();
    println!("len = {}", result.len());
}

通过“分治 + 合并”显著降低共享锁竞争，吞吐可提升数倍。

五调试与测试工具链

数据竞争检测：使用 ThreadSanitizer、Miri；编译期可启用 -Z sanitizer=thread。
死锁检测：使用 parking_lot 的死锁检测特性（开发/测试构建）。
并发模型验证：使用 loom 对并发逻辑进行模型检验（适合无数据竞争的抽象验证）。
性能分析：用 perf/flamegraph 定位热点与锁瓶颈；基准测试用 Criterion 对比不同并发策略。
异步测试：使用 tokio::test 编写异步单元测试与集成测试，确保运行时行为正确。

最新问答

相关标签