Data Harmonizer(数据协调器)------线程
1. 线程的基础知识
1.1 创建线程有几种方式?
- 继承Thread类并重写run方法:简便直接,但因为Java的单继承机制,不能继承其他类。
- 实现Runnable接口并重写run方法:避免单继承的局限性,更灵活地解耦线程任务和线程运行机制。
- 实现Callable接口并重写call方法:允许线程有返回值,且支持异常处理,通过Future和FutureTask获取线程结果。
- 使用线程池创建(通过java.util.concurrent.Executor接口):适用于管理大量线程,提高资源利用率和性能。
1.2 Runnable和Callable的区别
- 返回值:Runnable的
run
方法没有返回值,而Callable的call
方法有返回值(泛型类型)。 - 异常处理:Runnable不能抛出受检异常,而Callable可以抛出并处理异常。
- 阻塞特性:Callable配合Future使用时,
get()
方法会阻塞线程,直到结果可用。
1.3 线程的状态转换
- 新建(NEW):线程被创建但未启动。
- 可运行(RUNNABLE):线程已启动,可能正在运行或等待操作系统资源。
- 阻塞(BLOCKED):线程因等待锁而阻塞,无法继续执行。
- 等待(WAITING):线程主动放弃CPU并等待通知。
- 有时限等待(TIMED_WAITING):线程在指定时间内等待,时间到后自动唤醒。
- 终结(TERMINATED):线程执行完毕或被中断,进入终止状态。
- 新建状态:当一个线程对象被创建,但还未调用
start
方法时,处于新建状态。此时,线程尚未与操作系统底层线程关联。 - 可运行状态:调用了
start
方法后,线程由新建进入可运行状态。此时,线程与底层线程关联,由操作系统调度执行。 - 终结状态:线程内代码已经执行完毕,由可运行进入终结状态。此时,会取消与底层线程的关联。
- 阻塞状态:当获取锁失败后,线程由可运行进入
Monitor
的阻塞队列阻塞。此时,线程不占用 CPU 时间。当持锁线程释放锁时,会按照一定规则唤醒阻塞队列中的阻塞线程,唤醒后的线程进入可运行状态。 - 等待状态:当获取锁成功后,但由于条件不满足,调用了
wait()
方法,线程从可运行状态释放锁进入Monitor
的等待集合等待。同样,线程不占用 CPU 时间。当其他持锁线程调用notify()
或notifyAll()
方法时,会按照一定规则唤醒等待集合中的等待线程,使其恢复为可运行状态。 - 有时限等待状态:当获取锁成功后,但由于条件不满足,调用了
wait(long)
方法,线程从可运行状态释放锁进入Monitor
的等待集合进行有时限等待。
同样,线程不占用 CPU 时间。当其他持锁线程调用notify()
或notifyAll()
方法时,会按照一定规则唤醒等待集合中的有时限等待线程,使其恢复为可运行状态,并重新去竞争锁。
如果等待超时,线程也会从有时限等待状态恢复为可运行状态,并重新去竞争锁。此外,调用sleep(long)
方法也会使线程从可运行状态进入有时限等待状态,但与Monitor
无关,不需要主动唤醒,超时时间到自然恢复为可运行状态。
1.4 start和run的区别
- start():启动线程并调用
run
方法,真正的多线程运行。 - run():普通的方法调用,不涉及线程启动。
1.5 线程同步和调度相关方法
- wait():释放锁并进入等待状态,直到被通知或中断。
- sleep():使线程休眠,不释放锁。
- notify():随机唤醒一个等待的线程。
- notifyAll():唤醒所有等待的线程,但仅有一个线程能获取锁并继续执行。
1.6 notify()和notifyAll()的区别
- notify():唤醒单个等待线程。
- notifyAll():唤醒所有等待线程。
1.7 wait和sleep的不同
方法归属不同
sleep(long)
是Thread
的静态方法。wait()
,wait(long)
都是Object
的成员方法,每个对象都有。
醒来时机不同
- 执行
sleep(long)
和wait(long)
的线程都会在等待相应毫秒后醒来。 wait(long)
和wait()
还可以被notify
唤醒,wait()
如果不唤醒就一直等下去。- 它们都可以被打断唤醒。
锁特性不同(重点)
wait
方法的调用必须先获取wait
对象的锁,而sleep
则无此限制。wait
方法执行后会释放对象锁,允许其它线程获得该对象锁(我放弃cpu
,但你们还可以用)。sleep
如果在synchronized
代码块中执行,并不会释放对象锁(我放弃cpu
,你们也用不了)。
1.8 保证T1、T2、T3三个线程按顺序执行
使用join()
方法,确保T3在T2之后,T2在T1之后执行。如下所示:
Thread t1 = new Thread(() -> System.out.println("t1"));
Thread t2 = new Thread(() -> { t1.join(); System.out.println("t2"); });
Thread t3 = new Thread(() -> { t2.join(); System.out.println("t3"); });t1.start();
t2.start();
t3.start();
2. 线程池
2.1 为什么使用线程池?
- 减少资源消耗:线程的创建和销毁消耗资源,线程池复用线程,减少这些开销。
- 提高响应速度:任务可立即执行,而不必等待线程创建。
- 提高可管理性:统一管理和监控线程,优化系统性能。
2.2 线程池工作原理
- 核心线程未满则创建新线程,否则进入队列等待。
- 队列满时,若总线程数未达上限,则创建新线程,否则执行拒绝策略。
2.3 线程池的种类
- newCachedThreadPool:可缓存线程池,适合短期异步任务。
- newFixedThreadPool:定长线程池,控制最大并发数。
- newScheduledThreadPool:定长线程池,支持周期性任务执行。
- newSingleThreadExecutor:单线程池,确保任务按顺序执行。
2.4 线程池的核心参数
- corePoolSize:核心线程数,线程池的基本大小。
- maximumPoolSize:最大线程数,限制线程池中的线程总数。
- keepAliveTime:线程空闲时间,超过时间未执行任务则销毁线程。
- workQueue:阻塞队列,用于保存等待执行的任务。
- threadFactory:线程工厂,用于创建新线程。
- handler:拒绝策略,处理无法执行的任务。
2.5 为什么不建议用Executors创建线程池?
Executors返回的线程池容易导致资源耗尽或OOM,推荐手动配置ThreadPoolExecutor以控制线程池的核心参数。
2.6 线程池中常用的队列
- ArrayBlockQueue:有界队列,避免资源耗尽。
- LinkedBlockQueue:无界队列,适合高并发场景。
- PriorityBlockQueue:优先级队列。
- SynchronousBlockQueue:无缓冲队列,每个插入操作需等待移出操作。
2.7 submit和execute方法的区别
- 参数区别:
submit
支持Callable和Runnable,execute
只支持Runnable。 - 返回值:
submit
返回Future对象,execute
无返回值。 - 异常处理:
submit
的Future允许捕获异常,execute
不能捕获异常。
2.8 如何确定核心线程数
- 高并发/短任务:线程数=CPU核数+1。
- CPU密集型任务:线程数=CPU核数+1。
- IO密集型任务:线程数=2*CPU核数。
3. 线程中并发锁
3.1 什么是线程死锁?
死锁是指多个线程因互相等待而无法推进,最终都阻塞的情况。
3.2 形成死锁的四个必要条件
- 互斥:资源不可共享。
- 占有且等待:持有资源的同时请求新的资源。
- 不可抢占:资源只能主动释放。
- 循环等待:线程间形成循环等待资源关系。
3.3 如何避免线程死锁?
- 避免同时持有多个锁。
- 避免在锁内嵌套调用其他锁。
- 使用定时锁避免永久等待。
3.4 synchronized的实现原理
synchronized通过对象的monitor实现。线程获取对象锁时进入同步代码块,执行完毕后释放锁。
3.5 synchronized的作用范围
- 方法级别:锁定方法,锁住的是对象实例(非静态方法)或Class对象(静态方法)。
- 代码块级别:锁定代码块,锁住的是指定对象实例。
3.6 CAS
CAS(Compare and Swap)是一种原子操作,比较当前值与预期值是否相等,相等则更新为新值。CAS主要用于无锁算法中,避免线程同步带来的性能开销。
3.7 JMM(Java内存模型)
JMM描述了Java中的内存可见性规则,规定了变量在内存中的存储和读取行为,确保在多线程环境下数据一致性。JMM定义了主内存和工作内存,线程对变量的操作都在工作内存中完成,最后同步到主内存。