1. JVM 由哪些部分组成？

组成
- 类加载器子系统（ClassLoader）
- 运行时数据区（Runtime Data Area）
- 执行引擎（Execution Engine）
- 本地方法接口（Native Interface，JNI）
执行流程
首先需要准备编译好的 Java 字节码文件（即class文件）。
然后需要先通过一定方式（类加载器）将 class 文件加载到内存中（运行时数据区）。
又因为字节码文件是 JVM 定义的一套指令集规范，底层操作系统无法直接执行。
因此需要特定的命令解释器（执行引擎）将字节码翻译成特定的操作系统指令集交给 CPU 去执行。
这个过程中会需要调用到一些不同语言为 Java 提供的接口（例如驱动、地图制作等），这就用到了本地方法接口（Native Interface）。

2. Java 的类加载过程是怎样的？

加载: 将二进制流读入内存中，为了生成一个 Class 对象。
连接
a. 验证: 主要是验证加载进来的二进制流是否符合一定格式，是否规范，是否符合当前 JVM 版本等等之类的验证。
b. 准备: 为静态变量(类变量)赋初始值，也即为它们在方法区划分内存空间。这里注意是静态变量，并且是初始值，比如 int 的初始值是 0。
c. 解析: 将常量池的符号引用转化成直接引用。

符号引用可以理解为只是个替代的标签，比如你此时要做一个计划，暂时还没有人选，你设定了个 A 去做这个事。然后等计划真的要落地的时候肯定要找到确定的人选，到时候就是小明去做一件事。解析就是把 A(符号引用) 替换成小明(直接引用)。符号引用就是一个字面量，没有什么实质性的意义，只是一个代表。
直接引用指的是一个真实引用，在内存中可以通过这个引用查找到目标。
初始化: 这时候就执行一些静态代码块，为静态变量赋值，这里的赋值才是代码里面的赋值，准备阶段只是设置初始值占个坑。

3. 请你介绍下 JVM 内存模型，分为哪些区域？各区域的作用是什么？

程序计数器（Program Counter Register）：每个线程都有自己的程序计数器，用于指示当前线程执行的字节码指令的行号，以便线程执行时能够回到正确的位置。
虚拟机栈（JVM Stack）：也称为 Java 方法栈，用于存储方法执行时的局部变量表、操作数栈、动态链接、方法出口等信息。每个线程在执行一个方法时，都会为该方法分配一个栈帧，并将该栈帧压入虚拟机栈，当方法执行完毕后，虚拟机会将其出栈。
本地方法栈（Native Method Stack）：与虚拟机栈类似，用于存储本地方法的执行信息。
堆（Heap）：用于存放所有线程共享的对象和数组，是垃圾回收的主要区域。
方法区（Method Area）：用于存储已经被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。方法区也是被所有线程共享的。方法区具体实现永久代/元空间

程序计数器、虚拟机栈、本地方法栈是线程私有的，堆、方法区、运行时常量池是线程共享的。

4. JVM 垃圾回收调优的主要目标是什么？

GC 调优的核心思路就是尽可能的使对象在年轻代被回收，减少对象进入老年代。

吞吐量调优：主要关注降低垃圾回收的总时间，通过 Parallel Scavenge 和 Parallel Old 提高 CPU 使用效率。
延迟调优：关注最大停顿时间，通过 CMS、G1、ZGC 等收集器降低 STW 停顿时间。
堆大小调优：通过合理的堆内存分配和分代比例调优，避免频繁的 Minor GC 和 Full GC。

5. 如何对 Java 的垃圾回收进行调优？

思路
分析Young GC 和 Full GC 触发频率、原因、晋升的速率、老年代内存占用量, 可以使用命令(jstat -gc [pid] [频率] [总次数])或监控页面查看
例如: 如果发现频繁会产生 Full GC，分析日志之后发现没有内存泄漏，只是 Young GC 之后会有大量的对象进入老年代，然后最终触发 Ful GC。所以就能得知是 Survivor 空间设置太小，导致对象过早进入老年代，因此调大 Survivor 。

6. 常用的 JVM 配置参数有哪些？

-Xms：初始化堆内存大小
-Xmx：最大堆内存大小
-Xss：设置每个线程的栈大小
-XX:MetaspaceSize：初始化元空间大小
-XX:MaxMetaspaceSize：最大元空间大小
-XX:+HeapDumpOnOutOfMemoryError：当发生 OutOfMemoryError 时，生成堆转储（heap dump）文件
-XX:HeapDumpPath: 生成堆转储文件路径
-XX:+PrintGCDetails：打印详细的垃圾回收日志
-XX:+UseG1GC：启用G1垃圾收集器
-XX:+UseConcMarkSweepGC：启用CMS垃圾收集器
-XX:+UseZGC：启用ZGC（低延迟垃圾收集器）

7. Java 中常见的垃圾收集器有哪些？

新生代垃圾收集器
- 1）Serial 收集器：
  - 单线程收集器，适合小型应用和单处理器环境。
  - 触发 Stop-The-World（STW）操作，所有应用线程在 GC 时暂停。
  - 适用场景：适用于单线程应用和客户端模式。
- 2）ParNew 收集器：
  - 是 Serial 收集器的多线程版本，能够并行进行垃圾收集。
  - 与 CMS 收集器配合使用时，通常会选择 ParNew 收集器作为新生代收集器。
  - 适用场景：适用于多处理器环境，通常配合 CMS 收集器使用。
- 3）Parallel Scavenge 收集器（吞吐量优先）：
  - 也称为 "吞吐量收集器"，追求最大化 CPU 时间的利用率。
  - 并行处理新生代垃圾回收，适合大规模后台任务处理，注重吞吐量而非延迟。
  - 适用场景：适用于大规模运算密集型后台任务，适合对吞吐量要求较高的场景。
老年代垃圾收集器：
- 1）Serial Old 收集器：
  - Serial 收集器的老年代版本，使用标记-整理（Mark-Compact）算法进行垃圾回收。
  - 适用场景：适合单线程环境和低内存使用场景，通常配合 Serial 收集器一起使用。
- 2）Parallel Old 收集器：
  - Parallel Scavenge 收集器的老年代版本，使用多线程并行标记-整理算法。
  - 适用场景：适合大规模并行计算的场景，适用于高吞吐量要求的任务。
- 3）CMS（Concurrent Mark-Sweep）收集器：
  - 并发标记-清除收集器，追求低延迟，减少 GC 停顿时间。
  - 使用并发标记和清除算法，适合对响应时间有较高要求的应用。
  - 缺点：可能会产生内存碎片，并且在并发阶段可能会发生 Concurrent Mode Failure，导致 Full GC。
  - 适用场景：适用于对响应时间要求高的应用，如 Web 服务和电商平台。
- 4）G1（Garbage First）收集器：
  - 年轻代采用类似于传统的复制算法, 老年代采用标记整理算法
  - 设计用于取代 CMS 的低延迟垃圾收集器，能够提供可预测的停顿时间。
  - 通过分区来管理内存，并在垃圾收集时优先处理最有价值的区域，避免了 CMS 的内存碎片问题。
  - 适用场景：适合大内存、多 CPU 服务器应用，尤其在延迟和响应时间敏感的场景中表现出色。
- 5）ZGC（Z Garbage Collector）收集器：
  - 低停顿、高吞吐量的垃圾收集器，停顿时间一般不会超过 10 毫秒。
  - 适用场景：适用于需要管理大堆内存且对低延迟要求极高的应用。

8. 垃圾收集算法

标记-清除算法（Mark-Sweep）：
- 主要用于 CMS，标记存活对象后，清除不可达对象，但容易产生内存碎片。
- 工作原理：首先遍历堆中的对象，标记出所有的存活对象，接着清除未标记的对象。
- 优点：实现简单，能够处理堆中的所有对象。
- 缺点：标记和清除的过程会产生内存碎片，影响后续内存分配的效率。
标记-整理算法（Mark-Compact）：
- 用于 G1 和 Parallel Old，标记存活对象后进行整理，避免内存碎片。
- 工作原理：首先标记出所有存活的对象，然后将存活的对象整理到一边，最后清除未标记的对象。
- 优点：避免了内存碎片问题。
- 缺点：整理阶段需要移动对象，会导致额外的开销。
复制算法（Copying）：
- 工作原理：将内存分成两部分，每次只使用其中一半，垃圾回收时将存活的对象从一半复制到另一半，清除原区域的所有对象（朴素的复制算法是这样的，实际使用会分为两个 survivor 和一个 eden 区）。
- 优点：无需处理内存碎片，分配效率高。
- 缺点：需要双倍的内存空间，浪费了一半的空间。

9. 线上 CPU 飙高如何排查？

首先确认哪个进程占用 CPU 过高，登录服务器利用 top 命令查看。
top 命令是 Linux 下常用的性能分析工具，能够实时显示系统中各个进程的资源占用状况，类似于 Windows 的任务管理器
确认 CPU 利用率很高的进程的 PID，假设为 1234 确实是 Java 进程，则通过 top -Hp 1234 查看具体的线程。
假设得到的线程 ID 是 5678，再将线程转为十六进制。可以使用 printf "%x\n" 5678
得到十六进制的 tid 为 162e，此时在利用 jstack 1234 | grep 162e -A 100 查看具体的栈信息。
根据堆栈信息就可以定位到具体是哪行代码导致了 CPU 飙高，对应分析修复即可！

10. 怎么分析 JVM 当前的内存占用情况？

利用 jstat 监控和分析 JVM 内部的垃圾回收、内存等运行状态。可以用它来查看堆内存、非堆内存等的实时状态。使用命令 jstat -gc [pid] [频率] [总次数]
可以使用 jmap 查看， JVM 堆的详细信息（包括堆的配置、内存使用情况、GC 活动等）。\
阿里 arthas 使用
- dashboard: 可以查看当前系统的实时数据面板。数据面板默认5秒刷新一次。可以输入Q 后回车或 Ctrl+C 退出dashboard命令。
- thread: 后面加上线程ID会打印线程的栈。Arthas支持管道，可以用 thread 1 | grep ‘main(’ 查找到arthas-demo应用的main class。
- sc: 用来查找JVM里已加载的类。例如查看名称为MathGame的类：sc -d *MathGame
- jad: 用来反编译代码。例如查看MathGame类的源代码：jad demo.MathGame
- watch: 可以查看函数的参数/返回值/异常信息。例如查看MathGame类中primeFactors函数的返回值：watch demo.MathGame primeFactors returnObj ，每次函数被调用都会打印返回值，可以输入Q 后回车或 Ctrl+C 退出watch命令。

11. OOM 后怎么分析？

在发生 OOM 时，可以根据 jmap 得到堆转储文件（建议增加JVM启动参数，-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/tmp/heapdump.hprof，在发生 OOM 后自动生成转储文件），再导入到 MAT、VisualVM、GCeasy等工具中分析文件，找出哪些对象占用了大量的内存，再定位到具体的代码解决问题。

OOM内存泄露常见问题:

堆内存溢出（Java Heap Space）
- Java 堆用于存放对象实例，如果创建了过多对象，或有内存泄漏导致对象无法被垃圾回收，堆内存就会耗尽。如果有大量创建对象或集合类的场景，持续增加数据但未释放就会产生堆内存溢出。
- 错误信息：java.lang.OutOfMemoryError: Java heap space
- 解决方法：检查对象创建逻辑，确保及时释放无用对象，或增大堆内存大小（-Xmx 参数）。
栈内存溢出（StackOverflowError）
- 每个线程都有独立的栈空间，栈用于存储方法调用的信息（局部变量、方法参数、返回地址等）。如果方法调用层次过深或存在无限递归，栈空间耗尽就会导致栈溢出。常见于递归方法没有正确的退出条件、深层嵌套的方法调用场景。
- 错误信息：java.lang.StackOverflowError
- 解决方法：检查递归条件，优化递归算法或增加栈空间（-Xss 参数）。
方法区或元空间溢出（Metaspace / PermGen space）
- 在 Java 8 之前，方法区被实现为永久代（PermGen），用于存放类的元数据（类信息、方法信息、常量池等）。在 Java 8 之后，永久代被替换为元空间（Metaspace），用本地内存实现。在频繁加载和卸载类的情况下（如使用大量动态生成的代理类或频繁热部署），可能导致方法区或元空间溢出。常见于使用动态代理频繁生成类、大量反射调用或频繁热部署场景。
- 错误信息： Java 7 及之前：java.lang.OutOfMemoryError: PermGen space；Java 8 及之后：java.lang.OutOfMemoryError: Metaspace
- 解决方法：增加元空间大小（-XX:MaxMetaspaceSize）；优化代码以减少类加载和反射的频率。
直接内存溢出（Direct Buffer Memory）
- Java NIO 使用直接内存（Direct Memory）来加快 I/O 操作，该内存不受 JVM 堆内存的限制。如果分配过多的直接内存，超过了设置的最大值，也会导致内存溢出。常见于使用 NIO 操作 ByteBuffer 分配大量直接内存，或者 Netty 等框架中频繁使用直接内存场景。
- 错误信息：java.lang.OutOfMemoryError: Direct buffer memory
- 解决方法：检查直接内存的分配和释放情况，增加直接内存大小限制（-XX:MaxDirectMemorySize），或避免过多使用直接内存。
线程数过多导致的内存溢出（Unable to Create New Native Thread）
- 每个线程都需要栈空间和一定的操作系统资源。如果创建过多线程而超出操作系统的资源限制，可能无法再创建新的线程，导致 OOM。常见于创建大量线程或线程池大小过大。
- 错误信息：java.lang.OutOfMemoryError: Unable to create new native thread
- 解决方法：减少线程数，合理设置线程池的大小，避免无限制地创建新线程。
GC 执行耗时过长导致的 OOM（GC Overhead Limit Exceeded）
- 当 JVM 在垃圾回收上花费的时间过多且回收的内存不足以满足需要，JVM 会抛出 GC Overhead Limit Exceeded 错误，以避免长时间的垃圾回收循环。通常发生在堆内存接近耗尽但又无法完全释放的情况下。常见于对象频繁创建和销毁导致 GC 频繁触发，内存不足导致 GC 效率低下场景。
- 错误信息：java.lang.OutOfMemoryError: GC overhead limit exceeded
- 解决方法：增大堆内存，优化代码以减少短生命周期对象的创建，或调整垃圾回收策略。

目录CONTENT

【面试题】JVM部分[2025/1/13 ~ 2025/1/19]

1. JVM 由哪些部分组成？

2. Java 的类加载过程是怎样的？

3. 请你介绍下 JVM 内存模型，分为哪些区域？各区域的作用是什么？

4. JVM 垃圾回收调优的主要目标是什么？

5. 如何对 Java 的垃圾回收进行调优？

6. 常用的 JVM 配置参数有哪些？

7. Java 中常见的垃圾收集器有哪些？

8. 垃圾收集算法

9. 线上 CPU 飙高如何排查？

10. 怎么分析 JVM 当前的内存占用情况？

11. OOM 后怎么分析？

评论区