JVM入门——堆

堆的核心概念

一个JVM实例只存在一个堆内存，堆也是Java内存管理的核心区域。
Java堆区在JVM启动的时候即被创建，其空间大小也就确定了。是JVM管理的最大一块内存空间。

堆内存的大小是可以调节的。
《Java虚拟机规范》规定，堆可以处于物理上不连续的内存空间中，但在逻辑上它应该被视为连续的。
所有的线程共享Java堆，在这里还可以划分线程私有的缓冲区(Thread Local Allocation Buffer,TLAB)
数组和对象可能永远不会存储在栈上，因为栈帧中保存引用，这个引用指向对象或者数组在堆中的位置。
在方法结束后，堆中的对象不会马上被移除，仅仅在垃圾收集的时候才会被移除
堆，是GC(Garbage Collection,垃圾收集器)执行垃圾回收的重点区域。

内存细分

现代垃圾收集器大部分都基于分代手机理论设计，堆空间细分为：

堆空间大小设置

手动设置堆空间大小的方法，在运行 class 时添加如下参数：

-Xms：用于表示堆去的起始内存，等价于 -XX:InitialHeapSize
-Xmx：则用于标示堆区的最大内存，等价于 -XX:MaxHeapSize

堆空间的相关说明：

一旦内存大小超过 -Xmx 说指定的最大内存时，将会抛出 OutOfMemoryError
通常会将-Xms和-Xmx两个参数配置相同的值，其目的是为了能够在java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小，从而提高性能。
默认情况下，初始内存大小：物理电脑内存大小/64
最大内存大小：物理电脑内存大小/4

堆内存大小查看

方式一：

jps: 查看当前在运行的 jvm 的 pid
jstat -gc 34944: 查看 pid 的堆内存情况
方式二：
添加虚拟机参数 -XX:+PrintGCDetails

public class HeapSizeDemo {  
    public static void main(String[] args) {  
        long initialMemory = Runtime.getRuntime().totalMemory();  
        long maxMemory = Runtime.getRuntime().maxMemory();  
  
        System.out.println("-Xms:" + (initialMemory / 1024 / 1024) + " M");  
        System.out.println("-Xms:" + (maxMemory / 1024 / 1024) + " M");  
        System.out.println("系统内存大小：" + (initialMemory * 64 / 1024 / 1024 / 1024) + " G");  
        System.out.println("系统内存大小：" + (maxMemory * 4 / 1024 / 1024 / 1024) + " G");  
  
    }  
}

输出：

-Xms:489 M
-Xms:7232 M
系统内存大小：30 G
系统内存大小：28 G

查看实际的

在代码中我们会发现计算的结果不一致，那是因为 s0 和 s1 区在进行计算的时候，只使用了一个

OOM说明

OutOfMemory 简称OOM，指的是内存溢出。通常发生内存溢出时，系统会报错 OutOfMemoryError

Java虚拟机在无法分配对象的情况下抛出OutOfMemoryError，因为内存不足，垃圾收集器也无法腾出更多的内存。虚拟机可能会创建OutOfMemoryError对象，就好像抑制被禁用了，或者堆栈跟踪不可写入一样。

实例程序

public class OOMTest {  
    public static void main(String[] args) {  
        ArrayList<Picture> list = new ArrayList<>();  
        while (true) {  
            try {  
                Thread.sleep(20);  
            } catch (InterruptedException e) {  
                e.printStackTrace();  
            }  
            list.add(new Picture(new Random().nextInt(1024 * 1024)));  
        }  
    }  
}  
  
class Picture {  
    private final byte[] pixels;  
  
    public Picture(int length) {  
        this.pixels = new byte[length];  
    }  
}

年轻代与老年代

存储在JVM中的Java对象可以分为两类：

类是生命周期较短的 瞬时对象，这类对象的创建和消亡都非常迅速。
另外一类是生命周期非常长，在某些极端情况下还能与 JVM 的生命周期保持一致。

Java堆区进一步细分的话，可以划分为 年轻代(YoungGen) 和 老年代(oldGen)
其中年轻代又可以划分为Eden空间、Survivor0空间和Survivor1空间（有时也叫做from区、to区)

年轻代和老年代的占比

虚拟机参数可配置年轻代和老年代在堆结构的占比

默认-XX:NewRatio=2，表示年轻代占1，老年代占4，年轻代占整个堆的 1/3
可以修改-XX:NewRatio=4，表示年轻代占1，老年代占4，年轻代占整个堆的 1/5

其他信息

在HotSpot中，Eden空间和另外两个Survivor空间缺省所占的比例是8:1:1
当然开发人员可以通过选项-XX:SurvivorRatio调整这个空间比例。比-XX:SurvivorRatio=8
几乎所有的Java对象都是在Eden区被new出来的。
绝大部分的Java对象的销毁都在新生代进行了。
- IBM公司的专门研究表明，新生代中80%的对象都是“朝生夕死”的
可以使用选项-Xmn设置新生代最大内存大小
- 这个参数一般使用默认值就可以了。

对象分配的过程

创建对象，放入 Eden区，未使用的为红色
将使用的对象，放入 Survivor 区 s0（不一定），此时s0称为 from，s1为空，称为 to
再次新建对象时，GC回收未使用对象，逐渐增加 Survior区的对象，将s0的对象，放入s1，s0为空，此时s0 称为 to，s1称为 form
什么时候放入养老区呢？默认是15岁（GC次数）就会进入
- 也可以手动设置参数-XX:NaxTenuringThreshold=<N>进行设置

GC次数是怎么统计的

对象的GC次数统计过程

对象创建：
- 对象最初在Eden区创建，初始GC年龄（Age）为0。
Minor GC：
- 当Eden区满了时，触发Minor GC。这时Eden区和一个Survivor区（例如S0）中的存活对象会被移动到另一个Survivor区（例如S1），同时将它们的年龄加1。
- 如果对象已经在Survivor区中（例如S0），且它在这次GC中仍然存活，那么它的年龄也会1，并被移动到另一个Survivor区（例如S1）。
Survivor区交换：
- Survivor区分为S0和S1，两者轮流作为GC的目标区和存放区。在每次Minor GC后，存活对象在S0和S1之间交换。
提升到老年代：
- 当对象在Survivor区中的年龄达到设定的阈值（例如15），它将被提升到老年代（Old Generation）。这个阈值可以通过-XX:MaxTenuringThreshold参数进行配置。

示例过程

假设-XX:MaxTenuringThreshold=5：

对象创建：
- 对象A创建在Eden区，Age为0。
第一次Minor GC：
- Eden区满了，触发Minor GC。对象A存活，移动到Survivor区S0，Age变为1。
第二次Minor GC：
- Eden区再次满了，触发Minor GC。对象A存活，从S0移动到S1，Age变为2。
继续Minor GC：
- 过程重复，对象A在每次Minor GC后从S1移动回S0，Age逐次增加。
达到阈值：
- 当对象A的Age达到5（设定的阈值），在下次Minor GC时，对象A将被提升到老年代。

总体的流程

总体内存分配策略

针对不同年龄段的对象分配原则如下所示：

优先分配到Eden
大对象直接分配到老年代
- 尽量避免程序中出现过多的大对象
长期存活的对象分配到老年代
动态对象年龄判断
- 如果Survivor区中相同年龄的所有对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象可以直接进入老年代，无须等到MaxTenuringThreshold中要求的年龄。
空间分配担保
- -XX:HandlePromotionFailure
  详细的内存分配由TLAB分配

Minor GC、Major GC与Full GC

JVM在进行GC时，并非每次都对 老年代、新生代（年轻代）、方法区 区域一起回收，大部分回收的都是 新生代

在 HotSpot VM 中，他里面的GC按照回收区分为两大种类型：

部分收集（Partial GC）
整堆收集（Full GC）

部分收集

不是完整收集整个 Java 堆的垃圾。

其分为：

新生代收集(Minor GC/Young GC):只是新生代(Eden\s0,S1)的垃圾收集
老年代收集(Major GC/oldGC)：只是老年代的垃圾收集。
- 目前，只有 CMS GC 会有单独收集老年代的行为。
- 注意，很多时候 Major GC 会和 FullGC 混淆使用，需要具体分辨是老年代回收还是整堆回收。
混合收集(Mixed GC):收集整个新生代以及部分老年代的垃圾收集。
- 目前，只有 G1 GC 会有这种行为

整堆收集

整堆收集(Full GC)：收集整个 java 堆和方法区的垃圾收集

最简单的分代式GC策略的触发条件

年轻代GC（Minor GC）触发条件

当年轻代空间不足时，就会触发 Minor GC，这里的年轻代满指的是Eden代满，Survivor满不会引发GC。(每次Minor GC会清理年轻代的内存。)
因为Java对象大多都具备朝生夕灭的特性，所以 Minor GC 非常频繁，一般回收速度也比较快。这一定义既清晰又易于理解。
Minor GC 会引发STW，暂停其它用户的线程，等垃圾回收结束，用户线程才恢复运行。

老年代（Major GC/Full GC）触发条件

指发生在老年代的GC，对象从老年代消失时，我们说“Major GC”或“Full GC”发生了。
出现了 Major GC，经常会伴随至少一次的 Minor GC (但非绝对的，在Parallel Scavenge收集器的收集策略里就有直接进行 Major GC 的策略选择过程)
- 也就是在老年代空间不足时，会先尝试触发 Minor GC。如果之后空间还不足，则触发 Major GC
Major GC 的速度一般会比 Minor GC 慢10倍以上，STW的时间更长。
如果 Major GC 后，内存还不足，就报OOM了。

Full GC触发条件

调用System.gc()时，系统建议执行 Full GC，但是不必然执行
老年代空间不足
方法区空间不足
通过 Minor GC 后进入老年代的平均大小大于老年代的可用内存
由Eden区、survivor spacee(From Space)区向survivor space1(To Space)区复制时，对象大小大于To Space可用内存，则把该对象转存到老年代，且老年代的可用内存小于该对象大小
说明：Full GC是开发或调优中尽量要避免的。这样暂时时间会短一些。

堆空间分代思想

为什么要进行分代

唯一的原因就是优化GC性能，将不同的堆空间根据 生命周期 进行划分

新生代：有Eden、两块大小相同的Survivor(又称为from/to,s0/s1)构成，to总为空。
老年代：存放新生代中经历多次GC仍然存活的对象。

一般GC主要回收对象为 新生代

jdk1.7堆空间图

jdk1.8堆空间图

线程本地分配缓冲区

为什么需要TLAB

TLAB（Thread Local Allocation Buffer）也叫做线程本地分配缓冲区，需要TLAB有以下原因：

堆区是线程共享区域，任何线程都可以访问到堆区中的共享数据
由于对象实例的创建在JVM中非常频繁，因此在并发环境下从堆区中划分内存空间是线程不安全的
为避免多个线程操作同一地址，需要使用加锁等机制，进而影响分配速度。

什么是TLAB

从内存模型的角度，对 Eden 区域继续划分，JVM为每个线程分配了一个私有缓存区域，它包含在Eden内

TLAB的作用参考：为什么需要TLAB

使用TLAB后的流程

堆空间参数设置

常用参数设置

官方文档：https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html
我们只说常用的

/**  
 * 测试堆空间常用的jvm参数：  
 * -XX:+PrintFlagsInitial : 查看所有的参数的默认初始值  
 * -XX:+PrintFlagsFinal  ：查看所有的参数的最终值（可能会存在修改，不再是初始值）  
 *      具体查看某个参数的指令： jps：查看当前运行中的进程  
 *                             jinfo -flag SurvivorRatio 进程id  
 *  
 * -Xms：初始堆空间内存 （默认为物理内存的1/64）  
 * -Xmx：最大堆空间内存（默认为物理内存的1/4）  
 * -Xmn：设置新生代的大小。(初始值及最大值)  
 * -XX:NewRatio：配置新生代与老年代在堆结构的占比  
 * -XX:SurvivorRatio：设置新生代中Eden和S0/S1空间的比例  
 * -XX:MaxTenuringThreshold：设置新生代垃圾的最大年龄  
 * -XX:+PrintGCDetails：输出详细的GC处理日志  
 * 打印gc简要信息：① -XX:+PrintGC   ② -verbose:gc  
 * -XX:HandlePromotionFailure：是否设置空间分配担保  
 */

空间分配担保

在发生Minor GC之前，虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间。

如果大于，则此次Minor GC是安全的
如果小于，则虚拟机会查看-XX:HandlePromotionFailure 设置值是否允担保失败。
- 如果HandlePromotionFailure=true，那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代的对象的平均大小。
  - 如果大于，则尝试进行一次Minor GC，但这次Minor GC依然是有风险的；
  - 如果小于，则进行一次Full GC。
- 如果HandlePromotionFailure=false，则进行一次Full GC。

堆是分配对象存储的唯一选择？

随着逃逸分析技术和栈上分配等技术的成熟，堆不在是分配内存的唯一选择。

如果经过逃逸分析(Escape Analysis)后发现，一个对象并没有逃逸出方法的话，那么就可能被优化成栈上分配。
基于OpenJDK深度定制的TaoBaoVM,其中创新的GCIH(GC invisible heap)技术实现off-heap,将生命周期较长的Java对象从heap中移至heap外，并且GC不能管理GCIH内部的Java对象，以此这到降低Gc的回收频率和提升GC的回收效率的目的。

逃逸分析

逃逸分析（Escape Analysis）是一种用于编译程序的优化技术，主要用于确定对象在程序中的生命周期和作用域。
通过逃逸分析，编译器可以判断一个对象是否在方法之外被引用。如果一个对象没有逃逸出方法，那么编译器可以对其进行一些优化，例如将其分配在栈上而不是堆上，从而减少垃圾回收的压力并提高程序性能。

以下是逃逸分析的几个关键点：

对象逃逸类型：
- 全局逃逸：对象被分配在方法之外的作用域，例如被返回或传递给其他方法。
- 线程逃逸：对象被多个线程共享。
优化效果：
- 栈上分配：如果对象没有逃逸出方法的作用域，可以在栈上分配内存而不是在堆上。
- 同步消除：如果对象没有被多个线程访问，可以消除不必要的同步。
- 标量替换：将对象的成员变量直接替换为标量变量，从而避免对象创建。
实现方式：
- 逃逸分析通常在编译时完成，现代JVM（如HotSpot）使用静态分析技术来实现这一功能。
发生条件：
- 当一个对象在方法中被定义后，对象只在方法内部使用，则认为没有发生逃逸
- 当一个对象在方法中被定义后，它被外部方法所引用，则认为发生逃逸。例如作为调用参数传递到其他地方中。

结论：

开发中能使用局部变量的，就不要使用在方法外定义。

示例代码

public class EscapeAnalysis {  
    public EscapeAnalysis obj;  
  
    /* 方法返回EscapeAnalysis对象, 发生逃逸*/  
    public EscapeAnalysis getInstance() {  
        return obj == null ? new EscapeAnalysis() : obj;  
    }  
  
    /* 为成员属性赋值, 发生逃逸 */    public void setObj() {  
        this.obj = new EscapeAnalysis();  
    }  
  
    /* 对象的作用域仅在当前方法中有效, 没有发生逃逸 */    public void useEscapeAnalysis() {  
        EscapeAnalysis e = new EscapeAnalysis();  
    }  
  
    /* 引用成员变量的值, 发生逃逸 */    public void useEscapeAnalysis1() {  
        EscapeAnalysis e = getInstance();  
    }  
  
}

代码优化

使用逃逸分析，编译器可以对代码做如下优化：

栈上分配。将 堆分配转化为栈分配 。如果一个对象在子程序中被分配，要使指向该对象的指针永远不会逃逸，对象可能是栈分配的候选，而不是堆分配。
同步省略。如果一个对象被发现只能从一个线程被访问到，那么对于这个对象的操作可以不考虑同步。
分离对象或标量替换。有的对象可能不需要作为一个连续的内存结构存在也可以被访问到，那么对象的部分（或全部）可以不存储在内存，而是存储在CPU寄存器中。

栈上分配

栈上分配是一种内存分配方式，其中变量和数据在栈（stack）上分配，而不是在堆（heap）上分配。栈是一种后进先出（LIFO, Last In First Out）结构，用于管理方法调用和局部变量。在方法调用时，方法的局部变量、参数以及一些方法调用的上下文信息会被压入栈中；当方法返回时，这些数据会从栈中弹出。

示例代码：

/**  
 * 栈上分配测试  
 * -Xmx128m -Xms128m -XX:-DoEscapeAnalysis -XX:+PrintGCDetails  
 */  
public class StackAllocation {  
    public static void main(String[] args) {  
        long start = System.currentTimeMillis();  
  
        for (int i = 0; i < 10000000; i++) {  
            alloc();  
        }  
        // 查看执行时间  
        long end = System.currentTimeMillis();  
        System.out.println("花费的时间为： " + (end - start) + " ms");  
        // 为了方便查看堆内存中对象个数，线程sleep  
        try {  
            Thread.sleep(1000000);  
        } catch (InterruptedException e1) {  
            e1.printStackTrace();  
        }  
    }  
  
    private static void alloc() {  
        User user = new User();//未发生逃逸  
    }  
  
    static class User {  
  
    }  
}

开启逃逸分析
- JVM 参数设置 -Xmx128m -Xms128m -XX:-DoEscapeAnalysis -XX:+PrintGCDetails
- 输出结果：

花费的时间为： 114 ms

未开启逃逸分析
- JVM参数设置 -Xmx128m -Xms128m -XX:+DoEscapeAnalysis -XX:+PrintGCDetails
- 输出结果：

花费的时间为： 5 ms

同步省略（同步消除）

线程同步的代价是相当高的，同步的后果是降低并发性和性能。
在动态编译同步块的时候，JIT编译器可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问而没有被发布到其他线程。
如果没有，那么JIT编译器在编译这个同步块的时候就会取消对这部分代码的同步。这样就能大大提高并发性和性能。这个取消同步的过程就叫同步省略，也叫锁消除。

同步省略只会在运行时触发，示例代码如下：

public class SynchronizedTest {  
    public void f() {  
        Object hollis = new Object();  
        synchronized(hollis) {  
            System.out.println(hollis);  
        }  
    }  
}

被修改成

public void f() {  
    Object hellis = new Object();  
	System.out.println(hellis);  
}

字节码方法的code:

 0 new #2 <java/lang/Object>  
 3 dup  
 4 invokespecial #1 <java/lang/Object.<init>>  
 7 astore_1  
 8 aload_1  
 9 dup  
10 astore_2  
11 monitorenter  
12 getstatic #3 <java/lang/System.out>  
15 aload_1  
16 invokevirtual #4 <java/io/PrintStream.println>  
19 aload_2  
20 monitorexit  
21 goto 29 (+8)  
24 astore_3  
25 aload_2  
26 monitorexit  
27 aload_3  
28 athrow  
29 return

分离对象或标量替换

标量（scalar）是指一个无法再分解成更小的数据的数据。Java中的原始数据类型就是标量。
相对的，那些还可以分解的数据叫做聚合量（Aggregate），Java中的对象就是聚合量，因为他可以分解成其他聚合量和标量。
在JIT阶段，如果经过逃逸分析，发现一个对象不会被外界访问的话，那么经过JIT优化，就会把这个对象拆解成若干个其中包含的若干个成员变量来代替。这个过程就是标量替换。

标量替换案例

示例代码：

public static void main(String args[]) {  
    alloc();  
}  
private static void alloc() {  
    Point point = new Point(1,2);  
    System.out.println("point.x" + point.x + ";point.y" + point.y);  
}  
class Point {  
    private int x;  
    private int y;  
}

经过标量替换后

private static void alloc() {  
    int x = 1;
    int y = 2;
    System.out.println("point.x" + point.x + ";point.y" + point.y);  
}

标量替换参数设置

参数 -XX:+ElimilnateAllocations：开启了标量替换（默认打开），允许将对象打散分配在栈上。

代码示例：

/**  
 * 标量替换测试  
 *  -Xmx100m -Xms100m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:-EliminateAllocations  
 * @author shkstart  shkstart@126.com  
 * @create 2020  12:01  
 */  
public class ScalarReplace {  
    public static class User {  
        public int id;  
        public String name;  
    }  
  
    public static void alloc() {  
        User u = new User();//未发生逃逸  
        u.id = 5;  
        u.name = "www.atguigu.com";  
    }  
  
    public static void main(String[] args) {  
        long start = System.currentTimeMillis();  
        for (int i = 0; i < 10000000; i++) {  
            alloc();  
        }  
        long end = System.currentTimeMillis();  
        System.out.println("花费的时间为： " + (end - start) + " ms");  
    }  
}

开启

花费的时间为： 7 ms

未开启

[GC (Allocation Failure)  25600K->880K(98304K), 0.0008473 secs]
[GC (Allocation Failure)  26480K->784K(98304K), 0.0008040 secs]
[GC (Allocation Failure)  26384K->736K(98304K), 0.0007065 secs]
[GC (Allocation Failure)  26336K->720K(98304K), 0.0007493 secs]
[GC (Allocation Failure)  26320K->800K(98304K), 0.0007363 secs]
[GC (Allocation Failure)  26400K->768K(101376K), 0.0008059 secs]
[GC (Allocation Failure)  32512K->704K(100864K), 0.0006429 secs]
[GC (Allocation Failure)  32448K->704K(100864K), 0.0003928 secs]
花费的时间为： 57 ms