JVM 内存结构
本文最后更新于:2024年3月18日 凌晨
JVM 内存结构
- Java 虚拟机的内存空间分为 5 个部分:
- 程序计数器。
- Java 虚拟机栈。
- 本地方法栈。
- 堆。
- 方法区。
注意:JDK 1.8 同 JDK 1.7 比,最大的差别就是:元空间(元数据区)取代了永久代,元空间的本质和永久代类似,都是对 JVM 规范中方法区的实现,不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。
程序计数器(PC 寄存器)
- 定义:程序计数器是一块较小的内存空间,是当前线程正在执行的那条字节码指令的地址,若当前线程正在执行的是一个本地方法,那么此时程序计数器为
Undefined
- 作用
- 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制。
- 在多线程情况下,程序计数器记录的是当前线程执行的位置,从而当线程切换回来时,就知道上次线程执行到哪了。
- 特点
- 是一块较小的内存空间。
- 线程私有,每条线程都有自己的程序计数器。
- 生命周期:随着线程的创建而创建,随着线程的结束而销毁。
- 是唯一一个不会出现
OutOfMemoryError
的内存区域。
Java 虚拟机栈(Java 栈)
- Java 虚拟机栈是描述 Java 方法运行过程的内存模型。
- Java 虚拟机栈会为每一个即将运行的 Java 方法创建一块叫做"栈帧”的区域,用于存放该方法运行过程中的一些信息,如:
- 局部变量表。
- 操作数栈。
- 动态链接。
- 方法出口信息。
- …
压栈出栈过程
- 当方法运行过程中需要创建局部变量时,就将局部变量的值存入栈帧中的局部变量表中。
- Java 虚拟机栈的栈顶的栈帧是当前正在执行的活动栈,也就是当前正在执行的方法,PC 寄存器也会指向这个地址,只有这个活动的栈帧的本地变量可以被操作数栈使用,当在这个栈帧中调用另一个方法,与之对应的栈帧又会被创建,新创建的栈帧压入栈顶,变为当前的活动栈帧。
- 方法结束后,当前栈帧被移出,栈帧的返回值变成新的活动栈帧中操作数栈的一个操作数,如果没有返回值,那么新的活动栈帧中操作数栈的操作数没有变化。
由于 Java 虚拟机栈是与线程对应的,数据不是线程共享的,因此不用关心数据一致性问题,也不会存在同步锁的问题。
特点
- 局部变量表随着栈帧的创建而创建,它的大小在编译时确定,创建时只需分配事先规定的大小即可,在方法运行过程中,局部变量表的大小不会发生改变。
- Java 虚拟机栈会出现两种异常:
StackOverFlowError
和OutOfMemoryError
StackOverFlowError
若 Java 虚拟机栈的大小不允许动态扩展,那么当线程请求栈的深度超过当前 Java 虚拟机栈的最大深度时,抛出StackOverFlowError
异常。OutOfMemoryError
若允许动态扩展,那么当线程请求栈时内存用完了,无法再动态扩展时,抛出OutOfMemoryError
异常。
- Java 虚拟机栈也是线程私有,随着线程创建而创建,随着线程的结束而销毁。
出现 StackOverFlowError 时,内存空间可能还有很多。
本地方法栈(C 栈)
- 本地方法栈是为 JVM 运行 Native 方法准备的空间,由于很多 Native 方法都是用 C 语言实现的,所以它通常又叫 C 栈,它与 Java 虚拟机栈实现的功能类似,只不过本地方法栈是描述本地方法运行过程的内存模型。
JNI
- 定义:Java Native Interfac,即Java 的本地接口,由关键字 native 修饰,是底层 C 语言的库,可以被 Java 程序调用,一般是对计算机底层的操作。
- 作用:扩展 Java 的使用,融合不同的编程语言为 Java 所用。
栈帧变化过程
- 本地方法被执行时,在本地方法栈也会创建一块栈帧,用于存放该方法的局部变量表,操作数栈,动态链接,方法出口信息等。
- 方法执行结束后,相应的栈帧也会出栈,并释放内存空间,也会抛出
StackOverFlowError
和OutOfMemoryError
异常。
如果 Java 虚拟机本身不支持 Native 方法,或是本身不依赖于传统栈,那么可以不提供本地方法栈,如果支持本地方法栈,那么这个栈一般会在线程创建的时候按线程分配。
堆
- 定义:堆是用来存放对象的内存空间,几乎所有的对象都存储在堆中。
特点
- 线程共享,整个 Java 虚拟机只有一个堆,所有的线程都访问同一个堆,而程序计数器,Java 虚拟机栈,本地方法栈都是一个线程对应一个。
- 在虚拟机启动时创建。
- 是垃圾回收的主要场所。
- 堆的大小既可以固定也可以扩展,但对于主流的虚拟机,堆的大小是可扩展的,因此当线程请求分配内存,但堆已满,且内存已无法再扩展时,就抛出 OutOfMemoryError 异常。
堆的分代和分区
- JVM堆被分为了年轻代和老年代,年轻代的GC过程称为Yong GC,速度快较频繁,老年代的GC过程称为Full GC,速度较慢应该尽量避免。
- 年轻代。
- 年轻代中分为一个Eden区和两个Surviver区,占用空间比例为8:1:1,两个Surviver区分别称为"From”区和"To”区。
- 老年代。
- 如果创建的对象较大,则会直接放到老年代中。
- 不同的区域存放不同生命周期的对象,这样可以根据不同的区域使用不同的垃圾回收算法,更具有针对性。
Java 堆所使用的内存不需要保证是连续的,而由于堆是被所有线程共享的,所以对它的访问需要注意同步问题,方法和对应的属性都需要保证一致性。
方法区
- 方法区逻辑上属于堆的一部分,但是为了与堆进行区分,通常又叫"非堆”
- Java 虚拟机规范中定义方法区是堆的一个逻辑部分,方法区存放以下信息:
- 已经被虚拟机加载的类信息。
- 常量。
- 静态变量。
- 即时编译器编译后的代码。
方法区的特点
- 线程共享:方法区是堆的一个逻辑部分,因此和堆一样,都是线程共享的,整个虚拟机中只有一个方法区。
- 永久代与元空间:方法区中的信息一般需要长期存在,而且它又是堆的逻辑分区,因此用堆的划分方法,把方法区称为"永久代”,对于Java8,HotSpots用元空间取消了永久代。
- 元空间和永久代的不同
- 存储位置不同:永久代物理是是堆的一部分,和年轻代,老年代地址是连续的,而元空间属于本地内存。
- 存储内容不同:元空间的类文件常量池存储类的元信息,而静态变量和字符串常量池等并入堆中,相当于永久代的数据被分到了堆和元空间中。
- 元空间和永久代的不同
- 内存回收效率低,方法区中的信息一般需要长期存在,回收一遍之后可能只有少量信息无效,主要回收目标是:对常量池的回收,对类型的卸载。
- Java 虚拟机规范对方法区的要求比较宽松,和堆一样,允许固定大小,也允许动态扩展,还允许不实现垃圾回收。
常量池
-
方法区里存储着 Class文件的信息和运行时常量池:
- Class 文件的信息包括类信息和 Class 文件常量池。
- 运行时常量池里的内容除了 Class 文件常量池里的内容外,还将Class文件常量池里的符号引用转变为直接引用,而且运行时常量池里的内容是能动态添加的。
-
字符串常量池在每个VM中只有一份,存放的是字符串常量的引用值,例如调用 String 的
intern()
方法就能将String的值添加到字符串常量池中(JDK1.8添加的为引用地址),这里String常量池是包含在运行时常量池里的,但在 JDK1.8 后,将字符串常量池放到了堆中。 -
Class 常量池是在编译的时候每个 Class 都有的,在编译阶段,存放的是常量的符号引用。
-
运行时常量池是在类加载完成之后,将每个 Class 常量池中的符号引用值转存到运行时常量池中,也就是说,每个 Class 都有一个运行时常量池,类在解析之后,将符号引用替换成直接引用,与全局常量池中的引用值保持一致。
-
运行时常量池是当 Class 文件被加载完成后,Java虚拟机会将 Class 文件常量池里的内容转移到运行时常量池里,在 Class 文件常量池的符号引用有一部分是会被转变为直接引用的,比如说类的静态方法或私有方法,实例构造方法,父类方法,这是因为这些方法不能被重写,所以能在加载的时候就可以将符号引用转变为直接引用,而其他的一些方法是在这个方法被第一次调用的时候才会将符号引用转变为直接引用的。
不同 JDK 版本中方法区的变化
- 在JDK1.7前,运行时常量池和字符串常量池是存放在方法区中,HotSpot VM对方法区的实现称为永久代。
- 在JDK1.7中,字符串常量池从方法区移到堆中,运行时常量池保留在方法区中。
- 在JDK1.8中,HotSpot移除永久代,使用元空间代替,此时字符串常量池保留在堆中,运行时常量池保留在方法区中,只是实现不一样了,JVM内存变成了直接内存。
直接内存(堆外内存)
- 直接内存是除 Java 虚拟机之外的内存,但也可能被 Java 使用。
操作直接内存
- 在 NIO 中引入了一种基于通道和缓冲的 IO 方式,它可以通过调用本地方法直接分配 Java 虚拟机之外的内存,然后通过一个存储在堆中的
DirectByteBuffer
对象直接操作该内存,而无须先将外部内存中的数据复制到堆中再进行操作,从而提高了数据操作的效率。 - 直接内存的大小不受 Java 虚拟机控制,但既然是内存,当内存不足时就会抛出 OutOfMemoryError 异常。
直接内存与堆内存比较
- 直接内存申请空间耗费更高的性能。
- 直接内存读取 IO 的性能要优于普通的堆内存。
- 直接内存作用链:本地 IO -> 直接内存 -> 本地 IO
- 堆内存作用链:本地 IO -> 直接内存 -> 非直接内存 -> 直接内存 -> 本地 IO
服务器管理员在配置虚拟机参数时,会根据实际内存设置
-Xmx
等参数信息,但经常忽略直接内存,使得各个内存区域总和大于物理内存限制,从而导致动态扩展时出现OutOfMemoryError
异常。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!