Java应用程序可以使用比堆大小更多的内存吗

1. 概述

我们可能都注意到了，当谈到内存消耗时，我们的Java应用程序的内存使用并没有遵循我们基于-Xmx(最大堆大小)选项的严格说明。事实上，JVM有比堆更多的内存区域。

为了限制总内存使用量，需要注意一些额外的内存设置，因此让我们从Java应用程序的内存结构和内存分配来源开始。

2. Java进程的内存结构

Java虚拟机(JVM)的内存分为两大类：堆和非堆。

堆内存是JVM内存中最广为人知的部分，它存储应用程序创建的对象，JVM在启动时启动堆。当应用程序创建对象的新实例时，该对象驻留在堆中，直到应用程序释放该实例。然后，垃圾回收器(GC)释放实例持有的内存。因此，堆大小根据负载而变化，尽管我们可以使用-Xmx选项配置最大JVM堆大小。

非堆内存构成了其余部分，它允许我们的应用程序使用比配置的堆大小更多的内存。JVM的非堆内存分为几个不同的区域，JVM代码和内部结构、加载的分析器代理代码、常量池等类结构、字段和方法的元数据、方法和构造函数的代码以及驻留字符串等数据都被归类为非堆内存。

值得一提的是，我们可以使用-XX选项调整非堆内存的某些区域，例如-XX:MaxMetaspaceSize(相当于Java 7及更早版本中的–XX:MaxPermSize)。我们将在本教程中看到更多标志。

除了JVM本身，Java进程还有其他消耗内存的区域。例如，我们有堆外技术，通常使用直接ByteBuffer来处理大内存并使其不受GC的控制。另一个来源是本地库使用的内存。

3. JVM的非堆内存区

让我们继续讨论JVM的非堆内存区域。

3.1 元空间

元空间是一个本地内存区域，用于存储类的元数据。当加载一个类时，JVM将类的元数据(即它的运行时表示)分配到元空间中。每当类加载器及其所有类从堆中移除时，它们在元空间中的分配就可以被认为被GC释放了。

但是，释放的元空间不一定会返回给操作系统。该内存的全部或部分可能仍由JVM保留，以供将来的类加载重新使用。

在早于8的Java版本中，元空间称为永久代(PermGen)。但是，与元空间不同，元空间是一个堆外内存区域，永久代驻留在一个特殊的堆区域中。

3.2 代码缓存

即时(Just In Time-JIT)编译器将其输出存储在代码缓存区域中。JIT编译器将字节码编译为频繁执行的部分(也称为热点)的本机代码。Java 7中引入的分层编译是客户端编译器(C1)使用插桩编译代码，然后服务器编译器(C2)使用分析数据以优化方式编译该代码的方法。

分层编译的目标是混合使用C1和C2编译器，以获得快速启动时间和良好的长期性能。分层编译将需要缓存在内存中的代码量增加多达4倍。从Java 8开始，默认情况下为JIT启用此功能，尽管我们仍然可以禁用分层编译。

3.3 线程

线程堆栈包含每个已执行方法的所有局部变量以及线程为到达当前执行点而调用的方法。线程堆栈只能由创建它的线程访问。

理论上，由于线程栈内存是运行线程数的函数，并且线程数没有限制，因此线程区是无界的，可以占用很大一部分内存。实际上，操作系统限制了线程的数量，JVM有一个基于平台的每个线程的堆栈内存大小的默认值。

3.4 垃圾回收

JVM附带了一组GC算法，可以根据我们应用程序的用例进行选择。无论我们使用什么算法，都会为GC进程分配一定数量的本机内存，但使用的内存量因使用的垃圾回收器而异。

3.5 Symbol

JVM使用Symbol区域来存储符号，例如字段名称、方法签名和interned(驻留)字符串。在Java开发工具包(JDK)中，符号存储在三个不同的表中：

系统字典包含所有加载的类型信息，如Java类。
常量池使用符号表数据结构来保存类、方法、字段和可枚举类型的加载符号。JVM维护一个称为运行时常量池的每个类型常量池，其中包含多种常量，从编译时数字文字到运行时方法甚至字段引用。
字符串表包含对所有常量字符串(也称为驻留字符串)的引用。

要了解字符串表，我们需要更多地了解字符串池。字符串池是一种JVM机制，它通过称为interning的过程在池中仅存储每个文字字符串的一个副本来优化分配给字符串的内存量。字符串池有两部分：

驻留字符串的内容作为常规String对象存在于Java堆中。
哈希表(也就是所谓的字符串表)，是在堆外分配的，包含对驻留字符串的引用。

也就是说，字符串池同时具有堆内和堆外部分。堆外部分是字符串表。虽然它通常更小，但当我们有更多的驻留字符串时，它仍然会占用大量的额外内存。

3.6 Arena

Arena是JVM自己实现的基于Arena的内存管理，它不同于glibc的arena内存管理。它被JVM的一些子系统使用，比如编译器和符号，或者当本机代码使用依赖于JVM arenas的内部对象时。

3.7 其他

所有其他不能归类到本机内存区域的内存使用都属于本节。例如，DirectByteBuffer的使用在这部分是间接可见的。

4. 内存监控工具

既然我们已经知道Java内存使用不仅限于堆，我们将研究跟踪总内存使用的方法。可以在分析和内存监控工具的帮助下进行发现，然后，我们可以通过一些特定的调整来调整总使用量。

让我们快速浏览一下JDK附带的可用于JVM内存监控的工具：

jmap是一个命令行实用程序，可以打印正在运行的VM或核心文件的内存映射。我们也可以使用jmap查询远程机器上的进程。但是，在JDK 8中引入jcmd之后，建议使用jcmd而不是jmap，以增强诊断并降低性能开销。
jcmd用于向JVM发送诊断命令请求，这些请求可用于控制Java Flight Recordings、故障排除以及诊断JVM和Java应用程序。jcmd不适用于远程进程。我们将在本文中看到jcmd的一些具体用法。
jhat通过启动本地Web服务器来可视化堆转储文件。有几种方法可以创建堆转储，例如使用jmap -dump或jcmd GC.heap_dump文件名。
hprof能够显示CPU使用情况、堆分配统计信息和监控争用情况。根据请求的分析类型，hprof指示虚拟机收集相关的JVM工具接口(JVMTI)事件并将事件数据处理为分析信息。

除了JVM附带的工具之外，还有特定于操作系统的命令来检查进程的内存。pmap是可用于Linux发行版的工具，可提供Java进程使用的内存的完整视图。

5. 本机内存跟踪

本机内存跟踪(NMT)是一种JVM功能，我们可以使用它来跟踪VM的内部内存使用情况。NMT不会像第三方本机代码内存分配那样跟踪所有本机内存使用情况，但是，它足以满足一大类典型应用程序的需求。

要开始使用NMT，我们必须为我们的应用程序启用它：

java -XX:NativeMemoryTracking=summary -jar app.jar

-XX:NativeMemoryTracking的其他可用值是off和detail。请注意，启用NMT会产生影响性能的间接成本。此外，NMT将两个机器字作为malloc标头添加到所有malloced内存中。

然后我们可以使用不带参数的jps或jcmd来查找我们应用程序的进程ID(pid)：

jcmd
<pid> <our.app.main.Class>

找到我们的应用程序pid后，我们可以继续使用jcmd，它提供了一长串要监视的选项。让我们向jcmd寻求帮助以查看可用选项：

jcmd <pid> help

从输出中，我们看到jcmd支持不同的类别，例如Compiler、GC、JFR、JVMTI、ManagementAgent和VM。一些选项，如VM.metaspace、VM.native_memory可以帮助我们进行内存跟踪。让我们探讨其中的一些。

5.1 本机内存摘要报告

最方便的是VM.native_memory。我们可以使用它来查看我们应用程序的VM内部本机内存使用情况的摘要：

jcmd <pid> VM.native_memory summary

<pid>:

Native Memory Tracking:

Total: reserved=1779287KB, committed=503683KB
- Java Heap (reserved=307200KB, committed=307200KB)
  ...
- Class (reserved=1089000KB, committed=44824KB)
  ...
- Thread (reserved=41139KB, committed=41139KB)
  ...
- Code (reserved=248600KB, committed=17172KB)
  ...
- GC (reserved=62198KB, committed=62198KB)
  ...
- Compiler (reserved=175KB, committed=175KB)
  ...
- Internal (reserved=691KB, committed=691KB)
  ...
- Other (reserved=16KB, committed=16KB)
  ...
- Symbol (reserved=9704KB, committed=9704KB)
  ...
- Native Memory Tracking (reserved=4812KB, committed=4812KB)
  ...
- Shared class space (reserved=11136KB, committed=11136KB)
  ...
- Arena Chunk (reserved=176KB, committed=176KB)
  ... 
- Logging (reserved=4KB, committed=4KB)
  ... 
- Arguments (reserved=18KB, committed=18KB)
  ... 
- Module (reserved=175KB, committed=175KB)
  ... 
- Safepoint (reserved=8KB, committed=8KB)
  ... 
- Synchronization (reserved=4235KB, committed=4235KB)
  ... 

查看输出，我们可以看到Java堆、GC和线程等JVM内存区域的摘要。术语“reserved”内存是指通过malloc或mmap预映射的总地址范围，因此它是该区域的最大可寻址内存。术语“committed”是指正在使用的内存。

在这里，我们可以找到输出的详细解释。要查看内存使用量的变化，我们可以依次使用VM.native_memory baseline和VM.native_memory summary.diff。

5.2 元空间和字符串表的报告

我们可以尝试jcmd的其他VM选项来概览本机内存的某些特定区域，例如元空间、符号和驻留字符串。

让我们试试元空间：

jcmd <pid> VM.metaspace

我们的输出如下所示：

<pid>:
Total Usage - 1072 loaders, 9474 classes (1176 shared):
...
Virtual space:
  Non-class space:       38.00 MB reserved,      36.67 MB ( 97%) committed 
      Class space:        1.00 GB reserved,       5.62 MB ( <1%) committed 
             Both:        1.04 GB reserved,      42.30 MB (  4%) committed 
Chunk freelists:
   Non-Class: ...
       Class: ...
Waste (percentages refer to total committed size 42.30 MB):
              Committed unused:    192.00 KB ( <1%)
        Waste in chunks in use:      2.98 KB ( <1%)
         Free in chunks in use:      1.05 MB (  2%)
     Overhead in chunks in use:    232.12 KB ( <1%)
                In free chunks:     77.00 KB ( <1%)
Deallocated from chunks in use:    191.62 KB ( <1%) (890 blocks)
                       -total-:      1.73 MB (  4%)
MaxMetaspaceSize: unlimited
CompressedClassSpaceSize: 1.00 GB
InitialBootClassLoaderMetaspaceSize: 4.00 MB

现在，让我们看看应用程序的字符串表：

jcmd <pid> VM.stringtable

让我们看看输出：

<pid>:
StringTable statistics:
Number of buckets : 65536 = 524288 bytes, each 8
Number of entries : 20046 = 320736 bytes, each 16
Number of literals : 20046 = 1507448 bytes, avg 75.000
Total footprint : = 2352472 bytes
Average bucket size : 0.306
Variance of bucket size : 0.307
Std. dev. of bucket size: 0.554
Maximum bucket size : 4

6. JVM内存调优

我们知道Java应用程序使用总内存作为堆分配和JVM或第三方库的一堆非堆分配的总和。

非堆内存在负载下大小变化的可能性较小。通常，一旦加载了所有正在使用的类并且JIT已完全预热，我们的应用程序就会稳定地使用非堆内存。但是，我们可以使用一些标志来指示JVM如何管理某些区域的内存使用。

jcmd提供了一个VM.flag选项来查看我们的Java进程已经具有哪些标志，包括默认值，因此我们可以将它用作检查默认配置并了解JVM是如何配置的工具：

jcmd <pid> VM.flags

在这里，我们看到使用过的标志及其值：

<pid>:
-XX:CICompilerCount=4 
-XX:ConcGCThreads=2 
-XX:G1ConcRefinementThreads=8 
-XX:G1HeapRegionSize=1048576 
-XX:InitialHeapSize=314572800 
...

让我们看一下用于不同区域内存调整的一些VM标志。

6.1 堆

我们有一些用于调整JVM堆的标志。要配置最小和最大堆大小，我们有-Xms(-XX:InitialHeapSize)和-Xmx(-XX:MaxHeapSize)。如果我们更喜欢将堆大小设置为物理内存的百分比，我们可以使用-XX:MinRAMPercentage和-XX:MaxRAMPercentage。重要的是要知道，当我们分别使用-Xms和-Xmx选项时，JVM会忽略这两个选项。

另一个可能影响内存分配模式的选项是XX:+AlwaysPreTouch。默认情况下，JVM最大堆分配在虚拟内存中，而不是物理内存中。只要没有写操作，操作系统可能会决定不分配内存。为了避免这种情况(特别是对于巨大的DirectByteBuffers，重新分配可能需要一些时间来重新排列操作系统内存页面)，我们可以启用-XX:+AlwaysPreTouch。PreTouch(预触)在所有页面上写入“0”并强制操作系统分配内存，而不仅仅是保留它。预触会导致JVM启动延迟，因为它在单个线程中工作。

6.2 线程堆栈

线程堆栈是每个执行方法的所有局部变量的每线程存储。我们使用-Xss或XX:ThreadStackSize选项来配置每个线程的堆栈大小。默认线程堆栈大小取决于平台，但在大多数现代64位操作系统中，它最大为1MB。

6.3 垃圾回收

我们可以使用以下标志之一设置应用程序的GC算法：-XX:+UseSerialGC、-XX:+UseParallelGC、-XX:+UseParallelOldGC、-XX:+UseConcMarkSweepGC或-XX:+UseG1GC。

如果我们选择G1作为GC，我们可以选择通过-XX:+UseStringDeduplication启用字符串重复数据删除。它可以节省很大一部分内存。字符串重复数据删除仅适用于长期存在的实例。为了避免这种情况，我们可以使用-XX:StringDeduplicationAgeThreshold配置实例的有效年龄。-XX:StringDeduplicationAgeThreshold的值表示GC循环存活的次数。

6.4 代码缓存

从Java 9开始，JVM将代码缓存分为三个区域。因此，JVM提供了特定的选项来调整每个区域：

-XX:NonNMethodCodeHeapSize配置非方法段，即JVM内部相关代码。默认情况下，它大约为5MB。
-XX:ProfiledCodeHeapSize配置分析代码段，这是C1编译的代码，生命周期可能很短。默认大小约为122MB。
-XX:NonProfiledCodeHeapSize设置非分析段的大小，这是C2编译的代码，可能具有很长的生命周期。默认大小约为122MB。

6.5 分配器

JVM从预留内存(reserving memory)开始，然后通过使用glibc的malloc和mmap修改内存映射，使部分“reserve”可用。保留和释放内存块的行为会导致碎片。分配内存中的碎片可能会导致内存中出现大量未使用的区域。

除了malloc，我们还可以使用其他分配器，例如jemalloc或tcmalloc。jemalloc是一种通用的malloc实现，它强调碎片避免和可扩展的并发支持，因此它通常看起来比常规glibc的malloc更聪明。此外，jemalloc还可用于泄漏检查和堆分析。

6.6 元空间

与堆一样，我们也有配置元空间大小的选项。要配置元空间的下限和上限，我们可以分别使用-XX:MetaspaceSize和-XX:MaxMetaspaceSize。

-XX:InitialBootClassLoaderMetaspaceSize也可用于配置初始引导类加载器大小。

有-XX:MinMetaspaceFreeRatio和-XX:MaxMetaspaceFreeRatio选项来配置GC后可用类元数据容量的最小和最大百分比。

我们还可以使用-XX:MaxMetaspaceExpansion配置没有完整GC的元空间扩展的最大大小。

6.7 其他非堆内存区域

还有一些标志用于调整本机内存其他区域的使用。

我们可以使用-XX:StringTableSize来指定字符串池的映射大小，其中映射大小表示不同的驻留字符串的最大数量。对于JDK 7+，默认映射大小为600013，这意味着默认情况下我们可以在池中拥有600013个不同的字符串。

为了控制DirectByteBuffers的内存使用，我们可以使用-XX:MaxDirectMemorySize。使用此选项，我们限制了可以为所有DirectByteBuffers保留的内存量。

对于需要加载更多类的应用程序，我们可以使用-XX:PredictedLoadedClassCount。这个选项从JDK 8开始可用，它允许我们设置系统字典的存储桶大小。

7. 总结

在本文中，我们探讨了Java进程的不同内存区域以及一些用于监视内存使用情况的工具。我们已经看到Java内存使用不仅仅局限于堆，因此我们使用jcmd来检查和跟踪JVM的内存使用情况。最后，我们回顾了一些可以帮助我们调整Java应用程序内存使用情况的JVM标志。

Show Disqus Comments