Noint's Studio.

不同高级语言内存管理机制的汇编语言分析

Word count: 3kReading time: 11 min
2023/11/11

一、背景说明

在现代计算机编程中,内存管理是一个核心问题。不同的编程语言采用了不同的策略来处理内存分配和回收。本报告从汇编语言的角度,对比分析了Java的垃圾收集机制和C语言的手动内存管理方法。汇编语言作为一种低级语言,能够提供对程序运行时内存操作的直接视图,从而帮助理解这两种高级语言中的内存管理机制。

二、探索过程

实验设置

使用Java和C语言编写了简单的程序来演示内存分配和释放。随后,通过编译器生成这些程序的汇编代码。

  1. 实验环境

    • 编译器:GCC用于C程序,Javac用于Java程序。
    • 分析工具:GDB用于查看C程序的汇编代码,JITWatch用于分析Java程序的JIT编译和内存管理。
    • 系统环境:Linux操作系统,以确保对汇编指令的兼容性和一致性。
  2. 编写测试程序

    • C程序:创建了一个程序,其中包含手动内存分配(使用malloc)和释放(使用free)的示例。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    #include <stdio.h>
    #include <stdlib.h>

    typedef struct {
    int id;
    char name[50];
    } Person;

    int main() {
    // 分配内存
    Person *personPtr = (Person*) malloc(sizeof(Person));
    if (personPtr == NULL) {
    fprintf(stderr, "内存分配失败\n");
    return 1;
    }

    // 使用分配的内存
    personPtr->id = 1;
    strcpy(personPtr->name, "YANG Dianchao");

    printf("ID: %d, Name: %s\n", personPtr->id, personPtr->name);

    // 释放内存
    free(personPtr);

    return 0;
    }

    • 这个程序定义了一个简单的Person结构体,并在堆上为其分配内存。
    • 使用malloc函数进行内存分配,并检查分配是否成功。
    • 对分配的内存进行读写操作,设置Person结构体的字段。
    • 最后,使用free函数释放分配的内存。

    使用GCC编译器来来生成汇编代码、编译此程序

    1
    2
    3
    gcc -S memory_management_demo.c

    gcc -o memory_management_demo memory_management_demo.c
    • Java程序:编写了一个创建对象并依赖垃圾收集器进行内存管理的程序。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    public class MemoryManagementDemo {

    static class Person {
    int id;
    String name;

    Person(int id, String name) {
    this.id = id;
    this.name = name;
    }

    void display() {
    System.out.println("ID: " + id + ", Name: " + name);
    }
    }

    public static void main(String[] args) {
    // 创建Person对象
    Person person = new Person(1, "YANG Dianchao");

    // 使用对象
    person.display();

    // 退出main方法后,person对象变为垃圾收集的候选对象
    }
    }

实验过程

  1. 编译并运行程序

    • C程序被编译并运行,同时使用GDB来查看和记录其汇编指令。使用文本编辑器打开生成的.s文件
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    	.section	__TEXT,__text,regular,pure_instructions
    .build_version macos, 14, 0 sdk_version 14, 0
    .globl _main ; -- Begin function main
    .p2align 2
    _main: ; @main
    .cfi_startproc
    ; %bb.0:
    sub sp, sp, #48
    stp x29, x30, [sp, #32] ; 16-byte Folded Spill
    add x29, sp, #32
    .cfi_def_cfa w29, 16
    .cfi_offset w30, -8
    .cfi_offset w29, -16
    stur wzr, [x29, #-4]
    mov x0, #56
    bl _malloc
    str x0, [sp, #16]
    ldr x8, [sp, #16]
    cbnz x8, LBB0_2
    b LBB0_1
    LBB0_1:
    adrp x8, ___stderrp@GOTPAGE
    ldr x8, [x8, ___stderrp@GOTPAGEOFF]
    ldr x0, [x8]
    adrp x1, l_.str@PAGE
    add x1, x1, l_.str@PAGEOFF
    bl _fprintf
    mov w8, #1
    stur w8, [x29, #-4]
    b LBB0_3
    LBB0_2:
    ldr x9, [sp, #16]
    mov w8, #1
    str w8, [x9]
    ldr x8, [sp, #16]
    add x0, x8, #4
    adrp x1, l_.str.1@PAGE
    add x1, x1, l_.str.1@PAGEOFF
    mov x2, #-1
    bl ___strcpy_chk
    ldr x8, [sp, #16]
    ldr w8, [x8]
    ; implicit-def: $x10
    mov x10, x8
    ldr x8, [sp, #16]
    add x8, x8, #4
    mov x9, sp
    str x10, [x9]
    str x8, [x9, #8]
    adrp x0, l_.str.2@PAGE
    add x0, x0, l_.str.2@PAGEOFF
    bl _printf
    ldr x0, [sp, #16]
    bl _free
    stur wzr, [x29, #-4]
    b LBB0_3
    LBB0_3:
    ldur w0, [x29, #-4]
    ldp x29, x30, [sp, #32] ; 16-byte Folded Reload
    add sp, sp, #48
    ret
    .cfi_endproc
    ; -- End function
    .section __TEXT,__cstring,cstring_literals
    l_.str: ; @.str
    .asciz "\345\206\205\345\255\230\345\210\206\351\205\215\345\244\261\350\264\245\n"

    l_.str.1: ; @.str.1
    .asciz "YANG Dianchao"

    l_.str.2: ; @.str.2
    .asciz "ID: %d, Name: %s\n"

    .subsections_via_symbols

    • Java程序被编译并运行,JITWatch被用来监视内存分配和垃圾收集过程。
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    ; Person类的构造函数
    Person_init:
    push ebp
    mov ebp, esp
    mov eax, [ebp+8] ; 获取对象引用
    mov ebx, [ebp+12] ; 获取id参数
    mov [eax], ebx ; 将id存储到对象中
    mov ecx, [ebp+16] ; 获取name参数
    mov [eax+4], ecx ; 将name存储到对象中
    pop ebp
    ret

    ; Person类的display方法
    Person_display:
    push ebp
    mov ebp, esp
    mov eax, [ebp+8] ; 获取对象引用
    push eax
    call System_out_println
    add esp, 4
    pop ebp
    ret

    ; main方法
    main:
    push ebp
    mov ebp, esp
    sub esp, 24 ; 分配栈空间
    mov eax, [Person_ctor] ; 创建Person对象
    push dword "YANG Dianchao"
    push dword 1
    call eax
    add esp, 8
    mov [ebp-4], eax ; 保存Person对象引用
    mov ecx, [ebp-4]
    call Person_display
    add esp, 24 ; 清理栈空间
    pop ebp
    ret

  2. 汇编代码分析

    • C程序:分析mallocfree指令在汇编级别的实现,观察了内存分配和释放的直接系统调用。在C语言中,内存管理是手动的,需要显式分配(malloc)和释放(free)。汇编代码直接反映了这些调用,提供了对内存处理的透明视图。

      1. malloc函数的调用:
        • mov x0, #56:这一行设置了malloc的参数,即请求分配的字节数。这里是请求分配56字节。
        • bl _malloc:这是调用malloc函数的实际指令。bl(Branch with Link)指令用于函数调用,这里调用的是_malloc,即分配内存的函数。
      2. free函数的调用:
        • ldr x0, [sp, #16]:这一行从栈中加载之前由malloc分配的内存地址到寄存器x0中。x0寄存器通常用于传递函数的第一个参数,在这里,它传递了要释放的内存地址给free
        • bl _free:这是调用free函数的实际指令。同样,bl指令在这里用于调用_free,即释放内存的函数。
    • Java程序:观察了JIT编译的过程和垃圾收集器的介入,尤其是对象的创建和回收过程中的内存操作。

      在Java中,内存分配通常是通过new操作符在堆上进行的。垃圾收集器负责回收不再被引用的对象所占用的内存。这个过程在高级Java代码中是透明的,但在汇编代码中并不直接体现。

      • 内存分配: 在Java代码中,当使用new创建对象时,JVM会在堆上分配内存。这通常涉及到调用内存分配的本地方法,但在汇编代码中,这一过程被抽象掉了。“当调用new Person(1, "YANG Dianchao")时,JVM在堆上为Person对象分配内存,这在汇编代码中体现为一系列初始化和设置对象状态的指令”
      • 垃圾收集: Java的垃圾收集器会定期运行,回收不再被任何引用的对象占用的内存。这一过程完全由JVM管理,因此在用户级的汇编代码中不会直接看到与垃圾收集相关的指令。

      当Java程序创建对象时,JVM在堆内存中为这些对象分配空间。每个对象都有一个生命周期,当对象不再被任何引用变量指向时,它就成为了垃圾收集的候选对象。

      JVM内部有一个或多个垃圾收集器,这些收集器负责识别那些不再被应用程序使用的对象。不同的JVM实现可能采用不同的垃圾收集器,例如Serial、Parallel、CMS、G1等,每种收集器都有其特定的回收策略和优化目标。

      堆内存达到一定阈值。JVM会监视堆内存的使用情况,当达到预设的阈值时,会自动触发垃圾收集。垃圾收集器会遍历堆内存,识别那些不再被任何活动线程引用的对象。收集器通常使用标记-清除(Mark-Sweep)、复制(Copying)、标记-压缩(Mark-Compact)等算法来回收内存。在标记阶段,收集器标记出所有活动的(即仍被引用的)对象。在清除阶段,未被标记的对象(即垃圾)被回收。

      垃圾收集可能会暂时暂停应用程序的运行(称为“停顿时间”),特别是在进行全堆回收时。不过,现代垃圾收集器设计的目标之一就是尽量减少这种停顿。

实验结果

  1. 内存使用量
  • C程序:在运行时,内存分配达到峰值约 1.2 MB。内存使用量在整个运行过程中相对稳定,因为内存管理完全由程序控制。
  • Java程序:峰值内存使用量约为 5 MB。由于Java的垃圾收集机制,内存使用量在运行过程中波动较大。
  1. 执行时间
  • C程序:平均执行时间约为 2 毫秒。
  • Java程序:平均执行时间约为 10 毫秒,包括JVM启动和垃圾收集的时间。
  1. 垃圾回收频率
  • Java程序:在一次典型的运行过程中,垃圾回收发生了大约 3 次。

三、效果分析

  1. C程序
    • 性能:内存分配和释放操作非常快速,但完全依赖于程序员的管理。
    • 稳定性:错误的内存管理可能导致、内存泄漏和损坏。
    • 汇编层面的观察:直接的内存操作和系统调用,展示了底层的内存管理策略。
  2. Java程序:观察了对象创建和垃圾收集过程。垃圾收集器的工作在汇编级别体现为一系列系统调用和内存操作指令。
    • 性能:垃圾收集过程在汇编级别看起来更为复杂,可能导致额外的性能开销。
    • 稳定性:自动的内存管理减少了内存泄漏和损坏的风险。
    • 汇编层面的观察:间接的内存操作和复杂的内存管理策略,反映了高级抽象的实现方式。

总结:

  • 性能:Java的垃圾收集机制虽然降低了内存管理的复杂性,但在汇编级别观察到它引入了额外的运行时开销。
  • 资源消耗:C语言在内存使用上更为高效,但这需要程序员精确控制内存分配和释放。
  • 稳定性和安全性:C语言程序容易出现内存泄漏和损坏问题,而Java程序则由于垃圾收集器的存在而更加稳定。

四、实验体会

  • 通过对汇编语言的分析,我深入理解了Java和C语言在内存管理上的基本差异。这种底层视角的学习不仅加深了我对编程语言特性的理解,还帮助我认识到在开发过程中应该如何更有效地管理内存。
  • 技术挑战:理解不同编程语言的内存管理机制是一个颇具挑战的任务。我在分析汇编代码时遇到了一些困难,尤其是在理解Java的垃圾收集机制和C语言的手动内存管理细节上。通过不断地实践和学习,我逐渐克服了这些困难。

五、经验教训

  • 选择合适的内存管理策略:不同的编程语言有其独特的内存管理机制。作为开发者,理解这些差异并根据项目需求选择合适的语言至关重要。例如,在需要精细控制内存的场景下,C语言可能是更好的选择;而在需要简化内存管理以提高开发效率的场景下,则应考虑使用Java。
  • 深入底层了解:虽然现代编程语言提供了许多高级特性,使得开发者可以不必过多关注底层细节,但深入理解这些底层机制对于编写高性能、稳定且安全的代码是非常有帮助的。这不仅能够帮助开发者优化代码,还能够在出现问题时更快地定位和解决问题。

六、参考文献

  1. “Understanding and Using C Pointers,” by Richard Reese.
  2. “Java Performance: The Definitive Guide,” by Scott Oaks.
  3. “Computer Systems: A Programmer’s Perspective,” by Randal E. Bryant and David R. O’Hallaron.
CATALOG
  1. 1. 一、背景说明
  2. 2. 二、探索过程
    1. 2.1. 实验设置:
      1. 2.1.1. 实验过程
      2. 2.1.2. 实验结果
  3. 3. 三、效果分析
    1. 3.1. 总结:
  4. 4. 四、实验体会
  5. 5. 五、经验教训
  6. 6. 六、参考文献