您的位置:

深入Java字节码

一、基础概念

Java字节码是Java虚拟机(JVM)可以执行的指令集,它是Java语言跨平台的秘密之一。

Java源代码在编译后将变成Java字节码。Java字节码以“.class”文件格式存在于文件系统中。运行Java程序时,Java虚拟机(JVM)将Java字节码文件加载并解释为机器码。这种解释方式使得Java字节码可以在任何计算机体系结构上运行。

Java字节码是一种高度优化的指令集,它包含众多的指令来实现不同的功能。Java字节码是紧凑的,可以减少程序的存储空间。在将Java源代码编译成Java字节码时,编译器会对代码进行优化,使得生成的字节码更加紧凑,提高程序的执行效率。

二、Java字节码的结构

Java字节码由指令、操作数和操作数栈组成。每个Java字节码指令都有一个或多个操作数。Java虚拟机会将这些操作数从操作数栈中取出,并对它们进行相应的操作。Java字节码指令可以操纵任何类型的数据,包括数值、引用和对象。

Java字节码有两种类型:面向栈和面向本地变量。面向栈指令将操作数从操作数栈中取出并操作。面向本地变量指令将数据从本地变量表中取出并操作。在Java字节码中,使用单字节、双字节、三字节或四字节的指令表示不同的操作。

Java字节码包含以下组件:

  • 魔数和版本号
  • 常量池
  • 访问标志
  • 类索引、超类索引和接口索引
  • 字段信息
  • 方法信息
  • 属性信息

三、Java字节码的优化

Java字节码在编译时通常是经过了一定程度的优化的。Java编译器(javac)会对程序进行优化,使得生成的Java字节码更加紧凑,提高程序的执行效率。可以在Java编译时使用“-O”选项来启用优化。

除了编译时优化,Java虚拟机(JVM)也可以在运行时对Java字节码进行优化。JVM可以使用即时编译器(JIT)将字节码编译成本地机器码,并进行一些优化。这种技术被称为JIT优化,可以提高程序的运行效率。

四、Java字节码实例演示

下面是一个简单的Java类:

public class HelloWorld {
    public static void main(String[] args) {
        System.out.println("Hello, World!");
    }
}

该类在编译后会生成“.class”文件,并包含Java字节码。我们可以使用Java反编译器(如“javap”命令)将字节码反编译成类似于Java源代码的格式。以下是反编译的结果:

public class HelloWorld {
  public HelloWorld();
  public static void main(java.lang.String[]);
  static {};
}

从反编译的结果可以看出,该类包含一个默认构造函数、一个主函数和一个静态代码块。

以下是生成的Java字节码:

Classfile /HelloWorld.class
  Last modified 2021-10-08; size 227 bytes
  MD5 checksum 327ad7f7e8cf27c237f9ecc7d41f1045
  Compiled from "HelloWorld.java"
public class HelloWorld
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #5.#19         // java/lang/Object."":()V
   #2 = Fieldref           #20.#21        // java/lang/System.out:Ljava/io/PrintStream;
   #3 = String             #22            // Hello, World!
   #4 = Methodref          #23.#24        // java/io/PrintStream.println:(Ljava/lang/String;)V
   #5 = Class              #25            // java/lang/Object
   #6 = Utf8               
   
   #7 = Utf8               ()V
   #8 = Utf8               Code
   #9 = Utf8               LineNumberTable
  #10 = Utf8               main
  #11 = Utf8               ([Ljava/lang/String;)V
  #12 = Utf8               SourceFile
  #13 = Utf8               HelloWorld.java
  #14 = Utf8               InnerClasses
  #15 = Utf8               BootstrapMethods
  #16 = Methodref          #17.#18        // HelloWorld.lambda$main$0:()V
  #17 = Class              #34            // HelloWorld
  #18 = NameAndType        #35:#36        // lambda$main$0:()V
  #19 = NameAndType        #6:#7          // "
    ":()V
  #20 = Class              #37            // java/lang/System
  #21 = NameAndType        #38:#39        // out:Ljava/io/PrintStream;
  #22 = Utf8               Hello, World!
  #23 = Class              #40            // java/io/PrintStream
  #24 = NameAndType        #41:#42        // println:(Ljava/lang/String;)V
  #25 = Utf8               java/lang/Object
  #26 = Utf8               java/lang/System
  #27 = Utf8               java/io/PrintStream
  #28 = Utf8               java/lang/String
  #29 = Utf8               BootstrapMethods
  #30 = MethodHandle       #6:#43         // invokestatic java/lang/invoke/LambdaMetafactory.metafactory:(Ljava/lang/invoke/MethodHandles$Lookup;Ljava/lang/String;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodHandle;Ljava/lang/invoke/MethodType;)Ljava/lang/invoke/CallSite;
  #31 = MethodType         #7            //  ()V
  #32 = InvokeDynamic      #0:#35         // InvokeDynamic #0:lambda:()V
  #33 = Utf8               HelloWorld
  #34 = Utf8               HelloWorld
  #35 = Utf8               lambda
  #36 = Utf8               ()V
  #37 = Utf8               java/lang/System
  #38 = Utf8               out
  #39 = Utf8               Ljava/io/PrintStream;
  #40 = Utf8               java/io/PrintStream
  #41 = Utf8               println
  #42 = Utf8               (Ljava/lang/String;)V
  #43 = Methodref          #44.#45        // java/lang/invoke/MethodHandles.lookup:()Ljava/lang/invoke/MethodHandles$Lookup;
  #44 = Class              #46            // java/lang/invoke/MethodHandles
  #45 = NameAndType        #47:#48        // lookup:()Ljava/lang/invoke/MethodHandles$Lookup;
  #46 = Utf8               java/lang/invoke/MethodHandles
  #47 = Utf8               lookup
  #48 = Utf8               ()Ljava/lang/invoke/MethodHandles$Lookup;
{
  public HelloWorld();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."
     ":()V
         4: return
      LineNumberTable:
        line 1: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   LHelloWorld;

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=1, args_size=1
         0: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
         3: ldc           #3                  // String Hello, World!
         5: invokevirtual #4                  // Method java/io/PrintStream.println:(Ljava/lang/String;)V
         8: aload_0
         9: invokedynamic #32,  0             // InvokeDynamic #0:lambda:()V
        14: return
      LineNumberTable:
        line 3: 0
        line 4: 8
        line 3: 14
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      15     0  args   [Ljava/lang/String;
}
SourceFile: "HelloWorld.java"
InnerClasses:
     #5; //class java/lang/Object
BootstrapMethods:
  0: #30 invokestatic java/lang/invoke/LambdaMetafactory.metafactory:(Ljava/lang/invoke/MethodHandles$Lookup;Ljava/lang/String;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodHandle;Ljava/lang/invoke/MethodType;)Ljava/lang/invoke/CallSite;
    Method arguments:
      #31 ()V
      invokestatic HelloWorld.lambda$main$0:()V
      #31 ()V

     
    
   
  

从Java字节码可以看出,该类包含一个默认构造函数“HelloWorld()”和一个主函数“main(String[])”。在主函数中,先输出字符串“Hello, World!”,然后调用了一个lambda表达式。在Java字节码中,lambda表达式会被编译成一个带有“invokedynamic”指令的方法。这个方法使用LambdaMetafactory工厂方法动态创建一个函数,以代替lambda表达式的执行。