您的位置:首页 > 编程语言 > Java开发

早期(编译期)优化

2017-05-12 18:45 225 查看

早期(编译期)优化

早期编译期优化

Basic

Javac编译器
解析与填充符号表
词法 语法分析

填充符号表

注解处理器

语义分析与字节码生成
标注检查

数据及控制流分析

解语法糖

字节码生成

Java语法糖的味道
泛型与类型擦除

自动装箱 拆箱与遍历循环

条件编译

ref

Basic

Java语言的“编译期”, 前端编译器(其实叫“编译器的前端”更准确一些)把xx.java文件转变成xx.class文件的过程(普遍认知);也可能是指虚拟机的后端运行期编译器(JIT编译器,Just In Time Compiler)把字节码转变成机器码的过程;还可能是指使用静态提前编译器(AOT编译器,Ahead Of Time Compiler)直接把xx.java文件编译成本地机器代码的过程。

虚拟机设计团队把对性能的优化集中到了后端的即时编译器中,这样可以让那些不是由Javac产生的Class文件(如JRuby、 Groovy等语言的Class文件)也同样能享受到编译器优化所带来的好处。相当多新生的Java语法特性,都是靠编译器的“语法糖”来实现,而不是依赖虚拟机的底层改进来支持。



Javac编译器

Javac的编译过程

解析与填充符号表过程。

插入式注解处理器的注解处理过程。

分析与字节码生成过程





解析与填充符号表

词法、 语法分析

词法分析是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程的最小元素,而标记则是编译过程的最小元素,关键字、 变量名、 字面量、 运算符都可以成为标记,如“int a=b+2”这句代码包含了6个标记,分别是int、a、=、b、+、2,虽然关键字int由3个字符构成,但是它只是一个Token,不可再拆分。在Javac的源码中,词法分析过程由
com.sun.tools.javac.parser.Scanner
类来实现。

语法分析是根据Token序列构造抽象语法树的过程,抽象语法树(Abstract Syntax Tree,AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构(Construct),例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。构造了AST之后,编译器就基本不会再对源码文件进行操作了,后续的操作都建立在抽象语法树之上。

填充符号表

符号表(Symbol Table)是由一组符号地址和符号信息构成的表格,读者可以把它想象成哈希表中K-V值对的形式(实际上符号表不一定是哈希表实现,可以是有序符号表、树状符号表、栈结构符号表等)。 符号表中所登记的信息在编译的不同阶段都要用到。在语义分析中,符号表所登记的内容将用于语义检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码。在目标代码生成阶段,当对符号名进行地址分配时,符号表是地址分配的依据。

注解处理器

注解(Annotation)在运行期间发挥作用;

语义分析与字节码生成

语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。而语义分析的主要任务是对结构上正确的源程序进行上下文有关性质的审查,如进行类型审查(类型是否匹配,支持某种操作,否则无法通过编译)。

标注检查

Javac的编译过程中,语义分析过程分为标注检查, 数据及控制流分析

标注检查:检查变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等;还有常量折叠 –
a = 1 + 2
, AST树上还能看到各个token,经过常量折叠后,它们会折叠为常量3。

标注检查步骤在Javac源码中的实现类是com.sun.tools.javac.comp.Attr类和com.sun.tools.javac.comp.Check类

数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否有赋值、 方法的每条路径是否都有返回值、 是否所有的受查异常都被正确处理了等问题。

编译时期的数据及控制流分析与类加载时的数据及控制流分析的目的基本上是一致的,但校验范围有所区别,有一些校验项只有在编译期或运行期才能进行。

Class文件中不可能知道一个局部变量是不是声明为final;局部变量与字段(实例变量、类变量)是有区别的,它在常量池中没有CONSTANT_Fieldref_info的符号引用,自然就没有访问标志(Access_Flags)的信息,甚至可能连名称都不会保留下来。将局部变量声明为final,对运行期是没有影响的,变量的不变性仅仅由编译器在编译期间保障

Javac的源码中,数据及控制流分析的入口是图10-5中的flow()方法,具体操作由com.sun.tools.javac.comp.Flow类来完成。

解语法糖

语法糖(Syntactic Sugar),指在计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更方便程序员使用。Java中最常用的语法糖主要是前面提到过的泛型、变长参数、自动装箱/拆箱等,虚拟机运行时不支持这些语法,它们在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖。

Javac的源码中,解语法糖的过程由desugar()方法触发,在com.sun.tools.javac.comp.TransTypes类和com.sun.tools.javac.comp.Lower类中完成

字节码生成

字节码生成阶段不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。

实例构造器<init>()方法和类构造器<clinit>()方法就是在这个阶段添加到语法树之中的(注意,这里的实例构造器并不是指默认构造函数,如果用户代码中没有提供任何构造函数,那编译器将会添加一个没有参数的、 访问性(public、protected或private)与当前类一致的默认构造函数 – 在填充符号表阶段就已经完成),这两个构造器的产生过程实际上是一个代码收敛的过程,编译器会把语句块(对于实例构造器而言是“{}”块,对于类构造器而言是“static{}”块)、变量初始化(实例变量和类变量)、调用父类的实例构造器(仅仅是实例构造器,<clinit>()方法中无须调用父类的<clinit>()方法,虚拟机会自动保证父类构造器的执行,但在<clinit>()方法中经常会生成调用java.lang.Object的<init>()方法的代码)等操作收敛到<init>()和<clinit>()方法之中,并且保证一定是按先执行父类的实例构造器,然后初始化变量,最后执行语句块的顺序进行,上面所述的动作由Gen.normalizeDefs()方法来实现。除了生成构造器以外,还有其他的一些代码替换工作用于优化程序的实现逻辑,如把字符串的加操作替换为StringBuffer或StringBuilder(取决于目标代码的版本是否大于或等于JDK 1.5)的append()操作等。

完成了对语法树的遍历和调整之后,就会把填充了所有所需信息的符号表交给com.sun.tools.javac.jvm.ClassWriter类,由这个类的writeClass()方法输出字节码,生成最终的Class文件,到此为止整个编译过程宣告结束。

Javac源码里面由com.sun.tools.javac.jvm.Gen类来完成。

Java语法糖的味道

泛型与类型擦除

本质是参数化类型(Parametersized Type),也就是说所操作的数据类型被指定为一个参数,JDK1.5之前,如果仅仅依赖程序员去类型转换的正确性,许多ClassCastException的风险就会在程序运行期出现。

C#里面泛型无论在程序源码中、 编译后的IL中(Intermediate Language,中间语言,这时候泛型是一个占位符),或是运行期的CLR中,都是切实存在的,List<int>与List<String>就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和类型数据,这种实现称为类型膨胀,基于这种方法实现的泛型称为真实泛型

Java语言中的泛型只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型(Raw Type,也称为裸类型)了,并且在相应的地方插入了强制转型代码,因此,对于运行期的Java语言来说,ArrayList<int>与ArrayList<String>就是同一个类,所以泛型技术实际上是Java语言的一颗语法糖,Java语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型

Java泛型写就的代码,编译后进行反编译,发现泛型不见了。泛型变成了原生类型。

public class GenericTypes {

public static void method(List<String> list) {
System.out.println("invoke method(List<String> list)");
}

public static void method(List<Integer> list) {
System.out.println("invoke method(List<Integer> list)");
}
}
# compile
Error:(15, 24) java: 名称冲突:method(java.util.List<java.lang.Integer>)和method(java.util.List<java.lang.String>)具有相同签名。


参数List<Integer>和List<String>编译之后都被擦除了,变成了一样的原生类型List<E>,擦除动作导致这两种方法的特征签名变得一模一样。 (注:书中将两个方法的返回类型改成不一样的,运行时就能够编译运行,但是实际上JDK1.8中已经不可以了,应该是严格遵守了方法重载要求方法具备不同的特征签名,返回值并不包含在方法的特征签名之中,所以返回值不参与重载选择)

虚拟机规范由于Java泛型引入了诸如Signature、 LocalVariableTypeTable等新的属性用于解决伴随泛型而来的参数类型的识别问题,Signature是其中最重要的一项属性,它的作用就是存储一个方法在字节码层面的特征签名,这个属性中保存的参数类型并不是原生类型,而是包括了参数化类型的信息

从Signature属性的出现我们还可以得出结论,擦除法所谓的擦除,仅仅是对方法的Code属性中的字节码进行擦除,实际上元数据中还是保留了泛型信息,这也是我们能通过反射手段取得参数化类型的根本依据。

自动装箱、 拆箱与遍历循环

遍历循环则把代码还原成了迭代器的实现,这也是为何遍历循环需要被遍历的类实现Iterable接口的原因

自动装箱、 拆箱在编译之后被转化成了对应的包装和还原方法,如本例中的Integer.valueOf()与

Integer.intValue()方法

变长参数,它在调用的时候变成了一个数组类型的参数

public static void main(String[] args) {
List<Integer> list = Arrays.asList(1, 2, 3, 4);
// 如果在JDK 1.7中,还有另外一颗语法糖 ,
// 能让上面这句代码进一步简写成List<Integer> list = [1, 2, 3, 4];
int sum = 0;
for (int i : list) {
sum += i;
}
System.out.println(sum);
}


# 编译后反编译的代码。
public static void main(String[] var0) {
List var1 = Arrays.asList(new Integer[]{Integer.valueOf(1), Integer.valueOf(2), Integer.valueOf(3), Integer.valueOf(4)});
int var2 = 0;

int var4;
for(Iterator var3 = var1.iterator(); var3.hasNext(); var2 += var4) {
var4 = ((Integer)var3.next()).intValue();
}

System.out.println(var2);
}


public static void main(String[] args) {
Integer a = 1;
Integer b = 2;
Integer c = 3;
Integer d = 3;
Integer e = 321;
Integer f = 321;
Long g = 3L;
System.out.println(c == d); // true
System.out.println(e == f); // false
System.out.println(c == (a + b)); // true
System.out.println(c.equals(a + b)); // true
System.out.println(g == (a + b)); // true
System.out.println(g.equals(a + b)); // false
}

output:
true
false
true
true
true
false


equals()方法不处理数据转型的关系; Integer和Long都对-128到127进行了缓存。

条件编译

Java语言当然也可以进行条件编译,方法就是使用条件为常量的if语句。

public static void main(String[] args) {
if (true) {
System.out.println("block 1");
} else {
System.out.println("block 2");
}
}

# 编译后反编译的结果如下:
public static void main(String[] var0) {
System.out.println("block 1");
}


ref

深入理解Java虚拟机(第二版)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  java