由于笔者最近几天小病了一场,几天没有更新了,对朋友们说一声抱歉,同时也提醒亲爱的朋友们,身体是革命的本钱,一点也不假啊!
不过笔者现在好了,还能大跳了!还是那句话,每天天进步一点点!
在上一篇中,我们讨论编译执行和解释执行中,我们已经分析过了,Java的编译过程划分是没有那么明确的,可能会经过三类编译器的加工。
1. 前端编译器:负责把Java文件编译成Class文件,如Sun的Javac;
2. 后端运行期编译器(JIT编译器):负责把Class文件的字节码转换成机器码,如HotSpot 的C1,C2编译器;
3. 静态提前编译器(AOT编译器):直接将Java文件部分内容编译成本地机器代码,如GCJ。
今天我们着重学习Javac编译器。
Javac编译器是使用Java语言编写的,我们可以下载OpenJDK的源码,解压后在openjdk\langtools\src\share\classes\com\sun\tools\javac文件夹下便是该Javac编译器的源码。
Javac编译器的处理包含以下3个过程:
1. 解析与填充符号表过程
1.1 词法分析
将源代码的字符流转变为标记(Token)集合,就是将语句拆分成单词或符号的过程,如int sum = a1+ b2,拆分之后为(int,sum,=,a1,+,b2),这个集合内的每一个元素都是一个标记(Token)。
1.2 语法分析
根据 Token 序列构造抽象语法树,抽象语法树(Abstract Syntax Tree,AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构(Construct),例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。
1.3 填充符号表
符号表(Symbol Table)是由一组符号地址和符号信息构成的表格,符号表所登记的内容将用于语义检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码。在目标代码生成阶段,当对符号名进行地址分配时,符号表是地址分配的依据。
2. 插入式注解处理器的注解处理过程
注解:在运行期间发挥作用;
插入式注解处理器:读取,修改,添加抽象语法树中的任意元素。如果对语法树进行了修改,需要重新解析及回填,注解的出现大大地方便了代码的编写。
3. 分析与字节码生成过程
语义分析:对结构上正确的源程序进行上下文审查,语义分析包括两个过程:
3.1 标注检查:检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。在标注检查步骤中,还有一个重要的动作称为常量折叠。
3.2 数据及控制流分析:对程序上下文逻辑更进一步的验证,它可以检测出诸如程序局部变量是在使用前是否有赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理了等问题。
3.3 解语法糖
语法糖:指在计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更方便程序员使用。
3.3.1 泛型与类型擦除
Java的泛型属于伪泛型,它只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型了。
3.3.2 自动装箱,拆箱与遍历循环
关于包装类型只着重说一点:包装类的“==” 运算在不遇到算术运算的情况下不会自动拆箱,以及它们 equals() 方法不处理数据转型的关系,数值比较的时候最好还是使用基本数据类型。
3.3.3 条件编译
编译器在编译的时候并不是原封不动的进行编译,会将分支中不成立的代码块消除掉。
3.4 字节码生成
不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。
喜欢文章或想一起学习的朋友可以关注我,给我点赞,我将会持续更新,有什么疑问或文中有不当之处请给我留言,真诚地希望能与大家一起交流探讨,学习进步!
举报/反馈

余探名

213获赞 131粉丝
探诗词经典 取国风好名
关注
0
0
收藏
分享