从零开始开发JVM语言(七)语义分析的起步
2016-06-07 21:27
295 查看
摘要: 编译器 语义分析
目录戳这里
语法分析结束后,编译才刚刚开始。接下来是语义分析。
语义分析的功能大体来说,是对AST加入类型信息。不过不仅是类型,还有各个变量、方法,各种语句的含义。
例如
两者在语法中区别并不是很大:无非是一个指明了类型一个没有指明而已(语法中可以很轻松得知道“有没有类型”,但是“是什么类型”就不是语法能完成的了)。但是在语义中,就得知道:第一个是
而就代码量来看,我目前写的Parser带文档注释是2600行左右,而语义分析器带文档注释是7900多行,代码行数差距3倍。可以看出语义分析的复杂度比Parser高很多。
由于要编译到jvm字节码,原有的AST想要直接加入类型信息并生成字节码有点难,于是我又建立了一套新的中间结构。这套结构仿照java的类型体系,构建了
这张表没有完全揭示其中的关系,不过大致能看出来,类型定义、方法、构造器、字段、参数、局部变量等,已经涵盖了java的方方面面。为了方便转化为字节码,甚至将方法、构造器(实际上字节码中构造器也是一种方法,不过由于其特殊性还是单独拿出来比较合适)的“内容”直接定为指令序列。
这时候不得不学习JVM字节码了。实际上JVM字节码非常简单。字节码结构和java几乎一样。指令集有汇编的影子,却比汇编要简单的多。
细节这里不提了,我的博客有一些字节码的整理。不过如果真要开发jvm语言,jvm规范是不能落下的。
JVM指令集是基于栈的,指令会对
例如
大致这么用:
首先
指令集、字节码都可以在
下一章将正式开始语义分析!
最后,希望看官能够关注我的编译器哦~Latte
目录戳这里
语法分析结束后,编译才刚刚开始。接下来是语义分析。
语义分析的功能大体来说,是对AST加入类型信息。不过不仅是类型,还有各个变量、方法,各种语句的含义。
例如
Latte-lang允许的两种写法:
arr1 = [1,2,3] arr2:[]int = [1,2,3]
两者在语法中区别并不是很大:无非是一个指明了类型一个没有指明而已(语法中可以很轻松得知道“有没有类型”,但是“是什么类型”就不是语法能完成的了)。但是在语义中,就得知道:第一个是
java.lang.Object类型,第二个是
int数组类型。而赋的值也随之转变,第一个将会构造一个
lt.util.List,然后依次add进
1 2 3。而第二个则是构造一个整型数组,然后对下标0,1,2分别赋值1,2,3。
而就代码量来看,我目前写的Parser带文档注释是2600行左右,而语义分析器带文档注释是7900多行,代码行数差距3倍。可以看出语义分析的复杂度比Parser高很多。
由于要编译到jvm字节码,原有的AST想要直接加入类型信息并生成字节码有点难,于是我又建立了一套新的中间结构。这套结构仿照java的类型体系,构建了
STypeDef |-----SClassDef-------类,enum |-----SInterfaceDef---接口 |-----SAnnoDef--------注解 |-----SArrayTypeDef---数组类型 |-----PrimitiveTypeDef |---------IntTypeDef |---------FloatTypeDef |-----...(8种基本类型) ... SInvokable |-----SConstructorDef-----构造器 |-----SMethodDef----------方法 |-------SAnnoField-----注解中的“字段” LeftValue |-----SFieldDef-----字段 |-----SParameter----参数 |-----LocalVariable-局部变量 Instruction Value
这张表没有完全揭示其中的关系,不过大致能看出来,类型定义、方法、构造器、字段、参数、局部变量等,已经涵盖了java的方方面面。为了方便转化为字节码,甚至将方法、构造器(实际上字节码中构造器也是一种方法,不过由于其特殊性还是单独拿出来比较合适)的“内容”直接定为指令序列。
这时候不得不学习JVM字节码了。实际上JVM字节码非常简单。字节码结构和java几乎一样。指令集有汇编的影子,却比汇编要简单的多。
细节这里不提了,我的博客有一些字节码的整理。不过如果真要开发jvm语言,jvm规范是不能落下的。
JVM指令集是基于栈的,指令会对
操作数栈(Operand Stack)进行push和pop。而指令本身也带有一些
操作数(operand)。
例如
newarray可以创建一个数组。它需要一个操作数
atype,表示数组类型(基本类型),它也会从操作数栈pop出一个操作数,这个操作数必须是
int型,表示数组长度。最后会向操作数栈push一个值,为创建出的数组。
大致这么用:
iconst_1 newarray I
首先
iconst_1往操作数栈push一个
int的1,然后构造一个整数数组,由于pop出的操作数栈为1,所以数组长度为1。最终,操作数栈中将会被push进一个长度为1的int数组的引用。
指令集、字节码都可以在
jvm specification中找到非常详细的描述。可以在oracle官网下载。
下一章将正式开始语义分析!
最后,希望看官能够关注我的编译器哦~Latte
相关文章推荐
- 浅谈汇编器、编译器和解释器
- 让我们做个简单的解释器(三)
- 让我们做个简单的解释器(一)
- 用 350 行代码从零开始,将 Lisp 编译成 JavaScript
- 基于JSP编译器基本语法的使用详解
- C#命令行编译器配置方法
- Java虚拟机JVM性能优化(二):编译器
- AngularJS HTML编译器介绍
- 实现接口时@Override注解问题
- 条款06:若不想使用编译器自动生成的函数,就该明确拒绝
- g++编译 参数 .
- 关于 ndk和jni的区别
- vim中的杀手级插件: YouCompleteMe
- Google C++ unit test 在ARM Android 2.3 上的编译与使用
- 从代码示例了解ECMAScript5新特性
- Java的可移植性受到广泛使用
- C++ .H .CPP
- Windows Server 2003远程桌面多用户连接问题
- centos下安装nginx