您的位置:首页 > 其它

从零开始开发JVM语言(七)语义分析的起步

2016-06-07 21:27 295 查看
摘要: 编译器 语义分析

目录戳这里

语法分析结束后,编译才刚刚开始。接下来是语义分析。

语义分析的功能大体来说,是对AST加入类型信息。不过不仅是类型,还有各个变量、方法,各种语句的含义。

例如
Latte-lang
允许的两种写法:

arr1 = [1,2,3]
arr2:[]int = [1,2,3]

两者在语法中区别并不是很大:无非是一个指明了类型一个没有指明而已(语法中可以很轻松得知道“有没有类型”,但是“是什么类型”就不是语法能完成的了)。但是在语义中,就得知道:第一个是
java.lang.Object
类型,第二个是
int
数组类型。而赋的值也随之转变,第一个将会构造一个
lt.util.List
,然后依次add进
1 2 3
。而第二个则是构造一个整型数组,然后对下标0,1,2分别赋值1,2,3。

而就代码量来看,我目前写的Parser带文档注释是2600行左右,而语义分析器带文档注释是7900多行,代码行数差距3倍。可以看出语义分析的复杂度比Parser高很多。

由于要编译到jvm字节码,原有的AST想要直接加入类型信息并生成字节码有点难,于是我又建立了一套新的中间结构。这套结构仿照java的类型体系,构建了

STypeDef
|-----SClassDef-------类,enum
|-----SInterfaceDef---接口
|-----SAnnoDef--------注解
|-----SArrayTypeDef---数组类型
|-----PrimitiveTypeDef
|---------IntTypeDef
|---------FloatTypeDef
|-----...(8种基本类型)
...
SInvokable
|-----SConstructorDef-----构造器
|-----SMethodDef----------方法
|-------SAnnoField-----注解中的“字段”
LeftValue
|-----SFieldDef-----字段
|-----SParameter----参数
|-----LocalVariable-局部变量
Instruction
Value

这张表没有完全揭示其中的关系,不过大致能看出来,类型定义、方法、构造器、字段、参数、局部变量等,已经涵盖了java的方方面面。为了方便转化为字节码,甚至将方法、构造器(实际上字节码中构造器也是一种方法,不过由于其特殊性还是单独拿出来比较合适)的“内容”直接定为指令序列。

这时候不得不学习JVM字节码了。实际上JVM字节码非常简单。字节码结构和java几乎一样。指令集有汇编的影子,却比汇编要简单的多。

细节这里不提了,我的博客有一些字节码的整理。不过如果真要开发jvm语言,jvm规范是不能落下的。

JVM指令集是基于栈的,指令会对
操作数栈(Operand Stack)
进行push和pop。而指令本身也带有一些
操作数(operand)


例如
newarray
可以创建一个数组。它需要一个操作数
atype
,表示数组类型(基本类型),它也会从操作数栈pop出一个操作数,这个操作数必须是
int
型,表示数组长度。最后会向操作数栈push一个值,为创建出的数组。

大致这么用:

iconst_1
newarray I

首先
iconst_1
往操作数栈push一个
int
的1,然后构造一个整数数组,由于pop出的操作数栈为1,所以数组长度为1。最终,操作数栈中将会被push进一个长度为1的int数组的引用。

指令集、字节码都可以在
jvm specification
中找到非常详细的描述。可以在oracle官网下载。

下一章将正式开始语义分析!

最后,希望看官能够关注我的编译器哦~Latte
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  编译器 语义分析