您的位置:首页 > 编程语言

2440init.s 汇编代码分析

2014-08-24 23:05 351 查看
板子上电后就会从这里开始执行,主要完成基本初始化,还有判断是从nor还是nand启动,再实现把程序搬到SDRAM当中,在搬运成功后再跳到main函数里面执行。

我们现在开始来看看它的具体代码吧!

GET和INCLUDE的功能是相同的,功能都是引进一些编译过的文件。

GET option.inc

GET memcfg.inc

GET 2440addr.inc

定义SDRAM工作在Reflesh模式下,SDRAM有两种刷新模式:selfreflesh,autoreflesh。后者是在其使用过程当中设置的。

BIT_SELFREFRESHEQU (1<<22)

下面是对arm处理器模式寄存器对应的常数进行赋值,arm处理器有一个CPSR寄存器,它的后五位决定了处理器处于哪个模式下。可以看出常数的定义都不会超过后5位的。

USERMODE EQU 0x10

FIQMODE EQU 0x11

IRQMODE EQU 0x12

SVCMODE EQU 0x13

ABORTMODE EQU 0x17

UNDEFMODE EQU 0x1b

MODEMASK EQU 0x1f

NOINT EQU 0xc0

各个异常模式的堆栈

UserStack EQU(_STACK_BASEADDRESS-0x3800) ;0x33ff4800 ~

SVCStack EQU (_STACK_BASEADDRESS-0x2800) ;0x33ff5800 ~

UndefStack EQU (_STACK_BASEADDRESS-0x2400) ;0x33ff5c00 ~

AbortStack EQU (_STACK_BASEADDRESS-0x2000) ;0x33ff6000 ~

IRQStack EQU (_STACK_BASEADDRESS-0x1000) ;0x33ff7000 ~

FIQStack EQU (_STACK_BASEADDRESS-0x0) ;0x33ff8000 ~

这 一段是统一arm的工作状态和对应的软件编译方式(16位编译环境使用tasm.exe编译)。arm处理器的工作状态分为两种:32位,arm执行字对 齐的arm指令集;16位,arm执行半字对齐的Thumb指令集。不同的工作状态,编译方式也不一样。所以下面的程序就是判断arm的工作方式来确定它 的编译方式。

GBLL THUMBCODE//定义THUMBCODE 这个变量GBLL 声明一个全局逻辑变量并初始化为{FALSE}

[ {CONFIG} = 16//"["表示"if","|"表示"else","]"表示"endif",对于CONFIG是在ADS编译中定义的内部变量。

THUMBCODE SETL {TRUE}

CODE32

|

THUMBCODE SETL {FALSE}

]//如果ARM是在16位的工作状态的话,就使全局变量THUMBCODE设置为ture。

MACRO//这个是宏定义的关键字

MOV_PC_LR//作用是子程序返回

[ THUMBCODE

bx lr//当目标程序是Thumb时,就要使用BX跳转返回,并转换模式。

|

mov pc,lr//目标程序是ARM指令集,直接把lr赋给pc就可以了。

]

MEND//宏定义的结束标志。

MACRO

MOVEQ_PC_LR//这个是带“相等”条件的子程序返回。和上面说的类似。

[ THUMBCODE

bxeq lr

|

moveq pc,lr

]

MEND

在宏定义下面的handlexxx HANDLERhandlexxx都会展成以下的程序段,这段程序主要把中断服务程序的入口地址传送给pc,在程序的用34字空间来存放中断服务程序的入口地址,每个字空间都会有一个标号,以handlerxxx开头的。

MACRO

$HandlerLabel HANDLER $HandleLabel

$HandlerLabel

sub sp,sp,#4 //先预留空间,为了存储跳转地址。

stmfd sp!,{r0} //把工作寄存器按入堆栈。

ldr r0,=$HandleLabel

ldr r0,[r0] //这两句的功能是把中断程序的入口地址先放在中间变量r0处。

str r0,[sp,#4]//把中断服务程序的入口地址按入堆栈。

ldmfd sp!,{r0,pc}//最后把堆栈中的中断程序入口地址弹给pc寄存器,这样就可以执行相应的中断服务程序了。

MEND

S3C2440有两种中断模式:一种有中断向量表的,一种则没有。有表的话实时性比较好。当一个外部中断0发生后,程序自动跳转到地址0x20 处,0x20地址单元的指令为“ldr pc, = HandlerEINT0”,因此程序跳转到HandlerEINT0处执行这个宏操作,就是把外部中断地址赋给PC。

一个arm程序是由R0,RW,ZI三个段组成。其中R0为代码段,RW是已经初始化的全局变量,ZI是未初始化的全局变量,BOOTLOADER要将RW段复制到RAM中并将ZI段清零。

编译器使用下列段来记录各段的起始地址和结束地址

|Image$$RO$$Base| ; RO 段起始地址|Image$$RO$$Limit| ;RO 段结束地址加1|Image$$RW$$Base| ;RW 段起始地址

|Image$$RW$$Limit| ; RW 段结束地址加1|Image$$ZI$$Base| ; ZI 段起始地址|Image$$ZI$$Limit| ; ZI 段结束地址加1

这些标号的值是通过编译器的设定来确定的如编译软件中对ro-base 和rw-base 的设定,例如ro-base=0xc000000rw-base=0xc5f0000,在这里用IMPORT 伪指令( 和c 语言的extren 一样) 引入|Image$$RO$$Base|,|Image$$RO$$Limit|...等比较古怪的变量是编译器生成的。RO, RW, ZI 这三个段都保存在Flash 中,但RW,ZI 在Flash 中的地址肯定不是程序运行时变量所存储的位置,因此我们的程序在初始化时应该把Flash
中的RW,ZI 拷贝到RAM 的对应位置。这些变量是通过ADS 的工程设置里面设定的RO Base 和RW Base 设定的,最终由编译脚本和连接程序导入程序.

IMPORT |Image$$RO$$Base|

IMPORT|Image$$RO$$Limit|

IMPORT |Image$$RW$$Base|

IMPORT |Image$$ZI$$Base|

IMPORT|Image$$ZI$$Limit|

引入外部变量mmu的快速总线模式和同步总线模式两个变量

IMPORTMMU_SetAsyncBusMode

IMPORT MMU_SetFastBusMode

我们所熟知的main函数

IMPORT Main

把镜像从Nandflash拷贝到SDRAM的函数

IMPORT RdNF2SDRAM

定义arm汇编程序段,段名叫init段,为只读段

AREA Init,CODE,READONLY

ENTRY

EXPORT __ENTRY//导出__ENTRY标号

__ENTRY

ResetEntry

ASSERT:DEF:ENDIAN_CHANGE//判断模式改变是否定义过(ASSERT是伪指令,:DEF:lable判断lable是否定义过了)

[ ENDIAN_CHANGE

ASSERT :DEF:ENTRY_BUS_WIDTH//判断是否定义了总线宽度

[ENTRY_BUS_WIDTH=32//如果存储器是32位的总线宽度

b ChangeBigEndian ;DCD 0xea000007

]

[ENTRY_BUS_WIDTH=16//如果存储器是16位的总线宽度

andeq r14,r7,r0,lsl #20 ;DCD 0x0007ea00

]

[ENTRY_BUS_WIDTH=8//如果是存储器是8位总线宽度

streq r0,[r0,-r10,ror #1] ;DCD 0x070000ea

]

|//如果总线宽度没有定义的话,就直接跳转到复位中断

b ResetHandler//程序执行的地跳跳转指令

]

b HandlerUndef;handler for Undefined mode

b HandlerSWI ;handler for SWI interrupt

b HandlerPabort ;handler for PAbort

b HandlerDabort ;handler for DAbort

b . ;reserved

b HandlerIRQ ;handler for IRQ interrupt

b HandlerFIQ ;handler for FIQ interrupt

;@0x20

b EnterPWDN ; Must be @0x20.//进入powerdown模式

以上8条跳转指令,是8个异常中断处理向量,一定要按照顺序排好,据我了解,每次出现异常的话,是由硬件自行查表的。

HandlerFIQ HANDLERHandleFIQ

HandlerIRQ HANDLER HandleIRQ

HandlerUndef HANDLER HandleUndef

HandlerSWI HANDLER HandleSWI

HandlerDabort HANDLER HandleDabort

HandlerPabort HANDLER HandlePabort

下面这段程序很重要,他是实现第二次查表的程序。arm把所有中断都归为一个IRQ和一个FIRQ中断异常,我们为了要知道具体的中断,从而才可以跳到中断对应的中断服务程序。

IsrIRQ

sub sp,sp,#4 //保留pc寄存器的值

stmfd sp!,{r8-r9}//把r8 r9按入堆栈

ldrr9,=INTOFFSET//把中断偏移INTOFFSET的地址装入r9里面

ldr r9,[r9]//取出INTOFFSET单元里面的值给r9

ldr r8,=HandleEINT0//向量表的入口地址赋给r8

add r8,r8,r9,lsl #2//求出具体中断向量的地址

ldr r8,[r8]//中断向量里面存储的中断服务程序的入口地址赋给r8

str r8,[sp,#8]//按入堆栈

ldmfd sp!,{r8-r9,pc}//堆栈弹出,跳转到相应的中断服务程序

LTORG//声明文字池

板子上电后就,程序就执行0x00处的b ResetHandler

ResetHandler

ldr r0,=WTCON //关闭看门狗

ldr r1,=0x0

str r1,[r0]

ldr r0,=INTMSK

ldr r1,=0xffffffff //关闭所有中断

str r1,[r0]

ldr r0,=INTSUBMSK

ldr r1,=0x7fff //关闭所有子中断

str r1,[r0]

[ {FALSE}

;rGPFDAT = (rGPFDAT & ~(0xf<<4)) | ((~data &0xf)<<4);

; Led_Display

ldr r0,=GPBCON

ldr r1,=0x155500

str r1,[r0]//使GPB10~GPB4为输出口,GPB3~GPB0为输入口

ldr r0,=GPBDAT

ldr r1,=0x0

str r1,[r0]//使GPB10~GPB4输出为低电平,GPB3~GPB0输入为低电平

]

通过数据手册可以发现,当输出为1时,LED灭,反之亦然。

LOCKTIME是pll的lock time计数器。为了减少pll的lock time,调整LOCKTIME寄存器。

ldr r0,=LOCKTIME

ldr r1,=0xffffff//赋给这个值后,UPLL和MPLL的locktime的值都会设定好了。具体为什么是设定这个值,你就去问问三星公司吧,我也不太懂。

str r1,[r0]

说 到这里,大家可能不太懂。我就在这里细说一下吧。这个涉及到arm9的时钟模块的知识。arm9有个时钟控制逻辑,它可以产生cpu的FCLK时钟、 AHB总线外围接口器件的HCLK时钟以及APB总线外围接口器件的PCLK时钟。arm9有两个锁相环PLL,一个用于FCLK、HCLK、HCLK。 一个用于USB模块。这两个PLL我们分别称之为MPLL和UPLL。在系统复位之后,PLL按照默认的配置进行操作,由于认为它这时是一个不稳定的状 态,所以这时用外部时钟作为FCLK时钟的输出。只有当向PLLCON寄存器设置相应的值后,PLL就会按照软件设置的频率运行了。这时就换成使用PLL
的输出作为FCLK了。对于FCLK先后不是有两次不同时钟作为输入,这样就余姚一个适应的时间,这个时间的设定就是我们这里在LOCKTIME寄存器里 面设置的常数啦。

[ PLL_ON_START//设置CLKDIVN的值在PLL锁存时间之后有效。

ldr r0,=CLKDIVN

ldrr1,=CLKDIV_VAL ; 0=1:1:1, 1=1:1:2, 2=1:2:2, 3=1:2:4, 4=1:4:4, 5=1:4:8,6=1:3:3, 7=1:3:6.

str r1,[r0]

可以看出是对FCLK、PCLK以及HCLK三者的比率设置。只要通过对CLKDIVN执行操作就可以得到相应需要的比率了。

[CLKDIV_VAL>1 //如果 Fclk:Hclk不是1:1的话执行下面

mrcp15,0,r0,c1,c0,0

orr r0,r0,#0xc0000000;R1_nF:OR:R1_iA

mcr p15,0,r0,c1,c0,0

|

mrc p15,0,r0,c1,c0,0

bic r0,r0,#0xc0000000;R1_iA:OR:R1_nF

mcr p15,0,r0,c1,c0,0

]

这里可以看出,如果FCLK:HCLK不是1:1的关系的话,就要转成异步总线模式。反之,如果是这个比例关系的话,就转成快速总线模式。

ldr r0,=UPLLCON//对UPLL进行配置

ldr r1,=((U_MDIV<<12)+(U_PDIV<<4)+U_SDIV)//这里就是非常熟悉的PMS啦,Fin = 12.0MHz, UCLK =48MHz

str r1,[r0]

nop ; Caution: After UPLL setting, at least 7-clocks delay must be insertedfor setting hardware be completed.

nop

nop

nop

nop

nop

nop

ldr r0,=MPLLCON//对MPLL进行配置

ldr r1,=((M_MDIV<<12)+(M_PDIV<<4)+M_SDIV) ;Fin = 12.0MHz, FCLK = 400MHz

str r1,[r0]

]

ldr r1,=GSTATUS2

ldr r0,[r1]

tst r0,#0x2

判断是否是从休眠模式唤醒的,对GSTATUS2[2]的检测就可以判断出是否从休眠模式唤醒的。

bne WAKEUP_SLEEP//如果是的话就跳转。

EXPORTStartPointAfterSleepWakeUp//定义一个外部的StartPointAfterSleepWakeUp

StartPointAfterSleepWakeUp

adrlr0, SMRDATA

ldr r1,=BWSCON

add r2, r0, #52

0

ldr r3, [r0], #4

str r3, [r1], #4

cmp r2, r0

bne %B0

这段代码的作用就是设置存储控制器。在代码的后面有一个SMRDATA的数据区,用r0来定义它的起始地址,用r2来定义它的结束地址。r3是代表那13个存储控制器.代码很明显,就是把内存的数据赋给这13个存储控制器里面的。

ldr r0,=GPFCON

ldr r1,=0x0

str r1,[r0]//对GPF设置为输入的功能

ldr r0,=GPFUP

ldr r1,=0xff

str r1,[r0]//禁止上拉电阻

ldr r1,=GPFDAT

ldr r0,[r1]

bic r0,r0,#(0x1e<<1)//bic是r0与#(0x1e<<1)的反码按位相与。

tst r0,#0x1//这里就是测试最后一位是否为0,为0时说明是有按键按下了。

bne %F1//当按键0没有被按下的时候,就跳转啦。

这段代码是检测EINT0是否被按下了。

ldr r0,=GPFCON

ldr r1,=0x55aa

str r1,[r0]//GPF7~GPF4设置为输出,GPF3~GPF0设置为EINT0~EINT3

ldr r0,=GPFDAT

ldr r1,=0x0

str r1,[r0] //很明显,GPF7~GPF4设置为LED灯的控制,低电平全部亮了。起到指示的用途。

mov r1,#0

mov r2,#0

mov r3,#0

mov r4,#0

mov r5,#0

mov r6,#0

mov r7,#0

mov r8,#0

ldrr9,=0x4000000 ;64MB

ldr r0,=0x30000000

0

stmia r0!,{r1-r8}

subs r9,r9,#32

bne %B0

很明显可以看出,程序利用r1~r8这几个寄存器把0x30000000到0x34000000的内存全部清零了。

1

bl InitStacks//初始化堆栈

ldr r0, =BWSCON

ldr r0, [r0]

ands r0, r0, #6//OM[1:0] != 0, 从NOR FLash或者内存启动,不用读取NAND FLASH

bne copy_proc_beg//不需要从NAND FLASH启动就在这里跳转啦

adr r0,ResetEntry//OM[1:0] == 0,就从NAND FLash启动

cmp r0, #0//在进行比较,是否入口地址是在0处,如果不是则是用仿真器

bne copy_proc_beg//仿真器也不需要在NAND FLASH启动

nand_boot_beg

[ {TRUE}

bl RdNF2SDRAM

]

ldr pc,=copy_proc_beg

我们来看下RdNF2SDRAM具体是怎么工作的,这段代码的作用就是把NAND的程序读到RAM里面。

void RdNF2SDRAM( )

{

U32 i;

U32 start_addr = 0x0;

unsigned char * to = (unsigned char *)0x30000000;

U32 size = 0x100000;//可以算出是8M的大小。

rNF_Init();//我们来仔细看看这个函数吧。

如下:

static void rNF_Init(void)

{

rNFCONF = (TACLS<<12)|(TWRPH0<<8)|(TWRPH1<<4)|(0<<0);//TACLS=1,TWRPH0=4,TWRPH1=0初始化ECC,CLE&ALE持续时间的设置,TWRPH0 和TWRPH1持续时间的设置。

rNFCONT =(0<<13)|(0<<12)|(0<<10)|(0<<9)|(0<<8)|(1<<6)|(1<<5)|(1<<4)|(1<<1)|(1<<0);//在读写 NANDFLASH之前,对6,5,4位的设置是确保可以使用ECC;对13位清零,使得可以写,擦除还有读0x4E000038~0x4E00003C区域的内容;由于对于这范围区域的读写我们不加任何限制,所以我们就不用设置中断来通知系统这个范围的区域被读写了,也就是10位清零了;RnB是表示存 储器现在是否处于忙碌状态,9位的设置为1时,表示可以用中断来通知CPU现在存储器的状态,而8位的设置是用来说明是上升沿触发还是下降沿触发。

rNFSTAT = 0;

rNF_Reset();

}

我们来看下rNF_Reset()它的具体代码吧,代码如下:

static void rNF_Reset()

{

NF_CE_L();

NF_CLEAR_RB();

NF_CMD(CMD_RESET);

NF_DETECT_RB();

NF_CE_H();

}

代码看上去很烦人,其实不是的,就是一堆宏定义,我直接翻译一下吧,翻译如下:

rNFCONT &=~(1<<1); //位1清零,表示片选使能,这样片子就可以工作了。

rNFSTAT |= (1<<2);//清零2位,这里不需要判断片子是否忙碌。

rNFCMD =(CMD_RESET);//其中CMD_RESET=0xff。

while(!(rNFSTAT&(1<<2)));//当RnB从低电平变换到高电平的时候,就会跳出这个循环。就是在等待NANDFLASH操作完毕。

rNFCONT |= (1<<1);//使片子停止工作。

这样NANDFLASH的初始化工作终于完成了。我们现在回到RdNF2SDRAM里面来,接着往下分析。

switch(rNF_ReadID())我们来分析一下里面这个函数吧,代码如下:

static char rNF_ReadID()

{

char pMID;

char pDID;

char nBuff;

char n4thcycle;

int i;

NF_nFCE_L();//又是使能片子工作

NF_CLEAR_RB();//清除NFSTAT的2位,为以后判断片子是否工作完毕。

NF_CMD(CMD_READID); //往NFCMD送读ID指令。

NF_ADDR(0x0);//往NFADDR送地址

for ( i = 0; i < 100; i++ );

pMID =NF_RDDATA8();

pDID = NF_RDDATA8();

nBuff = NF_RDDATA8();

n4thcycle = NF_RDDATA8();

NF_nFCE_H();

return (pDID);

}//最后返回pDID为什么会有其它值,我就不太理解了。我们再返回到主程序里面看看。

switch(rNF_ReadID())

{

case 0x76:

for(i = (start_addr >> 9); size > 0; )//在这种情况下,认为一页的大小为512字节

{

rSB_ReadPage(i, to);

size -= 512;

to += 512;

i ++;

}

break;

case 0xf1:

case 0xda:

case 0xdc:

case 0xd3:

for(i = (start_addr >> 11); size > 0; )//在这种情况下,认为是2048字节为一页

{

rLB_ReadPage(i, to);

size -= 2048;

to += 2048;

i ++;

}

break;

}

}

其实都是把NANDFLASH的开始第二页的内容存放在一个指针数组里面,这个指针数组的起始地址在0x30000000。就是我们等下在下面看到的to[i]数组了。下面两个函数完成的功能是一样的,只是区别在于一页是多大,512或者是2048。

static voidrSB_ReadPage(U32 addr, unsigned char * to)

{

U32 i;

rNF_Reset();

// Enablethe chip

NF_nFCE_L();

NF_CLEAR_RB();

// Issue Readcommand

NF_CMD(CMD_READ);

// Set upaddress

NF_ADDR(0x00);

NF_ADDR((addr) & 0xff);

NF_ADDR((addr >> 8) & 0xff);

NF_ADDR((addr >> 16) & 0xff);

NF_DETECT_RB(); // wait tR(max 12us)

for (i = 0; i <512; i++)

{

to[i] = NF_RDDATA8();

}

NF_nFCE_H();

}

static void rLB_ReadPage(U32 addr, unsigned char * to)

{

U32 i;

rNF_Reset();

// Enablethe chip

NF_nFCE_L();

NF_CLEAR_RB();

// Issue Readcommand

NF_CMD(CMD_READ);

// Set upaddress

NF_ADDR(0x00);

NF_ADDR(0x00);

NF_ADDR((addr) & 0xff);

NF_ADDR((addr >> 8) & 0xff);

NF_ADDR((addr >> 16) & 0xff);

NF_CMD(CMD_READ3);

NF_DETECT_RB(); // wait tR(max 12us)

for (i = 0; i <2048; i++)

{

to[i] = NF_RDDATA8();

}

NF_nFCE_H();

}

可以看出刚开始的时候都是先复位一下的,不同的地方在于每次是怎样把传进来的地址经过转换再付给NFADDR寄存器的,具体怎么样要看NAND的数据手册。

我们接着回到2440init.s的程序来,接着就有以下一句:

ldr pc, =copy_proc_beg

在前面也看到copy_proc_beg这个标号出现很多次,这个标号下面的代码完成的功能就是把nand flash的内容拷贝到ram当中。

copy_proc_beg

adr r0, ResetEntry

ldr r2, BaseOfROM

cmp r0, r2//两个进行比较

ldreq r0, TopOfROM//如果相同的话,为r0赋上R0的结束位置,也是RW的起始位置。

beq InitRam //如果相同的话,就跳到这个标号的位置。

ldr r3, TopOfROM//以下代码是针对代码在NOR FLASH时的拷贝方法。

0

ldmia r0!, {r4-r7}

stmia r2!, {r4-r7}

cmp r2, r3

bcc %B0//这几段代码的功能就是把ResetEntry的内容搬到BaseOfROM(R0的起始位置,后面有声明的)。

sub r2, r2, r3

sub r0, r0, r2 //这里使 ResetEntry的位置往下移,为了后面的数据拷贝做准备。

InitRam

ldr r2, BaseOfBSS

ldr r3, BaseOfZero

0

cmp r2, r3

ldrcc r1, [r0], #4

strcc r1, [r2], #4

bcc %B0 //可以看出这一段是对ResetEntry里面定义好的数据拷贝到RW段。

mov r0, #0

ldr r3, EndOfBSS

1

cmp r2, r3

strcc r0, [r2], #4

bcc %B1//如果拷贝完数据后还剩下多余的空间的话,就往里面填充0

ldr pc, =%F2 ;goto compiler address

2

ldr r0,=HandleIRQ

ldr r1,=IsrIRQ

str r1,[r0]//这三条语句很明显就是说明了,HandleIRQ这个中断向量的存储单元被赋上了IsrIRQ标号的地址,这样发生IRQ中断后就会直接去到二级表,去确认具体发生哪个中断。

[:LNOT:THUMBCODE

bl Main //到这里,我们就看到了进入MAIN函数了。

b .

]

[THUMBCODE ;for start-up code for Thumb mode

orr lr,pc,#1

bx lr

CODE16

bl Main //可以看到以上代码表示如果arm是在THUMBCODE指令模式下的话,就进行模式转换。

b .

CODE32

]

到这里,我们已经把2440init.s的启动代码分析了一遍了。如有任何错误的话,请大家指出!谢谢!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: