您的位置:首页 > 其它

Mini2440内存管理单元MMU

2015-11-08 13:35 417 查看
一级页表:

TTB base代表一级页表的地址,将它写入协处理器CP15的寄存器C2(称为页表基址寄存器)即可,一级页表的地址是16K对齐,使用[31:14]存储页表基址,[13:0]为0。一级页表使用4096个描述符来表示4GB空间,每个描述符对应1MB的虚拟地址,要么存储它对应的1MB物理空间的起始地址,要么存储下一级页表的地址。使用MVA[31:20]来索引一级页表(2^12=4096个描述符),得到一个描述符,每个描述符占4个字节。



一级描述符低两位:
00:无效(Fault)
01:粗页表(Coarse page table)
  [31:10]为粗页表基址,此描述符低10位填充0后就是一个二级页表的物理地址,二级页表含256个条目([9:2]),
  每个条目表示4KB大小的物理地址,一个粗页表表示1MB物理地址。
10:段(Section)
  [31:20]为段基址,此描述符低20位填充0后就是一块1MB物理地址空间的起始地址。MVA[19:0]用来在这1MB空间中寻址。
  以段的方式进行映射时,虚拟地址MVA到物理地址PA的转换过程如下:
  ①页表基址寄存器位[31:14]和MVA[31:20]组成一个低两位为0的32位地址,MMU利用这个地址找到段描述符
  ②取出段描述符的位[31:20](段基址),它和MVA[19:0]组成一个32位的物理地址(这就是MVA对应的PA)



11:细页表(Fine page table)

  [31:12]为细页表基址(Fine page table base address),此描述符的低12位填充0后,就是一个二级页表的物理地址。

  此二级页表含1024个条目([11:2]),其中每个条目表示大小1kb的物理地址空间,一个细页表表示1MB物理地址空间。

二级页表:

以大页(64KB),小页(4KB)或极小页(1KB)进行地址映射时,需要用到二级页表,二级页表有粗页表、细页表两种,二级页表描述符格式如下:





由于本次程序只使用一级页表,以段的方式进行地址映射。所以二级页表的4种情况就不总结了,看书。

内存的访问权限检查:

它决定一块内存是否允许读、是否允许写。这由CP15寄存器C3(域访问控制)、描述符的域(Domain)、CP15寄存器C1的R/S/A位、描述符的AP位共同决定。

“域”决定是否对某块内存进行权限检查,“AP”决定如何对某块内容进行权限检查。

S3C2440有16个域,CP15寄存器C3中每两位对应一个域(一共32位)。

00:无访问权限(任何访问都将导致“Domain fault”异常)

01:客户模式(使用段描述符、页描述符进行权限检查)

10:保留(保留,目前相当于“无访问权限”)

11:管理模式(不进行权限检查,允许任何访问)

Domain占用4位,用来表示内存属于0-15,哪一个域,例如:

粗页表中的“Domain”为0b1010,表示1MB内存属于域10,如果域访问控制寄存器的[21:20]等于0b01,则使用描述符中的"AP"位进行权限检查,如果等于0b11,则不进行权限检查,允许任何访问。

AP、ap3、ap2、ap1、ap0结合CP15寄存器C1的R/S位,决定如何进行访问检查。

下表为AP、S、R的对照表

APSR特权模式用户模式说明
0000无访问权限无访问权限任何访问将产生“Permission fault”异常
0010只读无访问权限在超级权限下可以进行读操作
0001只读只读任何写操作将产生”Permission fault“异常
0011保留--
01xx读/写无访问权限只允许在超级模式下访问
10xx读/写只读在用户模式下进行写操作将产生"Permission fault"异常
11xx读/写读/写在所有模式下允许任何访问
xx11保留--

转译查找缓存(Translation Lookaside Buffers, TLB)

Cache:

S2C2440内置了指令Cache(ICaches)、数据Cache(DCaches)、写缓存(Write buffer),需要用到描述符中的C位(Ctt)和B位(Btt)。

S3C2440 MMU、TLB、Cache的控制指令:

S3C2440除了ARM920T的CPU核心外,还有若干个协处理器,用来帮助主CPU完成一些特殊功能。对MMU、TLB、Cache等的操作涉及到协处理器。

<MCR|MRC> {cond} p#,<expression1>,Rd,cn,cm{,<expression2>}

MRC     //从协处理器获得数据,传给ARM920T CPU核心寄存器

MCR     //数据从ARM920T CPU核心寄存器传给协处理器

{cond}    //执行条件,省略时表示无条件执行

p#      //协处理器序号

<expression1> //一个常数

Rd      //ARM920T CPU核心的寄存器

cn和cm //协处理器中的寄存器

<expression2> //一个常数

其中,<expression1>、cn、cm、<expression2>仅供协处理器使用,它们的作用如何取决于具体的协处理器。

@*************************************************************************
@ 设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,然后跳到SDRAM继续执行
@ 2015.11.8 by Huangtao
@*************************************************************************

.text
.global _start
_start:
ldr sp, =4096                       @ 设置栈指针,以下都是C函数,调用前需要设好栈
bl  disable_watch_dog               @ 关闭WATCHDOG,否则CPU会不断重启
bl  memsetup                        @ 设置存储控制器以使用SDRAM
bl  copy_2th_to_sdram               @ 将第二部分代码复制到SDRAM
bl  create_page_table               @ 设置页表
bl  mmu_init                        @ 启动MMU
ldr sp, =0xB4000000                 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址)
ldr pc, =0xB0004000                 @ 跳到SDRAM中继续执行第二部分代码LED
halt_loop:
b   halt_loop


/*******************************************************
进行一些初始化,在Steppingstone中运行
init.c和head.S同属第一部分程序,此时MMU未开启,使用物理地址
2015.11.8 by Huangtao
*///****************************************************

// WATCHDOG寄存器
#define WTCON           (*(volatile unsigned long *)0x53000000)
// 存储控制器的寄存器起始地址
#define MEM_CTL_BASE    0x48000000

// 关闭WATCHDOG,否则CPU会不断重启
void disable_watch_dog(void)
{
WTCON = 0;
}

// 设置存储控制器以使用SDRAM
void memsetup(void)
{
// SDRAM 13个寄存器的值
unsigned long const mem_cfg_val[]={ 0x22011110,        //BWSCON
0x00000700,     //BANKCON0
0x00000700,     //BANKCON1
0x00000700,     //BANKCON2
0x00000700,     //BANKCON3
0x00000700,     //BANKCON4
0x00000700,     //BANKCON5
0x00018005,     //BANKCON6
0x00018005,     //BANKCON7
0x008C07A3,     //REFRESH
0x000000B1,     //BANKSIZE
0x00000030,     //MRSRB6
0x00000030,     //MRSRB7
};
int i = 0;
volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE;
for(; i < 13; i++)
p[i] = mem_cfg_val[i];
}

// 将第二部分代码复制到SDRAM
void copy_2th_to_sdram(void)
{
unsigned int *pdwSrc  = (unsigned int *)2048;
// SDRAM的开始16KB存放一级页表
unsigned int *pdwDest = (unsigned int *)0x30004000;

// 2048~4096 2k
while (pdwSrc < (unsigned int *)4096)
{
*pdwDest = *pdwSrc;
pdwDest++;
pdwSrc++;
}
}

// 设置页表
void create_page_table(void)
{
// 用于段描述符的一些宏定义
#define MMU_FULL_ACCESS     (3 << 10)   // 访问权限,AP位设为11,读写都允许
#define MMU_DOMAIN          (0 << 5)    // 属于哪个域,设为0
#define MMU_SPECIAL         (1 << 4)    // 必须是1
#define MMU_CACHEABLE       (1 << 3)    // cacheable
#define MMU_BUFFERABLE      (1 << 2)    // bufferable
#define MMU_SECTION         (2)         // 表示这是段描述符
// C/B位没设置,不使用Cache和Write buffer
#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
MMU_SECTION)
// 使用Cache和Write buffer
// 在映射Steppingstone和SDRAM等内存时都使用该种
#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
// 一级页表段描述符大小1MB
#define MMU_SECTION_SIZE    0x00100000

unsigned long virtuladdr, physicaladdr;
unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;

// 将0~1M的虚拟地址映射到同样的物理地址
virtuladdr = 0;
physicaladdr = 0;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;

// 0x56000000是GPIO寄存器的起始物理地址,
// GPBCON和GPBDAT这两个寄存器的物理地址0x56000050、0x56000054,
// 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
virtuladdr = 0xA0000000;
physicaladdr = 0x56000000;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC;

// SDRAM的物理地址范围是0x30000000~0x33FFFFFF,
// 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,
// 总共64M,涉及64个段描述符
virtuladdr = 0xB0000000;
physicaladdr = 0x30000000;
while (virtuladdr < 0xB4000000)
{
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
MMU_SECDESC_WB;
virtuladdr += 0x100000;
physicaladdr += 0x100000;
}
}

// 启动MMU
void mmu_init(void)
{
unsigned long ttb = 0x30000000;
// <MCR|MRC>{条件} 协处理器序号,常数1,CPU核寄存器,协处理器寄存器1,协处理器寄存器2,常数2
// MRC 从协处理器获得数据,传给ARM920T CPU核心寄存器
// MCR 数据从ARM920T CPU核心寄存器传给协处理器
__asm__(
"mov    r0, #0\n"
"mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */

"mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */
"mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */

"mov    r4, %0\n"                   /* r4 = 页表基址 */
"mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */

"mvn    r0, #0\n"
"mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF,
* 不进行权限检查
*/
// 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,然后再写入
"mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */

/* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM
* R : 表示换出Cache中的条目时使用的算法,
*     0 = Random replacement;1 = Round robin replacement
* V : 表示异常向量表所在的位置,
*     0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
* I : 0 = 关闭ICaches;1 = 开启ICaches
* R、S : 用来与页表中的描述符一起确定内存的访问权限
* B : 0 = CPU为小字节序;1 = CPU为大字节序
* C : 0 = 关闭DCaches;1 = 开启DCaches
* A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查
* M : 0 = 关闭MMU;1 = 开启MMU
*/

// 先清除不需要的位,往下若需要则重新设置它们
/* .RVI ..RS B... .CAM */
"bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */
"bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */
"bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */

/*
* 设置需要的位
*/
"orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */
"orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */
"orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */
"orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */

"mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */
: /* 无输出 */
: "r" (ttb) );
}


/******************************************
Mini2440 LED_GPIO
属于第二部分程序,此时MMU已开启,使用虚拟地址
2015.11.8 by Huangtao
*///******************************************

#define GPBCON (*(volatile unsigned long *)0xA0000010) //0x56000010
#define GPBDAT (*(volatile unsigned long *)0xA0000014) //0x56000014

#define GPB5_out (1<<(5*2))
#define GPB6_out (1<<(6*2))
#define GPB7_out (1<<(7*2))
#define GPB8_out (1<<(8*2))

/*
static inline
这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。
于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。
而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000,
这样,head.S中的“ldr pc, =0xB0004000”就是跳去执行main函数。

加volatile的原因是mini2440上带的arm-linux-gcc 4.4.3 会将其优化掉
Makefile编译选项中带有(-O0 -O1 -O2 -O3..)
*/
static inline void wait(volatile unsigned long dly)
{
for(; dly > 0; dly--);
}

int main(void)
{
unsigned long i = 0;
GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out; // 将LED1-4对应的GPB5/6/7/8四个引脚设为输出

while(1)
{
wait(3000000);
GPBDAT = (~(i<<5)); // 根据i的值,点亮LED1-4,实现流水
++i;
if(i == 16)
i = 0;
}

return 0;
}


SECTIONS {
firtst    0x00000000 : { head.o init.o }
second    0xB0004000 : AT(2048) { leds.o }
}
/*
第一个段,first内容是head.o和init.o,运行时应该位于0x00000000;
第二个段,second内容是leds.o,运行时应该位于0xB0004000;
AT(2048)表示leds.o在链接成可执行文件时存放在什么位置,即载入地址;
0xB0004000 : AT(2048)这里指定了两个地址:
前者是虚拟地址0xB0004000,后者是载入地址AT(2048).
first段没有AT(),则默认其载入地址等于虚拟地址0x00000000;
*/


objs := head.o init.o leds.o

mmu.bin : $(objs)
arm-linux-ld -Tmmu.lds -o mmu_elf $^
arm-linux-objcopy -O binary -S mmu_elf $@
arm-linux-objdump -D -m arm mmu_elf > mmu.dis

%.o:%.c
arm-linux-gcc -Wall -O2 -c -o $@ $<

%.o:%.S
arm-linux-gcc -Wall -O2 -c -o $@ $<

clean:
rm -f mmu.bin mmu_elf mmu.dis *.o


由于Makefile编译中带了优化-O2,导致LED全亮不闪烁,在wait延时中加入volatile可解决。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: