摘要:本文以64位PCI总线接口芯片PCI9656的设备驱动程序为基础,比较了Linux2.6内核与2.4内核的区别,设计与开发了在Linux 2.6内核下PCI9656设备驱动程序,进而研究了2.6内核的内存和中断管理机制。
关键字:Linux2.6;设备驱动程序;PCI9656
1 引言http://www.16sheji8.cn/
Linux操作系统因为其高效、安全、可动态加载及源代码开放等特点,深受设备驱动程序开发人员的喜爱。系统内核大部分独立于底层硬件运行,用户无需关心硬件问题,而用户操作是通过一组标准化的调用来完成。设备驱动程序的任务是将这些调用映射到作用于实际硬件设备的特定操作上,该编程接口能够使得驱动程序独立于内核的其他部分来搭建,在需要时才动态加载到内核。这种模块化的特点,使得Linux设备驱动程序的编写过程变得清晰简单。
目前,为满足日益庞大的数据处理需要,基于64位PCI总线接口设备的研究开发显得尤为重要。因而本文将基于PLX公司推出的PCI总线接口芯片PCI9656,设计开发在Linux2.6内核下的设备驱动程序,进而对2.6内核的内存和中断管理机制进行分析研究。
2 Linux2.6与2.4内核的比较
2.1 系统稳定性
为了彻底防止对正在被使用的内核模块进行错误操作,2.6内核在加载和导出内核模块方面都较2.4内核进行了改进,避免了用户执行将导致系统崩溃的操作,例如强制删除模块等。同时,当驱动程序需要在多个文件中包含<linux/module.h>头文件时,不必定义宏__NO_VERSION__来检查内核的版本。
2.2 统一设备模型
统一设备模型的创建是2.6内核最重要的变化之一。它促进了模块接口的标准化,其目的是更好地控制和管理设备,主要包括:更准确地确定系统设备,更高效的进行电源管理以及改进的系统总线结构管理。
2.3 内核基础设施
2.6内核为了区别以.o为扩展名的常规对象文件,将内核模块的扩展名改为.ko。相对于2.4内核下系统所支持的RAM为4GB而言,2.6内核下系统支持更大数量的RAM,在分页模式下最高可达64GB。同时,2.6内核优化了I/O调度器,确保不会有进程驻留在队列中过长时间等待输入/输出操作,使得I/O操作的响应更为迅速。
2.4 外部设备
在2.4内核中有约束大型系统的限制,比如支持的每一类设备的最大数量为256。而2.6内核则彻底地打破了这些限制,可以支持4095种主要的设备类型,每一个单独的类型又可以支持超过一百万个的子设备。
3 Linux2.6内核下PCI设备驱动程序的设计
3.1 PCI设备驱动程序中核心数据结构
在2.6内核下使用file_operations数据结构,来建立设备驱动程序中的函数与主设备号(major number)之间的对应关系。该数据结构中包含了指向驱动程序内部大多数函数的指针,描述了虚拟文件系统如何操作一个打开的外围设备。因而file _operations结构是驱动程序向内核其他部分提供的一个统一的标准设备接口。http://www.16sheji8.cn/
file结构是设备驱动程序使用的另一个重要的数据结构,指示当前系统中已打开的文件。它在C语言库中定义,在调用内核open函数时创建,并传递给在该设备上进行操作的所有函数,直到最后的close函数。file结构中还包含了指向它所拥有的file_operations结构的指针。
inode结构由内核自动生成,代表已打开文件的描述符,与每个打开的文件一一对应。它包含了两个重要的结构成员:dev_t扩展到32位,其中12位主设备号,20位从设备号,而cdev用于存储一个指向字符设备文件的指针。
3.2 驱动程序与内核和外部设备间的关系
(1) 通过Linux提供的系统调用函数(例如init_module等)进入内核,这些函数在2.6内核版本下总共有两百多个,提供了几乎所有应用程序进入内核所需要执行的操作。
(2) 系统的内核函数都有“sys_”前缀(例如函数sys_init_module),应用程序通过访问设备文件系统来调用这些函数。这一层主要是“devfs”(device filesystem)文件管理机制,它是从普通文件和设备文件抽象出来的一个文件系统层,完成进入具体的设备文件操作之前的准备工作。
(3) 由设备驱动程序提供具体的函数,来完成对硬件设备的各种操作。特别的对于PCI9656来说,就是通过PCI接口对设备的寄存器和存储器进行访问操作,例如调用register_chrdev等函数来初始化芯片内部的状态寄存器和配置寄存器。
3.3 PCI9656芯片的操作流程
PCI总线是目前最常用的外设总线之一,Linux的PCI内核代码为PCI设备驱动程序的开发提供了强大的支持。PCI9656的驱动程序主要包括以下几个方面:设备初始化,为PCI芯片分配内存资源,实现数据的读写功能,中断处理,系统收回内存资源,关闭设备等。
4.Linux2.6内核下内存和中断管理的研究
2.6内核应用了许多新技术来实现对各类外部设备驱动程序的更好支持。下面结合PCI9656驱动程序中的内存和中断管理,进一步分析和研究2.6内核对内存和中断进行的改进和优化。
4.1 内存管理
在Linux内存管理器中,页表保持对进程使用的内存物理页的追踪,它将虚拟页映射到物理页上。系统必须找到映射到该页的每一个进程,将使用较少的页置换出去,这样进程中相应页的页表条目才能被更新。随着在系统中运行的进程数量的增加,将这些页置换出去的工作量也会急剧增加。
为解决此问题,2.6内核引入了反向映射机制(reverse mapping),内存管理器为每一个物理页建立一个链表,包含指向当前映射页的每个进程的页表条目(page-table entry)的指针。该链表叫PTE链,它极大地提高了找到那些映射某个页的进程的速度,如图2所示。驱动程序调用下列内核函数来为PCI9656分配内存空间。
get_free_page(GFP_NOIO,PGD_ORDER);
alloc_pages(gfp_mask,size);
//查找并为PCI9656分配空闲内存物理页
mempool_alloc(pool,gfp_mask);
request_mem_region(pdx->Pci9656);
remap_page_range(*mem_area,PCI9656,kernel_address,mem_size,prot);
//请求分配内存空间,实现PCI9656物理地址到内存地址的映射
mempool_free(*element,pool);//释放内存
2.6内核中将头文件malloc.h改为slab.h,分配标志GFP_BUFFER改为GFP_NOIO和GFP_NOFS,并新增了文件mempool.h。这些变化一起促生了2.6内核中的内存管理器,其设计目标是更高的性能、效率和稳定性。
另一方面,使用反向映射获得性能的提高也要付出代价,即系统不得不占用一些低端内存来保持对所有反向映射的追踪,这势必在32位硬件上成为内存空间的瓶颈。因此2.6内核引入了高端内存页表(Highmem PTE)机制,让页表条目存放在高端内存中,释放出更多的低端内存区给必须放在这里的内核数据结构。同时,较以前版本的内核而言,2.6内核重新构建了一个更为简单的内存管理器,提高了整个系统的稳定性。
4.2 中断处理
Linux处理中断的方式很大程度上与它在用户空间处理信号的方式一样,驱动程序只需为设备所对应的中断注册一个处理程序,并在中断到达时进行正确的处理。http://www.16sheji8.cn/
在2.4内核之前,Linux系统一直采用cli和sti函数来禁用和启用中断,然而对于任意某个例程,想要知道在它被调用时中断是否被启用,已变得越来越困难。因而2.6内核定义了函数local_irq_enable和local_irq_disable,用来使能和无效处理器控制的所有中断,定义函数local_irq_save来将当前中断的状态存入flags变量,避免了查询中断的状态信息。
中断处理程序的作用就是将有关中断接收的信息反馈给设备,并根据正在服务的中断的不同含义对数据进行相应的读或写。由于PC机只有0-15的中断号,设备都是以共享的形式申请中断号,2.6内核改进了PCI设备中断请求队列的组织方式,通过设置flags变量中的SA_SHIRQ标志位,并保证内核中所有中断号(dev_id)的唯一性,来实现中断的共享。
if(!(inb(card->iobase+CODEC_CMD_INT_STATUS)&0x80000000)) return;//识别中断类型
request_irq(irq,*handler,flags,PCI9656,*dev_id);//向系统注册PCI9656的中断
如果中断注册成功,则返回值IRQ_RETVAL为0,这时在/proc/interrupts文件中可以看申请成功的中断。在2.6内核下,request_irq和free_irq从sched.h改到了interrupt.h中定义。
synchronize_irq(irq);//中断同步
if(wait_event_interruptible(waitqueue,condition)>0) return;//判断中断等待使能
outb(intstat&card->iobase+CODEC_CMD_INT_HLDCLR+2);//使能并行端口的中断报告
//系统响应PCI9656的中断,执行数据读写、寄存器访问等操作
free_irq(irq,*dev_id);//释放设备中断、I/O资源和缓冲区
5 实验与测试
我们设计了Makefile文件和一个简单的应用程序,在动态加载驱动程序后,对PCI9656开发板进行了大批量数据的读写实验。基于64位PCI总线和100MHz的时钟频率,我们对芯片的数据读写速率进行了采集,实验结果统计如图3所示。
从上图可以看到,在2.6内核下应用PCI9656作为总线接口芯片,数据的读写传输速率随着数据包的大小有大幅度的提高,这在工程应用中有很大的现实意义。http://www.16sheji8.cn/
6 结束语
本文通过Linux2.6内核所提供的一系列标准函数调用接口,用C++语言开发了PCI9656的设备驱动程序,并在Fedora Core2平台下调试通过,能正确发送和接收各种大小的数据包。当通信的数据包大小为64KB时,DMA通道的读写速度最大可达1.8Gbps,能够很好的满足日益庞大的数据处理需要。同时,Linux操作系统源代码的开放性还能较好的保证数据存储运算和通信的安全性。
参考文献
[1]Alessandro Rubini & Jonathan Corbet,Linux Device Driver (3rd Edtion)[M],USA:O'Reilly & Associates Inc,2005http://www.16sheji8.cn/