【Linux驱动实战】：字符设备驱动之内核态与用户态数据交互1. 本文目标每次看《Linux 设备驱动程序》这种经典著

这是我《Linux 驱动实战》专栏字符设备驱动相关的第二篇文章，上一篇我们一起写了一个只有躯壳的字符设备，/dev/my_cdev_device 设备节点只能看不能摸。今天我们要给这个躯壳补上灵魂，让用户程序能通过文件操作来实现用户态与内核态的数据交互。相比上一篇文章，本篇文章的代码量也增加了一倍，考虑到直接放一大坨代码上来大家可能会看的头晕，我决定采用分块讲解的形式，但最后会附上完整可运行的代码。我们话不多说，直接进入正题。

1. 本文目标

每次看《Linux 设备驱动程序》这种经典著作，看到各种复杂的底层架构，总是会忍不住怀疑人生，我就想从简单的驱动开始慢慢学，有必要搞的这么复杂吗？

后来我明白了，学习驱动最好的方法就是先跑通一个极简、完整的程序，俗称 麻雀虽小，五脏俱全。

之前也看过不少的教程，但是上来就是点灯，要问点灯这个项目基础不基础？得分情况，对于单片机来说，点灯还是可以拿来作为入门项目练手的；但是对于 Linux 驱动开发来说，你才刚接触这个方向，就让你学习写一个字符设备驱动来控制 LED ，这显然不合理，也不符合事物的发展规律。因为这时候你可能根本都不了解字符设备驱动的框架，不知道字符设备是个什么东西，甚至连字符设备这个名词都不知道什么含义。

经过这段时间的学习，我感受到，我们不能一上来就搞点灯，我们需要循序渐进。正如我现在采用的办法，我们得先知道字符设备是什么吧，这正是我上一篇文章开头讲过的；我们还得知道字符设备的基础框架吧，知道要创建一个字符设备我们都需要干什么；我们还得知道当字符设备初始化到每一个阶段，你的文件系统的某个位置发生了什么变化吧，这也是上一篇文章我用测试程序验证过的。

上篇文章我们只学到怎样为用户层提供一个操作字符设备的接口，却没有实现操作本身，今天我们来实现这个操作本身。

最终我们会达到这样的效果：

先用命令简单测试，通过 echo 命令向 /dev/my_cdev_device 写入内容，然后通过 cat 读出来。
然后写一个用户层的程序，实现打开文件，写入数据，读出数据的操作。

这样，我们就彻底打通了 用户空间应用程序到虚拟文件系统，再到咱们自己写的底层驱动 这条路，以后的各种真实传感器驱动，不过是在这个框架上添砖加瓦罢了。

2. 核心逻辑拆解

本章我们将完整的代码分成几个大块进行学习，包括函数的一些逻辑，以及新接触到的一些 API。

2.1 定义结构体

如下面代码块，我们将需要用到的信息打包进一个代码块：

#define BUFFER_SIZE 1024

struct my_cdev{
    dev_t dev_num;//设备号
    struct cdev cdev;//字符设备核心结构体
    struct class *class;//设备类
    struct device *device;//设备节点

    char *buffer;//用来存储数据
    size_t data_size;//实际存的数据量
};

这个结构体相比我们之前用的新加入了三个成员。我下面一一介绍一下：

struct cdev cdev：定义一个 struct cdev 类型的成员 cdev ，这是字符设备核心结构体。后面我们会用 cdev_init 将它与文件操作结构体关联起来，然后再用 cdev_add 将它添加到内核的全局哈希表中。
char *buffer：这是用来存储数据的，当用户程序向设备节点文件写入内容时，把内容就放在这，当用户程序读取设备节点文件的内容时，我们把这里面的内容传给用户程序。
size_t data_size：表示 buffer 中当前存储的字节数，我们只需要在用户程序向设备节点文件写入内容时更新它即可。

剩下的三个成员都是我们之前讲过的，都是注册一个字符设备并在/dev目录下自动创建节点文件必备的东西。

2.2 驱动的灵魂

要让设备真正活起来，响应用户层的 cat、echo 或者 C 语言里的 open、read、write，我们必须搞懂一套核心机制：file_operations 以及它绑定的函数指针。

2.2.1 open 与 release

先上代码：

//定义全局结构体
struct my_cdev my_cdev;

static int my_cdev_open(struct inode* inode,struct file* file)
{
    //把结构体指针存入file->private_data，方便别的函数使用
    file->private_data = &my_cdev;
    printk(KERN_INFO "open success!\n");
    return 0;
}

static int my_cdev_release(struct inode* inode, struct file* file)
{
    printk(KERN_INFO "release success!\n");
    return 0;
}

我们最终达成的目的是当我们在用户程序中使用 open 打开 /dev/my_cdev_device 时，函数 my_cdev_open 会被执行；当我们使用 close 关闭 /dev/my_cdev_device 时，函数 my_cdev_release 会被执行。

但是现在还不行，我们现在还只是实现了这两个函数，后面还需要将这两个函数的填充到 file_operations 结构体中去，再与 cdev 结构体绑定，最后注册到内核中。

我们看看这两个函数。

乍一看这两个函数其实很简单，没什么技术含量，不就是用 printk 打印提示信息吗？但是请千万别小看 my_cdev_open 函数里那句不起眼的 file->private_data = &my_cdev ，这可以算是字符设备驱动框架的一部分。

要知道在 Linux 中，同一个驱动可以同时支持多个同类设备，而 struct file 又代表一个 打开的文件实例，因此当我们在 open 时将 &my_cdev 装入 file 结构体，又在 read 和 write 中把它取出来操作，那么以后对这个字符设备的操作就不会影响到别的同类设备了。

现在的话理解起来可能有点难度，但是随着时间推移，一定能理解的，而且正如我所说，这是字符设备驱动框架的一部分，可以先形成肌肉记忆，以后再慢慢理解。

2.2.2 write

代码如下：

static ssize_t my_cdev_write(struct file* file, const char __user* buf, size_t count, loff_t* offset)
{
    //把上面存进去的东西取出来
    struct my_cdev* dev = file->private_data;
    size_t len;//实际要写的字节数
    //打印当前偏移量和计划写入的字节数
    printk(KERN_INFO "my_cdev: [write]  offset=%lld  count=%zu\n", *offset, count);

    //偏移量超过缓冲区大小
    if(*offset >= BUFFER_SIZE)
    {
        return 0;
    }

    //计算实际要写的字节数，min里面的参数数据类型要严格相同
    len = min(count, (size_t)(BUFFER_SIZE - *offset));

    //这里下面详细讲
    if(copy_from_user((dev->buffer)+(*offset), buf, len))
    {
        return -EFAULT;
    }
    *offset += len;//更新偏移量
    
    //写完了要更新缓冲区数据的字节数
    if(*offset >= dev->data_size)
    {
        dev->data_size = *offset;//更新数据大小
    }
    return len;//规矩，write要返回写入的字节数。
}

下面我们有重点的了解一下这个函数：

首先，我们一定要区分开我们 计划写入的字节数 和 实际能写入的字节数 ，这个逻辑占据了 write 函数代码量的一半。这个函数是内核调用的，参数也是内核传进来的。第一个参数无需多言，第二个参数是用户的缓冲区地址，由于用户态与内核态是隔离的，我们不能直接操作它，这也是后面使用copy_from_user 的原因第三个参数 count 代表计划写入的字节数，第四个参数代表偏移量也就是说我们计划 从文件的哪个位置开始写 。
当偏移量超过缓冲区大小BUFFER_SIZE，也就是 1024 时，这说明光标已经指向缓冲区末尾甚至是缓冲区外面了，我们不能再写了，这时直接返回 0，表示写入 0 个字节。
如果偏移量没有超过缓冲区大小，还需要进一步判断缓冲区能不能容纳下我们计划写入的字节数。我们使用 min 找出 count 和 缓冲区剩余容量 中较小的那一个。
之后，使用 copy_from_user 将用户态的数据拷贝到内核缓冲区中，也就是 buffer 里面，这里不用着急，我们在初始化函数中会为 buffer 分配内存。
copy_from_user 的第一个参数是内核空间的目标地址，我们要把数据拷贝到这里；第二个参数是用户空间的地址，也就是数据的来源；第三个是要拷贝的字节数。
在拷贝完成之后，我们要更新偏移量，将光标移到我们刚写入的数据后面。最后还要更新缓冲区数据的字节数。

我觉得还需要再深入了解一下偏移量 offset ，重点来了：当我们使用 open 打开一个文件时，内核会创建一个 struct file 结构体用来记录这个打开的文件实例，这个文件可以被同一个或者不同的进程同时打开，并且每个打开的实例都会有一个 struct file ，而偏移量 offset 这个struct file 结构体中的成员之一，用来记录这个打开的文件实例的光标偏移量。

当我们使用 open 打开文件时，光标默认在文件开头，也就是说偏移量为 0，我们在用户态每写入一些数据，偏移量都要增加相应的字节数，这也就是为什么 copy_from_user 的参数要传 (dev->buffer)+(*offset) ，如果不这样做，每次向文件写入数据时都会间过前面的内容覆盖掉。

2.2.3 read

代码如下：

static ssize_t my_cdev_read(struct file* file, char __user* buf, size_t count, loff_t* offset)
{
    struct my_cdev* dev = file->private_data;
    size_t len;//实际能读的字节数

    //打印偏移量，计划读的字节数和当前缓冲区内有的字节数
    printk(KERN_INFO "my_cdev: [read]  offset=%lld  count=%zu  data_size=%zu\n", *offset, count, dev->data_size);

    //如果读到文件末尾，返回0,表示文件结束
    if(*offset >= dev->data_size)
    {
        return 0;
    }

    //计算实际可读的字节数
    len = min(count,(size_t)((dev->data_size)-(*offset)));

    if(copy_to_user(buf, (dev->buffer) + (*offset), len))
    {
        return -EFAULT;
    }
    *offset += len;//更新偏移量
    return len;//规矩，read返回读到的字节数
}

下面讲一下这个函数：

我们依旧把重点放到偏移量上面。我们都知道 read 在读到文件末尾时要返回 0，我们要在驱动程序中实现这个特性，当偏移量大于或等于内核缓冲区内容的字节数时，说明读到末尾了，read 直接返回 0。
如果没读到末尾，就计算实际可读的字节数，找出 count 和 缓冲区中光标后面内容字节数 二者较小的那一个。
然后使用 copy_to_user，将内容拷贝到用户空间。它的第一个参数是用户空间的目标地址，第二个参数是内核空间的数据源地址，第三个参数是要拷贝的字节数。
读完之后更新偏移量，这是标准流程。

这里我们一定要区分开 copy_from_user 和 copy_to_user ，数据流向的示意图如下：

1. 数据流向.png

可以结合 to 和 from 来理解，还是挺形象的。

2.2.4 file_operations

如下：

static struct file_operations my_cdev_fops = {
    .owner = THIS_MODULE,
    .open = my_cdev_open,
    .release = my_cdev_release,
    .read = my_cdev_read,
    .write = my_cdev_write,
    .llseek = default_llseek,//使用系统默认的偏移量操作
};

到这里，我们可以梳理一下整个流程了：用户空间使用 open 打开一个字符设备时，虚拟文件系统通过 open 传入的路径查找该字符设备对应的 struct inode 节点，然后遍历内核哈希表cdev_map，根据inode结构体中的dev_t设备编号找到struct cdev对象，再创建struct file，系统采用一个数组来管理一个进程中多个被打开的设备，每个文件描述符作为数组的下标标识一个字符设备对象，然后将struct file结构体中的file_operations成员指向struct inode结构体中的file_operations成员，最终执行回调函数，file->fops->open。

当我们对这个打开的文件实例执行read和write操作时，调用的就是各自对应的驱动函数。

2.3 init和exit函数

关于init函数和exit函数，上篇文章我们已经讲的很透彻了，大部分操作都是固定框架，只是有个别地方需要注意下，这里篇幅已经挺长了，我挑重点讲一下。

首先，在 init 函数中要为我们的buffer分配内存并初始化缓冲区字节数为 0：

    my_cdev.buffer = kmalloc(BUFFER_SIZE, GFP_KERNEL);
    if(!my_cdev.buffer)
    {
        printk(KERN_INFO "kmalloc failed!\n");
        return -ENOMEM;
    }
    memset(my_cdev.buffer, 0, BUFFER_SIZE);
    my_cdev.data_size = 0;

其次，我们上篇文章没讲过的还有cdev_init和cdev_add，但本文前面我也讲了他们的作用了，cdev_init用于将cdev结构体与file_operations结构体绑定起来，而cdev_add用于将该字符设备添加到内核的全局哈希表中，二者缺一不可。下面看看代码实现：

    //cdev初始化
    cdev_init(&(my_cdev.cdev), &my_cdev_fops);
    my_cdev.cdev.owner = THIS_MODULE;

    //cdev添加到内核
    ret = cdev_add(&(my_cdev.cdev), my_cdev.dev_num, 1);
    if(ret < 0)
    {
        printk(KERN_INFO "cdev add failed!\n");
        goto err_cdev_add;
    }

这里比较简单，就不讲参数了。

3. 完整代码与编译

3.1 完整驱动代码

代码如下：

#include <linux/module.h>
#include <linux/init.h>
#include <linux/kernel.h>
#include <linux/device.h>
#include <linux/cdev.h>
#include <linux/fs.h>
#include <linux/slab.h>
#include <linux/uaccess.h>
#include <linux/string.h>

#define BUFFER_SIZE 1024

struct my_cdev{
    dev_t dev_num;
    struct cdev cdev;
    struct class *class;
    struct device *device;

    char *buffer;
    size_t data_size;
};

struct my_cdev my_cdev;

static int my_cdev_open(struct inode* inode,struct file* file)
{
    //把结构体指针存入file->private_data，方便别的函数使用
    file->private_data = &my_cdev;
    printk(KERN_INFO "open success!\n");
    return 0;
}

static int my_cdev_release(struct inode* inode, struct file* file)
{
    printk(KERN_INFO "release success!\n");
    return 0;
}

static ssize_t my_cdev_read(struct file* file, char __user* buf, size_t count, loff_t* offset)
{
    struct my_cdev* dev = file->private_data;
    size_t len;//实际能读的字节数

    printk(KERN_INFO "my_cdev: [read]  offset=%lld  count=%zu  data_size=%zu\n", *offset, count, dev->data_size);

    //如果读到文件末尾，返回0,表示文件结束
    if(*offset >= dev->data_size)
    {
        return 0;
    }

    len = min(count,(size_t)((dev->data_size)-(*offset)));

    if(copy_to_user(buf, (dev->buffer) + (*offset), len))
    {
        return -EFAULT;
    }
    *offset += len;//更新偏移量
    return len;
}

static ssize_t my_cdev_write(struct file* file, const char __user* buf, size_t count, loff_t* offset)
{
    struct my_cdev* dev = file->private_data;
    size_t len;
    printk(KERN_INFO "my_cdev: [write]  offset=%lld  count=%zu\n", *offset, count);


    //偏移量超过缓冲区大小
    if(*offset >= BUFFER_SIZE)
    {
        return 0;
    }

    len = min(count, (size_t)(BUFFER_SIZE - *offset));

    if(copy_from_user((dev->buffer)+(*offset), buf, len))
    {
        return -EFAULT;
    }
    *offset += len;
    if(*offset >= dev->data_size)
    {
        dev->data_size = *offset;//更新数据大小
    }
    return len;
}

static struct file_operations my_cdev_fops = {
    .owner = THIS_MODULE,
    .open = my_cdev_open,
    .release = my_cdev_release,
    .read = my_cdev_read,
    .write = my_cdev_write,
    .llseek = default_llseek,
};

static int __init my_cdev_init(void)
{
    int ret;

    //分配缓冲区
    my_cdev.buffer = kmalloc(BUFFER_SIZE, GFP_KERNEL);
    if(!my_cdev.buffer)
    {
        printk(KERN_INFO "kmalloc failed!\n");
        return -ENOMEM;
    }
    memset(my_cdev.buffer, 0, BUFFER_SIZE);
    my_cdev.data_size = 0;

    ret = alloc_chrdev_region(&(my_cdev.dev_num), 0, 1, "my_cdev");
    if(ret < 0)
    {
        printk(KERN_INFO "alloc failed!\n");
        goto err_alloc;
    }
    //打印主次设备号
    printk(KERN_INFO "Major:%d \t Minor:%d\n",MAJOR(my_cdev.dev_num),MINOR(my_cdev.dev_num));

    //cdev初始化
    cdev_init(&(my_cdev.cdev), &my_cdev_fops);
    my_cdev.cdev.owner = THIS_MODULE;

    //cdev添加到内核
    ret = cdev_add(&(my_cdev.cdev), my_cdev.dev_num, 1);
    if(ret < 0)
    {
        printk(KERN_INFO "cdev add failed!\n");
        goto err_cdev_add;
    }

    my_cdev.class = class_create(THIS_MODULE, "my_cdev_class");
    if(IS_ERR(my_cdev.class))
    {
        ret = PTR_ERR(my_cdev.class);
        printk(KERN_INFO "class create failed!\n");
        goto err_class;
    }

    my_cdev.device = device_create(my_cdev.class, NULL, my_cdev.dev_num, NULL, "my_cdev_device");
    if(IS_ERR(my_cdev.device))
    {
        ret = PTR_ERR(my_cdev.device);
        printk(KERN_INFO "device create failed!\n");
        goto err_device;
    }

    printk(KERN_INFO "init success!\n");

    return 0;

err_device:
    class_destroy(my_cdev.class);
err_class:
    cdev_del(&my_cdev.cdev);
err_cdev_add:
    unregister_chrdev_region(my_cdev.dev_num,1);
err_alloc:
    kfree(my_cdev.buffer);

    return ret;
}

static void __exit my_cdev_exit(void)
{
    device_destroy(my_cdev.class, my_cdev.dev_num);
    class_destroy(my_cdev.class);
    cdev_del(&my_cdev.cdev);
    unregister_chrdev_region(my_cdev.dev_num,1);
    kfree(my_cdev.buffer);
    printk(KERN_INFO "resource freed!\n");
}

module_init(my_cdev_init);
module_exit(my_cdev_exit);

MODULE_LICENSE("GPL");

3.2 Makefile

Makefile 如下：

KERNEL_DIR := /home/xlp/workspace/kernel

obj-m := cdev.o

all:
    make -C $(KERNEL_DIR) M=$(PWD) ARCH=arm64 CROSS_COMPILE=aarch64-linux-gnu- modules

clean:
    make -C $(KERNEL_DIR) M=$(PWD) clean

3.3 编译

编译后的结果如下：

2. 编译.png

看到这个界面就说明编译成功了。

然后我们把需要的 cdev.ko 拷贝到板子上就可以运行了。

4. 运行

4.1 加载模块

加载模块需要root权限，我们先用下面命令切换到root：

sudo su

然后加载模块：

insmod cdev.ko

执行状况与内核日志如下：

3. 加载模块.png

4. 内核日志1.png

日志中打印了 “init success”，这说明我们的init函数已经成功执行了。

4.2 写入数据并读取

然后我们尝试向/dev/my_cdev_device写入数据并读取：

5. 写入并读取.png

成功读出来了。

我们再看内核日志，驱动程序中write和read函数中的printk的内容也成功打印了：

6. 内核日志2.png

从这张内核日志的截图中我们还能得到重量级结论：

第一，echo和cat的底层其实也是一系列系统调用，先open文件，然后read或者write，最后close文件。
第二，相信大家已经发现了，日志中echo引起的write调用只有一次，而cat引起的read调用却有两次，这是为什么呢？实际上，当cat执行时，因为当前它的目标是一个字符设备，而不是普通的文件，cat并不知道它要读取的内容有多少，但是有一点，它要全部读完，因此，它准备了一个超级大的缓冲区，日志中可以看到这个缓冲区大小为 131072 字节，也就是128KB，但实际上只读了10个字节，因为我们的内核缓冲区中只有 10 个字节。cat拿到这 10 个字节后还没有停手，它要验证是否已经读到文件的末尾了，于是它发起了第二次read，但是此时offset已经为 10 了，就进入了我们代码中的这个逻辑：
```
if(*offset >= dev->data_size) 
{
    return 0; //触发EOF
}
```
cat收到返回的 0 之后，它明白已经读到文件末尾了，于是调用close关闭文件。

试想一下： 如果在第二次 read 的时候，我们没有返回 0，而是随便返回了一个大于 0 的数，或者忘了判断 offset，cat 就会一直以为还有数据，不断发起第三次、第四次、第一万次 read，你的屏幕就会瞬间卡死。这就是驱动开发中 状态管理 最生动的体现。

4.3 卸载模块

最后我们使用rmmod卸载模块：

7. 卸载模块.png

内核日志显示，我们的exit函数已经成功调用了，资源释放完成。

4.4 小补充

如果想使用echo追加写入，那么需要在驱动程序的write函数中加一段代码：

    //如果发现是以追加模式打开的，我们就强行把光标移到数据的末尾
    if (file->f_flags & O_APPEND) {
        *offset = dev->data_size; 
    }

5. 编写应用程序测试

这一章，我们要用 C 语言写一个用户态的应用程序来调用我们的底层驱动。

代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <fcntl.h>

#define DEV_NAME "/dev/my_cdev_device"

int main()
{
    int fd;
    char write_buf[] = "hello xlp";
    char read_buf[100] = {0};
    int ret;

    fd = open(DEV_NAME,O_RDWR);//可读可写
    if(fd < 0)
    {
        printf("open failed!\n");
        return -1;
    }

    //写入内容
    ret = write(fd,write_buf,strlen(write_buf));
    if(ret < 0)
    {
        printf("write failed!\n");
        close(fd);
        return -1;
    }
    printf("写入 %d 个字节：%s\n",ret,write_buf);

    //读取
    lseek(fd,0,SEEK_SET);//需要将光标移动到文件开头
    ret = read(fd,read_buf,sizeof(read_buf));
    if(ret < 0)
    {
        printf("read failed!\n");
        close(fd);
        return -1;
    }
    printf("读出 %d 个字节：%s\n",ret,read_buf);
    close(fd);

    //再打开关闭测试一下
    fd = open(DEV_NAME,O_RDWR);
    if(fd<0)
    {
        return -1;
    }
    close(fd);

    return 0;
}

这个程序直接在板子上编译即可。

我们先加载模块，然后运行这个应用程序，再查看内核日志：

8. 应用程序.png

9. 内核日志3.png

可以看到，我们的应用程序完美的调用的我们的驱动程序，内核日志打印的信息和我们应用程序的逻辑完全一样。

6. 总结

这篇文章写到现在也就快结束了，我想谈谈我的看法。

以前，当我在终端敲下 cat /dev/xxx 时，我只是单纯的觉得这是一个系统命令。

但现在，我的脑海里会立刻浮现出一幅生动的画面：shell 帮我调用了 open，内核通过文件路径查找inode进而找到cdev ，同时也就找到了cdev里面的file_operations ，找到了对应的驱动程序，接着 cat 带着一个 128KB 的缓冲区发起 read ，直到驱动给出一个 return 0 的 EOF 标志，它才 close 文件，最后结束。

这种 看透事物底层运转逻辑 的感觉，我不知道大家什么啥想法，反正我很享受。

最后，如果这篇文章帮助到你了，可以看一下我的专栏《Linux 驱动开发》，感兴趣的朋友可以订阅一下，如果可以的话也请给我点个关注，点赞收藏一下文章，可以以后隔一段时间回顾一下，温故而知新嘛！谢谢大家了~

本文结束