【TinyALSA全解析(三)】tinyplay、tincap、pcm_open源码解析

tinyplay、tincap、pcm_open源码解析

  • 一、本文的目的
  • 二、tinyplay.c源码分析
  • 三、tinycap.c源码分析
  • 四、pcm.c如何调度到Linux Kernel
    • 4.1 pcm_open解析
      • 4.1.1 pcm_open的主要流程
      • 4.1.2 流程说明
      • 4.1.3 调用方法
    • 4.2 pcm_write解析

/*****************************************************************************************************************/

声明: 本博客内容均由https://blog.csdn.net/weixin_47702410原创,转载or引用请注明出处,谢谢!

创作不易,如果文章对你有帮助,麻烦点赞 收藏支持~感谢

/*****************************************************************************************************************/

一、本文的目的

本文分析tinyalsa中的的tinyplay和tinycap源码,tinyplay和tinycap是两个小工具。会分析这两个工具主要是调用pcm.c和pcm.h实现访问Linux kernel的硬件接口

本文先解析一下这两个工具的源代码,再分析一下pcm.c这个文件是怎么访问到底层的。

学习这两个工具的意义不仅仅是对这两个工具有所了解,在安卓的音频架构中,Android Audio HAL层的代码对硬件的访问也会通过pcm.c文件进行访问

tinyalsa的具体源码完整可以见Android 12_r8官方源码网站。本文以安卓12的r8分支进行讲解,安卓9-安卓14的tinyalsa的实现是大同小异的,掌握安卓12的TinyALSA源码再去看其它版本的安卓源码也是可以很快入手的。

二、tinyplay.c源码分析

tinyplay的主要流程如下:
tinyplay主要流程
概述一下上面的流程图,tinyplay的主要行为是:

  1. 读取播放的文件

  2. 解析wav文件,遍历了WAV文件中的每个数据块(chunk),直到找到音频数据块或无其他块可读。每个WAV文件都由RIFF数据块组成,每个块都有一个类型标识符(id)和一个大小字段(sz)。

    根据块的类型标识符(id),有三种可能的情况:

    • 如果ID是ID_FMT,这表示块是“fmt ”块,它会存储音频流的格式信息,包括样本率、比特率等。代码读取这个块的内容到chunk_fmt结构体。如果实际上块的大小大于结构体的大小,代码会跳过剩下的字节。

    • 如果ID是ID_DATA,这表示块包含了实际的音频样本数据。在这个情况下,暂停块的读取(通过设置more_chunks 为0)并保持块的数据大小。

    • 对于其他未知的块类型,代码简单地跳过它。

  3. 最后调用pcm.c中的ops进一步的去对硬件进行访问,涉及硬件有关操作的函数主要是pcm_open、pcm_write函数。pcm_frames_to_bytes函数用于将音频帧数转换为字节数(此时有音频的位深、声道数信息,就可以计算所需帧数据占用多少字节空间)。

三、tinycap.c源码分析

tinycap的主要流程如下:
tinycap主要流程

概述一下上面的流程图,tinycap的主要行为是:

  1. 以wb模式打开文件,wb模式表示以二进制模式打开一个文件进行写入操作。如果文件存在,则文件被截断为零长度(即文件的内容会被全部删除)。如果文件不存在,则创建一个新文件。
  2. 读取命令行的参数并存储在结构体struct wav_header中(对应tinycap,定义的变量名字为header,所有的内容将会存储在变量header中)
  3. wav文件格式有文件的头部信息,在wav文件的头部信息中有data_sz 字段用于记录整个音频数据占用字节,故此头部信息可以在录音完成后再计算写入,此处代码先跳过写wav的头部信息,先读取录音数据后再写入头部信息
  4. 调用pcm.c中的ops进一步的去对硬件进行访问,主要使用pcm_read函数去读录音数据,pcm_open和pcm_close对设备进行开关。音频的处理一般是以帧为单位处理的,但是在malloc内存 还有 读取数据的时候(pcm_read)的时候,是以字节为单位。因此用pcm_frames_to_bytes函数转换帧数为字节数去申请内存,然后会用pcm_bytes_to_frames将读取的字节转换为帧以保存在wav头部信息中。
  5. 写入wav文件的头部信息

四、pcm.c如何调度到Linux Kernel

在 pcm.c 中,TinyALSA 使用了一些系统调用(如 open(), ioctl(), mmap(), close() 等)来访问和控制 ALSA 音频设备。这些系统调用是 Linux 内核提供的接口,应用程序可以通过这些接口与内核进行交互。

其中open() 系统调用用于打开 ALSA 设备,ioctl() 系统调用用于控制 ALSA 设备(如设置音频参数),mmap() 系统调用用于映射 ALSA 设备的内存,以便应用程序可以直接访问这些内存,close() 系统调用用于关闭 ALSA 设备

Tip:
ALSA是位于Linux Kernel层面的音频系统。
TinyALSA是AOSP(Android Open Source Project)的一部分。
TinyALSA位于ALSA的上层,他们之间的关系是使用关系。
TinyALSA使用 ALSA 提供的接口与 Linux 内核进行交互。

本文就以pcm_open和pcm_write函数为例进行讲解,pcm_close和pcm_read函数的源码其实是类似的操作。熟悉pcm_open和pcm_write函数后,再去看pcm.c文件中的其它函数源码会有举一反三的效果。

参考源码:Android 12_r8官方pcm.c文件源码

4.1 pcm_open解析

4.1.1 pcm_open的主要流程

pcm_open主要流程

概述一下上面的流程图,tinycap的主要行为是:

  1. 创建一个新的PCM对象,并将传入的配置和标志复制到该对象中。
  2. 接下来,函数通过snd_utils_get_dev_node函数获取PCM设备的节点,并通过snd_utils_get_node_type函数获取设备的类型。根据设备类型,函数选择相应的操作集(ops)。
  3. 函数尝试打开PCM设备。如果打开失败,函数将清理已分配的资源并返回错误。如果设备成功打开,函数将获取设备的信息,并设置硬件参数(hw_params)。这些参数包括音频格式、子格式、周期大小、样本位数、帧位数、通道数、周期数和采样率
  4. 函数设置软件参数(sw_params)。这些参数包括时间戳模式、周期步长、启动阈值、停止阈值、可用最小值、传输对齐、静音阈值、静音大小和边界
  5. 函数尝试映射硬件状态。如果映射失败,函数将清理已分配的资源并返回错误。如果映射成功,函数将返回打开的PCM对象。

4.1.2 流程说明

  1. 函数选择相应的操作集(ops)主要有两种:
//plug_ops
struct pcm_ops plug_ops = {
    .open = pcm_plug_open,
    .close = pcm_plug_close,
    .ioctl = pcm_plug_ioctl,
    .mmap = pcm_plug_mmap,
    .munmap = pcm_plug_munmap,
    .poll = pcm_plug_poll,
};
//hw_ops
struct pcm_ops hw_ops = {
    .open = pcm_hw_open,
    .close = pcm_hw_close,
    .ioctl = pcm_hw_ioctl,
    .mmap = pcm_hw_mmap,
    .munmap = pcm_hw_munmap,
    .poll = pcm_hw_poll,
};

hw_ops指的就是操作硬件设备的一组函数。plug_ops是处理plug插件的一组函数。

Tip: plug 是 ALSA 中的一种插件,它可以自动进行音频格式转换,例如从一个采样率转换到另一个采样率,或者从一个音频格式转换到另一个音频格式。参考ALSA官方文档中的:ALSA官方文档

  1. pcm_hw_open访问硬件的方式

主要就是通过节点访问到Linux kernel层面

static int pcm_hw_open(unsigned int card, unsigned int device,
                unsigned int flags, void **data,
                __attribute__((unused)) void *node)
{
//...
    snprintf(fn, sizeof(fn), "/dev/snd/pcmC%uD%u%c", card, device,
             flags & PCM_IN ? 'c' : 'p');
    fd = open(fn, O_RDWR|O_NONBLOCK);
//...
}
  1. 设置的硬件和软件参数的含义

总结表格:

参数类型描述
SNDRV_PCM_HW_PARAM_FORMAT硬件PCM数据的格式,例如16位、24位、32位等
SNDRV_PCM_HW_PARAM_SUBFORMAT硬件PCM数据的子格式,通常设置为SNDRV_PCM_SUBFORMAT_STD,表示标准的线性PCM格式
SNDRV_PCM_HW_PARAM_PERIOD_SIZE硬件每个周期的帧数
SNDRV_PCM_HW_PARAM_SAMPLE_BITS硬件每个样本的位数
SNDRV_PCM_HW_PARAM_FRAME_BITS硬件每个帧的位数,等于样本位数乘以通道数
SNDRV_PCM_HW_PARAM_CHANNELS硬件音频数据的通道数
SNDRV_PCM_HW_PARAM_PERIODS硬件缓冲区中周期的数量
SNDRV_PCM_HW_PARAM_RATE硬件音频数据的采样率
sparams.tstamp_mode软件时间戳模式
sparams.period_step软件周期步长
sparams.start_threshold软件启动阈值
sparams.stop_threshold软件停止阈值
sparams.avail_min软件可用的最小帧数
sparams.xfer_align软件传输对齐
sparams.silence_threshold软件静音阈值
sparams.silence_size软件静音大小
sparams.boundary软件边界,定义了循环缓冲区的大小

硬件参数说明:

SNDRV_PCM_HW_PARAM_FORMAT:这是PCM数据的格式,例如16位、24位、32位等。

SNDRV_PCM_HW_PARAM_SUBFORMAT:这是PCM数据的子格式,通常设置为SNDRV_PCM_SUBFORMAT_STD,表示标准的线性PCM格式。

SNDRV_PCM_HW_PARAM_PERIOD_SIZE:这是每个周期的帧数。一个周期是音频数据的一个块,当一个周期的数据被播放或录制后,驱动程序将生成一个中断。

SNDRV_PCM_HW_PARAM_SAMPLE_BITS:这是每个样本的位数,它与SNDRV_PCM_HW_PARAM_FORMAT相关。

SNDRV_PCM_HW_PARAM_FRAME_BITS:这是每个帧的位数,它等于样本位数乘以通道数。

SNDRV_PCM_HW_PARAM_CHANNELS:这是音频数据的通道数,例如立体声有两个通道。

SNDRV_PCM_HW_PARAM_PERIODS:这是缓冲区中周期的数量。缓冲区是存储音频数据的内存区域,它由多个周期组成。

SNDRV_PCM_HW_PARAM_RATE:这是音频数据的采样率,例如44100Hz或48000Hz。

软件参数说明:

sparams.tstamp_mode:这是时间戳模式,设置为SNDRV_PCM_TSTAMP_ENABLE表示启用时间戳。

sparams.period_step:这是周期步长,通常设置为1。

sparams.start_threshold:这是启动阈值,当可用的帧数达到这个值时,播放或录制将开始。

sparams.stop_threshold:这是停止阈值,当可用的帧数达到这个值时,播放或录制将停止。

sparams.avail_min:这是可用的最小帧数,当可用的帧数达到这个值时,驱动程序将生成一个中断。

sparams.xfer_align:这是传输对齐,通常设置为周期大小的一半。

sparams.silence_threshold:这是静音阈值,当可用的帧数低于这个值时,驱动程序将生成静音数据。

sparams.silence_size:这是静音大小,它定义了静音数据的长度。

sparams.boundary:这是边界,它定义了循环缓冲区的大小。

4.1.3 调用方法

举个例子,如果想用音频节点0-0播放48K 2ch u16bit声音,可以这样设置参数:

unsigned int card = 0;
unsigned int device = 0;
unsigned int flags = PCM_OUT;
struct pcm_config config = {
    .channels = 2,
    .rate = 48000,
    .format = PCM_FORMAT_S16_LE,
    .period_size = 1024,
    .period_count = 4,
};
struct pcm *pcm = pcm_open(card, device, flags, &config);

4.2 pcm_write解析

源码的解析如下:

int pcm_write(struct pcm *pcm, const void *data, unsigned int count)
{
    // 定义一个snd_xferi结构体,用于存储音频数据和帧数
    struct snd_xferi x;

    // 检查PCM设备是否是输入设备,如果是,返回错误
    if (pcm->flags & PCM_IN)
        return -EINVAL;

    // 设置snd_xferi结构体的buf字段为传入的数据
    x.buf = (void*)data;
    // 设置snd_xferi结构体的frames字段为传入的数据量除以每帧的字节数
    x.frames = count / (pcm->config.channels *
                        pcm_format_to_bits(pcm->config.format) / 8);

    // 进入一个无限循环
    for (;;) {
        // 检查PCM设备是否正在运行
        if (!pcm->running) {
            // 如果不是,尝试准备PCM设备
            int prepare_error = pcm_prepare(pcm);
            // 如果准备失败,返回错误
            if (prepare_error)
                return prepare_error;
            // 尝试向PCM设备写入初始数据
            if (pcm->ops->ioctl(pcm->data, SNDRV_PCM_IOCTL_WRITEI_FRAMES, &x))
                // 如果写入失败,返回错误
                return oops(pcm, errno, "cannot write initial data");
            // 如果写入成功,将PCM设备标记为正在运行,并返回0
            pcm->running = 1;
            return 0;
        }
        // 如果PCM设备正在运行,尝试向设备写入数据
        if (pcm->ops->ioctl(pcm->data, SNDRV_PCM_IOCTL_WRITEI_FRAMES, &x)) {
            // 如果写入失败,重置PCM设备的prepared和running字段
            pcm->prepared = 0;
            pcm->running = 0;
            // 检查错误是否是EPIPE(管道破裂)
            if (errno == EPIPE) {
                // 如果是,增加underruns计数,并根据PCM设备的flags字段决定是否重新开始
                pcm->underruns++;
                if (pcm->flags & PCM_NORESTART)
                    return -EPIPE;
                continue;
            }
            // 如果不是EPIPE错误,返回错误
            return oops(pcm, errno, "cannot write stream data");
        }
        // 如果写入成功,返回0
        return 0;
    }
}

主要就是参数和环境检查,然后就调用ioctl进行处理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/193409.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

文章改写工具-改写神器

当代社会,信息爆炸,写作已成为人们生活与工作中不可或缺的一环。无论是学术论文、商业报告还是日常沟通,文字的准确表达和精彩呈现是至关重要的。然而,许多人在面对写作时,常常为语言表达、词汇选择而苦恼。为了解决这…

基于OpenCV+YOLOv5实现车辆跟踪与计数(附源码)

导 读 本文主要介绍基于OpenCVYOLOv5实现车辆跟踪与计数的应用,并给出源码。 资源下载 基础代码和视频下载地址: https://github.com/freedomwebtech/win11vehiclecount main.py代码:​​​​​​​ import cv2import torchimport numpy as npfrom tr…

Dockerfile讲解

Dockerfile 1. 构建过程解析2. Dockerfile常用保留字指令3. 案例3.1. 自定义镜像mycentosjava83.2. 虚悬镜像 4. Docker微服务实战 dockerfile是用来构建docker镜像的文本文件,是由一条条构建镜像所需的指令和参数构成的脚本。 dockerfile定义了进程需要的一切东西&…

hdlbits系列verilog解答(Exams/m2014 q4e)-46

文章目录 一、问题描述二、verilog源码三、仿真结果 一、问题描述 实现以下电路: 二、verilog源码 module top_module (input in1,input in2,output out);assign out ~(in1 | in2);endmodule三、仿真结果 转载请注明出处!

JOSEF 综合继电器 HJZZ-32/2 AC220V 合闸延时整定0.02-9.99S

系列型号: HJZZ-91分闸、合闸、电源监视综合装置; HJZZ-92/1分闸、合闸、电源监视综合装置; HJZZ-92/2分闸、合闸、电源监视综合装置; HJZZ-92/2A分闸、合闸、电源监视综合装置; HJZZ-92/3分闸、合闸、电源监视综…

Gitee上传代码教程

1. 本地安装git 官网下载太慢,我们也可以使用淘宝镜像下载:CNPM Binaries Mirror 安装成功以后电脑会有Git Bush标识,空白处右键也可查看。 2. 注册gitee账号(略) 3. 创建远程仓库 4. 上传代码 4.1 在项目文件目录…

【教学类-06-10】20231126 X-Y数字分合-分-下空左

结果展示: 背景需求: 数字分合,这一次空在左侧 代码展示: X-Y 之间的分合题-分-空在右侧 时间:2023年11月26日 21:46 作者:阿夏 import random from win32com.client import constants,gencache from win3…

python之静态服务器程序开发

文章目录 Python静态Web服务器开发Web静态服务器初识搭建Python自带的静态Web服务器静态Web服务器返回固定页面数据静态Web服务器返回指定页面数据静态Web服务器多任务版静态Web服务器面向对象开发静态Web服务器命令行启动动态绑定端口号 Python静态Web服务器开发 Web静态服务…

Web3.0时代:区块链DAPP将如何颠覆传统模式

小编介绍:10年专注商业模式设计及软件开发,擅长企业生态商业模式,商业零售会员增长裂变模式策划、商业闭环模式设计及方案落地;扶持10余个电商平台做到营收过千万,数百个平台达到百万会员,欢迎咨询。 随着…

基于DSP/SOC音乐灯效系统设计方法

音乐灯效系统设计方法 是否需要申请加入数字音频系统研究开发交流答疑群(课题组)?可加我微信hezkz17, 本群提供音频技术答疑服务,+群赠送语音信号处理降噪算法,蓝牙耳机音频,DSP音频项目核心开发资料, 三种方法: (1)MIC 采集音乐信号变化,(2)直接获取SPK 模拟音频…

使用char.js 柱形方式显示 一年12个月的最高气温与最低气温

<!DOCTYPE html> <html> <head><title>气温图表</title><script src"https://cdn.jsdelivr.net/npm/chart.js"></script><style>#myChart{width:800px;height: 400px;}</style> </head> <body>&l…

【Linux】:信号在内核里的处理

信号的发送和保存 一.内核中的信号处理二.信号集操作函数1.一些信号函数2.sigprocmask3.sigpending4.写代码 三.信号在什么时候处理的四.再谈地址空间 一.内核中的信号处理 1.实际执行信号的处理动作称为信号递达(Delivery )2.信号从产生到递达之间的状态,称为信号未决(Pending…

通义灵码,你的智能编码助手,免费公测啦!

目录 ​编辑 1、介绍 2、安装 3、功能介绍 行/函数级实时续写 自然语言生成代码 单元测试生成 代码注释生成 代码解释 研发智能问答 多编程语言、多编辑器全方位支持 4、视频 &#x1f343;作者介绍&#xff1a;双非本科大三网络工程专业在读&#xff0c;阿里云专家…

QT Day01 qt概述,创建项目,窗口属性,按钮,信号与槽

1.qt概述 1.什么是qt Qt 是一个跨平台的 C 图形用户界面应用程序框架。它为应用程序开发者提供建立艺 术级图形界面所需的所有功能。它是完全面向对象的&#xff0c;很容易扩展&#xff0c;并且允许真正的组 件编程。 2.支持的平台 Windows – XP 、 Vista 、 Win7 、 Win8…

博捷芯打破半导体切割划片设备技术垄断,国产产业链实现高端突破

近日&#xff0c;国内半导体产业传来喜讯&#xff0c;博捷芯成功实现批量供货半导体切割划片设备&#xff0c;打破国外企业在该领域的长期技术垄断&#xff0c;为国产半导体产业链在高端切割划片设备领域实现重大突破。 自上世纪90年代以来&#xff0c;由于国外企业的技术封锁和…

通俗易懂的spring Cloud;业务场景介绍 二、Spring Cloud核心组件:Eureka 、Feign、Ribbon、Hystrix、zuul

文章目录 通俗易懂的spring Cloud一、业务场景介绍二、Spring Cloud核心组件&#xff1a;Eureka三、Spring Cloud核心组件&#xff1a;Feign四、Spring Cloud核心组件&#xff1a;Ribbon五、Spring Cloud核心组件&#xff1a;Hystrix六、Spring Cloud核心组件&#xff1a;Zuul七…

vivado产生报告阅读分析25-复杂性报告

对于顶层设计和 / 或包含 1000 个以上叶节点单元的层级单元 &#xff0c; 复杂性报告会显示每个叶节点单元类型的“ Rent Exponent” &#xff08; Rent 指数 &#xff09; 、“ Average Fanout ” &#xff08; 平均扇出 &#xff09; 和分布。 Rent 指数是指在使用最小割 …

Linux中tar命令的几个高级用法

在Linux世界中&#xff0c;Tar命令是一把解密归档世界的魔法工具。无论是打包、压缩还是解压&#xff0c;Tar命令都能胜任。本文将生动地介绍Tar命令的基本用法&#xff0c;并深入探讨五个常用选项&#xff0c;帮助读者在Linux系统中灵活运用这个强大的工具。 一、命令概述 Ta…

西北大学计算机844考研-23年计网计算题详细解析

西北大学计算机844考研-23年计网计算题详细解析 1.计算无传输差错状态下停止—等待ARQ协议效率,电磁波传播速率为2*10^8m/s&#xff0c;链路长为2000m&#xff0c;帧长度为1000比特&#xff0c;计算传输速率10kbps及10Mbps时的协议效率&#xff08;即信道利用率&#xff09; …

[python]离线加载fetch_20newsgroups数据集

首先手动下载这个数据包 http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz 下载这个文件后和脚本放一起就行&#xff0c;然后 打开twenty_newsgroups.py文件&#xff08;在fetch_20newsgroups函数名上&#xff0c;右键转到定义即可找到&#xff09; 之后运行代码即…
最新文章