录制音频,存储在缓冲区中,然后通过PulseAudio将字节写入声卡
Record audio, store in buffer and then write bytes to sound card via PulseAudio
我正在尝试使用以下代码行录制音频:
// The sample type to use
static const pa_sample_spec ss = {
.format = PA_SAMPLE_S32LE , //PA_SAMPLE_S16BE, ??? Which one to us here ??? BE...Big Endian
.rate = 44100, // That are samples per second
.channels = 2
};
// Create the recording stream
// see: http://freedesktop.org/software/pulseaudio/doxygen/parec-simple_8c-example.html
if (!(s = pa_simple_new(NULL, "Record", PA_STREAM_RECORD, NULL, "record", &ss, NULL, NULL, &error))) {
fprintf(stderr, __FILE__": pa_simple_new() failed: %sn", pa_strerror(error));
pa_simple_free(s);
exit(EXIT_FAILURE);
}
int i = -1;
while (!exit_program) {
i = (i+1) % BUFNUMBER;
pthread_mutex_lock(&(buffer[i].write));
// Record data and save it to the buffer
if (pa_simple_read(s, buffer[i].buf, sizeof(buffer[i].buf), &error) < 0) {
fprintf(stderr, __FILE__": pa_simple_read() failed: %sn", pa_strerror(error));
pa_simple_free(s);
exit(EXIT_FAILURE);
}
// unlock the reading mutex
pthread_mutex_unlock(&(buffer[i].read)); // open up for reading
}
如您所见,我将读取的字节存储在一个名为缓冲区的结构中,如下所示:
#define BUFSIZE 44100 // Size of one element
#define BUFNUMBER 16 // Number of elements
#define AUDIO_BUFFER_FORMAT char
// one element of the ringbuffer
typedef struct ringbuf {
AUDIO_BUFFER_FORMAT buf[BUFSIZE]; /* The buffer array */
pthread_mutex_t read; /* indicates if block was read */
pthread_mutex_t write; /* for locking writing */
} ringbuffer_element;
另一个线程尝试读取和播放存储在缓冲区中的字节:
// The sample type to use
static const pa_sample_spec ss = {
.format = PA_SAMPLE_S32LE , //PA_SAMPLE_S16BE,
.rate = 44100,
.channels = 2
};
if (stream == NULL) {
if (!(stream = pa_simple_new(NULL, "Stream", PA_STREAM_PLAYBACK, NULL, "playback", &ss, NULL, NULL, &error))) {
fprintf(stderr, __FILE__": pa_simple_new() failed: %sn", pa_strerror(error));
return false;
}
}
if (pa_simple_write(stream, buf, (size_t) size, &error) < 0) {
fprintf(stderr, __FILE__": pa_simple_write() failed: %sn", pa_strerror(error));
pa_simple_free(stream);
return false;
}
/* Make sure that every single sample was played */
if (pa_simple_drain(stream, &error) < 0) {
fprintf(stderr, __FILE__": pa_simple_drain() failed: %sn", pa_strerror(error));
pa_simple_free(stream);
return false;
}
但是,我测试了缓冲区的实现,它工作得很好。尽管如此,我唯一能听到的就是噪音。所以我想知道,如果我需要在再次播放它们之前转换字节,以便听起来像录音。
此外,我找不到声卡等的任何数据表。我是否必须转换字节,或者我可以只播放录制的字节吗?我使用的格式是否破坏了某些内容?
我真的被困在这里了。希望你们能帮我。
编辑:还有一个问题:如果我使用 ALSA API 更接近硬件以实现我的目的会更好吗?是的,我对声音编程完全陌生。
解决方案:
两个值: #define BUFSIZE 44100//一个元件的大小 #define BUFNUMBER 16//元素数量
真的不重要。它们不应该太小。否则,程序将卡住播放音频。
重要的是!!每次播放缓冲区结构片段时调用以下代码片段。音频声卡包含一个缓冲区,默认情况下,缓冲区首先填充,然后播放。这也是播放音频有一点延迟的原因。
/* Make sure that every single sample was played */
if (pa_simple_drain(stream, &error) < 0) {
fprintf(stderr, __FILE__": pa_simple_drain() failed: %sn", pa_strerror(error));
pa_simple_free(stream);
return false;
}
可以通过以下代码找出延迟量:
pa_usec_t latency;
if ((latency = pa_simple_get_latency(stream, &error)) == (pa_usec_t) -1) {
fprintf(stderr, __FILE__": pa_simple_get_latency() failed: %sn", pa_strerror(error));
}
fprintf(stderr, "%0.0f usec r", (float)latency);
但是,延迟不是恒定的,并且一直在变化。顺便说一下:如果需要,可以在创建播放流时设置缓冲区大小。
哦,我用过:PA_SAMPLE_S16LE,但是你只需要使用相同的值进行录制和播放,否则听起来很奇怪。
希望对某人有所帮助。
相关文章:
- 从不同线程使用int64的不同字节安全吗
- 将Integer转换为4字节的unsined字符矢量(按大端字节顺序)
- 在UNIX系统中使用DIR查找文件的字节大小
- 如何使用Crypto++并为RSA返回可打印的字节/字符数组
- std::当在256字节边界上写入整数时,流的奇怪行为
- 当比特(而不是字节)的顺序至关重要时的持久性
- 从文件中读取多个字节,并将它们存储在C++中进行比较
- 如何在文件中查找字节序列
- luaL_dofile在已知良好的字节码上失败,可以使用未编译的版本
- 字节到位运算符重载C++
- 在java中读取c++字节的位字段
- 使用 std::vector::reverse_iterator 将 int 序列化为字节向量?
- 字节真的是最小可寻址单元吗
- struct.error:解压缩 C++ 结构时,解包需要 288 字节的缓冲区
- 读取文件中所有可能的十六进制 16 字节序列并打印每个序列
- 如何使用 OpenCV 解码在两个 UWP 应用之间发送的图像字节?
- 如何将字节数组元素替换为修改的十六进制 ASCII 符号?
- asn1c 不会从 asn.1 模块中提取八位字节字符串的默认值
- 如何将原始字节附加到 std::vector?
- 录制音频,存储在缓冲区中,然后通过PulseAudio将字节写入声卡