anotherim-desktop/plugins/rtp/src/voice_processor_native.cpp

#include <algorithm>
#include <gst/gst.h>
#include <gst/audio/audio.h>
#include <webrtc/modules/audio_processing/include/audio_processing.h>
#include <webrtc/modules/interface/module_common_types.h>
#include <webrtc/system_wrappers/include/trace.h>

#define SAMPLE_RATE 48000
#define SAMPLE_CHANNELS 1

struct _DinoPluginsRtpVoiceProcessorNative {
    webrtc::AudioProcessing *apm;
    gint stream_delay;
    gint last_median;
    gint last_poor_delays;
};

extern "C" void *dino_plugins_rtp_adjust_to_running_time(GstBaseTransform *transform, GstBuffer *buffer) {
    GstBuffer *copy = gst_buffer_copy(buffer);
    GST_BUFFER_PTS(copy) = gst_segment_to_running_time(&transform->segment, GST_FORMAT_TIME, GST_BUFFER_PTS(buffer));
    return copy;
}

extern "C" void *dino_plugins_rtp_voice_processor_init_native(gint stream_delay) {
    _DinoPluginsRtpVoiceProcessorNative *native = new _DinoPluginsRtpVoiceProcessorNative();
    webrtc::Config config;
    config.Set<webrtc::ExtendedFilter>(new webrtc::ExtendedFilter(true));
    config.Set<webrtc::ExperimentalAgc>(new webrtc::ExperimentalAgc(true, 85));
    native->apm = webrtc::AudioProcessing::Create(config);
    native->stream_delay = stream_delay;
    native->last_median = 0;
    native->last_poor_delays = 0;
    return native;
}

extern "C" void dino_plugins_rtp_voice_processor_setup_native(void *native_ptr) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    webrtc::AudioProcessing *apm = native->apm;
    webrtc::ProcessingConfig pconfig;
    pconfig.streams[webrtc::ProcessingConfig::kInputStream] =
            webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);
    pconfig.streams[webrtc::ProcessingConfig::kOutputStream] =
            webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);
    pconfig.streams[webrtc::ProcessingConfig::kReverseInputStream] =
            webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);
    pconfig.streams[webrtc::ProcessingConfig::kReverseOutputStream] =
            webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);
    apm->Initialize(pconfig);
    apm->high_pass_filter()->Enable(true);
    apm->echo_cancellation()->enable_drift_compensation(false);
    apm->echo_cancellation()->set_suppression_level(webrtc::EchoCancellation::kModerateSuppression);
    apm->echo_cancellation()->enable_delay_logging(true);
    apm->echo_cancellation()->Enable(true);
    apm->noise_suppression()->set_level(webrtc::NoiseSuppression::kModerate);
    apm->noise_suppression()->Enable(true);
    apm->gain_control()->set_analog_level_limits(0, 255);
    apm->gain_control()->set_mode(webrtc::GainControl::kAdaptiveAnalog);
    apm->gain_control()->set_target_level_dbfs(3);
    apm->gain_control()->set_compression_gain_db(9);
    apm->gain_control()->enable_limiter(true);
    apm->gain_control()->Enable(true);
    apm->voice_detection()->set_likelihood(webrtc::VoiceDetection::Likelihood::kLowLikelihood);
    apm->voice_detection()->Enable(true);
}

extern "C" void
dino_plugins_rtp_voice_processor_analyze_reverse_stream(void *native_ptr, GstAudioInfo *info, GstBuffer *buffer) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    webrtc::StreamConfig config(SAMPLE_RATE, SAMPLE_CHANNELS, false);
    webrtc::AudioProcessing *apm = native->apm;

    GstMapInfo map;
    gst_buffer_map(buffer, &map, GST_MAP_READ);

    webrtc::AudioFrame frame;
    frame.num_channels_ = info->channels;
    frame.sample_rate_hz_ = info->rate;
    frame.samples_per_channel_ = gst_buffer_get_size(buffer) / info->bpf;
    memcpy(frame.data_, map.data, frame.samples_per_channel_ * info->bpf);

    int err = apm->AnalyzeReverseStream(&frame);
    if (err < 0) g_warning("voice_processor_native.cpp: ProcessReverseStream %i", err);

    gst_buffer_unmap(buffer, &map);
}

extern "C" void dino_plugins_rtp_voice_processor_notify_gain_level(void *native_ptr, gint gain_level) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    webrtc::AudioProcessing *apm = native->apm;
    apm->gain_control()->set_stream_analog_level(gain_level);
}

extern "C" gint dino_plugins_rtp_voice_processor_get_suggested_gain_level(void *native_ptr) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    webrtc::AudioProcessing *apm = native->apm;
    return apm->gain_control()->stream_analog_level();
}

extern "C" bool dino_plugins_rtp_voice_processor_get_stream_has_voice(void *native_ptr) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    webrtc::AudioProcessing *apm = native->apm;
    return apm->voice_detection()->stream_has_voice();
}

extern "C" void dino_plugins_rtp_voice_processor_adjust_stream_delay(void *native_ptr) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    webrtc::AudioProcessing *apm = native->apm;
    int median, std, poor_delays;
    float fraction_poor_delays;
    apm->echo_cancellation()->GetDelayMetrics(&median, &std, &fraction_poor_delays);
    poor_delays = (int)(fraction_poor_delays * 100.0);
    if (fraction_poor_delays < 0 || (native->last_median == median && native->last_poor_delays == poor_delays)) return;
    g_debug("voice_processor_native.cpp: Stream delay metrics: median=%i std=%i poor_delays=%i%%", median, std, poor_delays);
    native->last_median = median;
    native->last_poor_delays = poor_delays;
    if (poor_delays > 90) {
        native->stream_delay = std::min(std::max(0, native->stream_delay + std::min(48, std::max(median, -48))), 384);
        g_debug("voice_processor_native.cpp: set stream_delay=%i", native->stream_delay);
    }
}

extern "C" void
dino_plugins_rtp_voice_processor_process_stream(void *native_ptr, GstAudioInfo *info, GstBuffer *buffer) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    webrtc::StreamConfig config(SAMPLE_RATE, SAMPLE_CHANNELS, false);
    webrtc::AudioProcessing *apm = native->apm;

    GstMapInfo map;
    gst_buffer_map(buffer, &map, GST_MAP_READWRITE);

    webrtc::AudioFrame frame;
    frame.num_channels_ = info->channels;
    frame.sample_rate_hz_ = info->rate;
    frame.samples_per_channel_ = info->rate / 100;
    memcpy(frame.data_, map.data, frame.samples_per_channel_ * info->bpf);

    apm->set_stream_delay_ms(native->stream_delay);
    int err = apm->ProcessStream(&frame);
    if (err >= 0) memcpy(map.data, frame.data_, frame.samples_per_channel_ * info->bpf);
    if (err < 0) g_warning("voice_processor_native.cpp: ProcessStream %i", err);

    gst_buffer_unmap(buffer, &map);
}

extern "C" void dino_plugins_rtp_voice_processor_destroy_native(void *native_ptr) {
    _DinoPluginsRtpVoiceProcessorNative *native = (_DinoPluginsRtpVoiceProcessorNative *) native_ptr;
    delete native;
}
Echo Cancellation 2021-05-01 13:19:05 +00:00			`#include <algorithm>`
			`#include <gst/gst.h>`
			`#include <gst/audio/audio.h>`
			`#include <webrtc/modules/audio_processing/include/audio_processing.h>`
			`#include <webrtc/modules/interface/module_common_types.h>`
			`#include <webrtc/system_wrappers/include/trace.h>`

			`#define SAMPLE_RATE 48000`
			`#define SAMPLE_CHANNELS 1`

			`struct _DinoPluginsRtpVoiceProcessorNative {`
			`webrtc::AudioProcessing *apm;`
			`gint stream_delay;`
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`gint last_median;`
			`gint last_poor_delays;`
Echo Cancellation 2021-05-01 13:19:05 +00:00			`};`

			`extern "C" void dino_plugins_rtp_adjust_to_running_time(GstBaseTransform transform, GstBuffer *buffer) {`
			`GstBuffer *copy = gst_buffer_copy(buffer);`
			`GST_BUFFER_PTS(copy) = gst_segment_to_running_time(&transform->segment, GST_FORMAT_TIME, GST_BUFFER_PTS(buffer));`
			`return copy;`
			`}`

			`extern "C" void *dino_plugins_rtp_voice_processor_init_native(gint stream_delay) {`
			`_DinoPluginsRtpVoiceProcessorNative *native = new _DinoPluginsRtpVoiceProcessorNative();`
			`webrtc::Config config;`
			`config.Set<webrtc::ExtendedFilter>(new webrtc::ExtendedFilter(true));`
			`config.Set<webrtc::ExperimentalAgc>(new webrtc::ExperimentalAgc(true, 85));`
			`native->apm = webrtc::AudioProcessing::Create(config);`
			`native->stream_delay = stream_delay;`
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`native->last_median = 0;`
			`native->last_poor_delays = 0;`
Echo Cancellation 2021-05-01 13:19:05 +00:00			`return native;`
			`}`

			`extern "C" void dino_plugins_rtp_voice_processor_setup_native(void *native_ptr) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`webrtc::AudioProcessing *apm = native->apm;`
			`webrtc::ProcessingConfig pconfig;`
			`pconfig.streams[webrtc::ProcessingConfig::kInputStream] =`
			`webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);`
			`pconfig.streams[webrtc::ProcessingConfig::kOutputStream] =`
			`webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);`
			`pconfig.streams[webrtc::ProcessingConfig::kReverseInputStream] =`
			`webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);`
			`pconfig.streams[webrtc::ProcessingConfig::kReverseOutputStream] =`
			`webrtc::StreamConfig(SAMPLE_RATE, SAMPLE_CHANNELS, false);`
			`apm->Initialize(pconfig);`
			`apm->high_pass_filter()->Enable(true);`
			`apm->echo_cancellation()->enable_drift_compensation(false);`
			`apm->echo_cancellation()->set_suppression_level(webrtc::EchoCancellation::kModerateSuppression);`
			`apm->echo_cancellation()->enable_delay_logging(true);`
			`apm->echo_cancellation()->Enable(true);`
			`apm->noise_suppression()->set_level(webrtc::NoiseSuppression::kModerate);`
			`apm->noise_suppression()->Enable(true);`
			`apm->gain_control()->set_analog_level_limits(0, 255);`
			`apm->gain_control()->set_mode(webrtc::GainControl::kAdaptiveAnalog);`
			`apm->gain_control()->set_target_level_dbfs(3);`
			`apm->gain_control()->set_compression_gain_db(9);`
			`apm->gain_control()->enable_limiter(true);`
			`apm->gain_control()->Enable(true);`
			`apm->voice_detection()->set_likelihood(webrtc::VoiceDetection::Likelihood::kLowLikelihood);`
			`apm->voice_detection()->Enable(true);`
			`}`

			`extern "C" void`
			`dino_plugins_rtp_voice_processor_analyze_reverse_stream(void native_ptr, GstAudioInfo info, GstBuffer *buffer) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`webrtc::StreamConfig config(SAMPLE_RATE, SAMPLE_CHANNELS, false);`
			`webrtc::AudioProcessing *apm = native->apm;`

Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`GstMapInfo map;`
			`gst_buffer_map(buffer, &map, GST_MAP_READ);`
Echo Cancellation 2021-05-01 13:19:05 +00:00
			`webrtc::AudioFrame frame;`
			`frame.num_channels_ = info->channels;`
			`frame.sample_rate_hz_ = info->rate;`
			`frame.samples_per_channel_ = gst_buffer_get_size(buffer) / info->bpf;`
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`memcpy(frame.data_, map.data, frame.samples_per_channel_ * info->bpf);`
Echo Cancellation 2021-05-01 13:19:05 +00:00
			`int err = apm->AnalyzeReverseStream(&frame);`
Fix webcam framerate selection 2021-05-01 15:27:55 +00:00			`if (err < 0) g_warning("voice_processor_native.cpp: ProcessReverseStream %i", err);`
Echo Cancellation 2021-05-01 13:19:05 +00:00
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`gst_buffer_unmap(buffer, &map);`
Echo Cancellation 2021-05-01 13:19:05 +00:00			`}`

			`extern "C" void dino_plugins_rtp_voice_processor_notify_gain_level(void *native_ptr, gint gain_level) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`webrtc::AudioProcessing *apm = native->apm;`
			`apm->gain_control()->set_stream_analog_level(gain_level);`
			`}`

			`extern "C" gint dino_plugins_rtp_voice_processor_get_suggested_gain_level(void *native_ptr) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`webrtc::AudioProcessing *apm = native->apm;`
			`return apm->gain_control()->stream_analog_level();`
			`}`

			`extern "C" bool dino_plugins_rtp_voice_processor_get_stream_has_voice(void *native_ptr) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`webrtc::AudioProcessing *apm = native->apm;`
			`return apm->voice_detection()->stream_has_voice();`
			`}`

			`extern "C" void dino_plugins_rtp_voice_processor_adjust_stream_delay(void *native_ptr) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`webrtc::AudioProcessing *apm = native->apm;`
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`int median, std, poor_delays;`
Echo Cancellation 2021-05-01 13:19:05 +00:00			`float fraction_poor_delays;`
			`apm->echo_cancellation()->GetDelayMetrics(&median, &std, &fraction_poor_delays);`
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`poor_delays = (int)(fraction_poor_delays * 100.0);`
			`if (fraction_poor_delays < 0 \|\| (native->last_median == median && native->last_poor_delays == poor_delays)) return;`
			`g_debug("voice_processor_native.cpp: Stream delay metrics: median=%i std=%i poor_delays=%i%%", median, std, poor_delays);`
			`native->last_median = median;`
			`native->last_poor_delays = poor_delays;`
			`if (poor_delays > 90) {`
			`native->stream_delay = std::min(std::max(0, native->stream_delay + std::min(48, std::max(median, -48))), 384);`
			`g_debug("voice_processor_native.cpp: set stream_delay=%i", native->stream_delay);`
Echo Cancellation 2021-05-01 13:19:05 +00:00			`}`
			`}`

			`extern "C" void`
			`dino_plugins_rtp_voice_processor_process_stream(void native_ptr, GstAudioInfo info, GstBuffer *buffer) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`webrtc::StreamConfig config(SAMPLE_RATE, SAMPLE_CHANNELS, false);`
			`webrtc::AudioProcessing *apm = native->apm;`

Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`GstMapInfo map;`
			`gst_buffer_map(buffer, &map, GST_MAP_READWRITE);`
Echo Cancellation 2021-05-01 13:19:05 +00:00
			`webrtc::AudioFrame frame;`
			`frame.num_channels_ = info->channels;`
			`frame.sample_rate_hz_ = info->rate;`
			`frame.samples_per_channel_ = info->rate / 100;`
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`memcpy(frame.data_, map.data, frame.samples_per_channel_ * info->bpf);`
Echo Cancellation 2021-05-01 13:19:05 +00:00
			`apm->set_stream_delay_ms(native->stream_delay);`
			`int err = apm->ProcessStream(&frame);`
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`if (err >= 0) memcpy(map.data, frame.data_, frame.samples_per_channel_ * info->bpf);`
Fix webcam framerate selection 2021-05-01 15:27:55 +00:00			`if (err < 0) g_warning("voice_processor_native.cpp: ProcessStream %i", err);`
Echo Cancellation 2021-05-01 13:19:05 +00:00
Support voice processing on GStreamer 0.14 2021-05-01 22:34:17 +00:00			`gst_buffer_unmap(buffer, &map);`
Echo Cancellation 2021-05-01 13:19:05 +00:00			`}`

			`extern "C" void dino_plugins_rtp_voice_processor_destroy_native(void *native_ptr) {`
			`_DinoPluginsRtpVoiceProcessorNative native = (_DinoPluginsRtpVoiceProcessorNative ) native_ptr;`
			`delete native;`
			`}`