Применение FN-корректора с целью повышения качества классификации аудиособытий
Аннотация:
Предмет исследования. Рассмотрена проблема классификации акустических событий, активно применяемых в решениях задач безопасного города, умного дома, IoT устройств, а также для детектирования опасных ситуаций на производстве. Предложено решение повышения точности классификаторов без изменения их структуры и сбора дополнительных данных. Основным источником данных для экспериментов выбран открытый набор данных TUT Urban Acoustic Scenes 2018, Development Dataset. Метод. Предложен способ увеличения точности классификации аудиособытий с помощью использования FN-корректора. FN-корректор представляет собой линейный классификатор и работает в два этапа: преобразование пространства признаков в линейно-разделимое пространство и линейное отделение одного класса от другого. В случае применения корректора классы — типы ответов исходного классификатора: положительный (P), отрицательный (N), ложноположительный (FP) и ложноотрицательный (FN). В результате возможно обучить два типа корректоров FP и FN, которые работают как бинарные линейные классификаторы и разделяют ответы на положительные/ ложноположительные и отрицательные/ложноотрицательные соответственно. Выполнены эксперименты, где в качестве исходного классификатора использована сверточная нейронная сеть VGGish. Аудиосигнал преобразован в спектрограмму и передан на вход нейронной сети, которая формирует признаковое описание спектрограммы и производит классификацию. Основные результаты. В качестве примера демонстрации повышения точности классификации выбраны два «спутанных» класса. С помощью признакового описания аудиозаписей этих классов построен, обучен FN-корректор и подключен к исходному классификатору. Ответ от классификатора, а также признаковое описание передано на вход корректора. Далее корректор переводит пространство признаков в новый базис (в линейно разделимое пространство) и классифицирует ответ классификатора, таким образом «отвечает» на вопрос, ошибается ли исходный классификатор на таком векторе признаков или нет. Если исходный классификатор ошибся, то его ответ изменяется корректором на противоположный. Если нет — ответ остается тем же самым. Результаты экспериментов продемонстрировали снижение уровня спутывания классов и, соответственно, увеличение точности исходного классификатора без изменения его структуры и без сбора дополнительного набора данных. Практическая значимость. Полученные результаты могут быть использованы на устройствах IoT, имеющих существенные ограничения по размеру используемых моделей, а также при решении проблем доменной адаптации, актуальной в задачах аудиоаналитики.
Ключевые слова:
Постоянный URL
Статьи в номере
- Исследование дисперсионных свойств конгруэнтного кристалла ниобата лития терагерцовом диапазоне частот
- Исследование влияния наведенных механических напряжений, вызванных герметизацией стеклоприпоем, на значение коэффициента поляризационной экстинкции в двулучепреломляющем оптическом волокне
- Метод дистанционного контроля радиационных параметров космических аппаратов на основе рентгенофлуоресцентного анализа
- Волоконно-оптический амплитудный датчик направления и величины изгиба
- Компенсация внешних возмущений для многоканальных систем с запаздыванием в управлении
- Построение криптографических схем, основанных на эллиптических кривых над рациональными числами
- Алгоритм генерации проектных решений для управления данными и проектно-производственными процедурами на этапах жизненного цикла электронного изделия
- Способ повышения эффективности комплексной обработки данных дистанционного зондирования Земли при решении задач мониторинга пространственных объектов
- Разработка модели обнаружения сетевых аномалий трафика в беспроводных распределенных самоорганизующихся сетях
- Усиление роли микроархитектурных этапов проектирования встраиваемых систем
- Многомерный двоичный классификатор дерева решений на основе неглубокой нейронной сети
- Организация фаззинг-тестирования многопоточных приложений на основе метода распараллеливания независимых переходов
- Метод защиты нейронных сетей от компьютерных бэкдор-атак на основе идентификации триггеров закладок
- Программная инструментальная система создания адаптивных пользовательских интерфейсов
- Облегченная система рекомендаций для анализа социальных сетей с использованием гибридного алгоритма классификатора BERT-SVM
- Метод обнаружения инцидентов информационной безопасности по аномалиям в биометрических поведенческих чертах пользователя
- Моделирование случайных процессов на основе преобразования Карунена–Лоэва
- Управление численной диссипацией гибридного метода крупных частиц в задачах с вихревой неустойчивостью
- Численная модель импульсного подкритического стримерного сверхвысокочастотного разряда для задач плазменного поджига топливных смесей в газовой фазе
- Численное исследование прямой, винтовой и спиральной капиллярной трубок для хладагента CO2
- Восстановление информации в зашумленном канале методом фантомной визуализации со спектральным мультиплексированием в оптическом диапазоне