Исследователи продемонстрировали новый инструмент сжатия изображений, который сочетает рекурсивные алгоритмы со сверточными нейронными сетями (CNN), чтобы превзойти другие подходы к сжатию изображений из компьютерного искусства и дизайна взаимодействия. Исследование опубликовано в Международный журнал по вычислительной системной инженерии.
Цифровое искусство и дизайн все больше полагаются на большие объемы визуальных данных, поэтому эффективное сжатие изображений важно для снижения требований к хранению на компьютере без ущерба качеству. Дуань Сун из отделения изящных искусств в колледже профессионального искусства провинции Хэбэй в Шицзячжуане, Китай, предложил алгоритм, который решает проблемы путем интеграции традиционных и современных методов.
Рекурсивные алгоритмы, которые упрощают сложные проблемы посредством повторного применения правил. Сонг объясняет, что подход работает путем разбиения изображения на более простые компоненты. Применяя процесс итеративно, можно поддерживать качество.
Интеграция CNN в подход сжатия основывается на том, как такие системы изначально были вдохновлены тем, как человеческий мозг обрабатывает визуальную информацию. Они широко используются в глубоком обучении для распознавания и обработки изображений.
Инновационное слияние рекурсивных методов с сверточным нейронными сетями, предложенное Сонгом, позволяет ему преодолеть некоторые ограничения более ранних методов сжатия изображений, которые обычно не позволяют достичь приемлемых коэффициентов сжатия из-за растущей сложности и масштаба современных данных изображений.
Song протестировал алгоритм на двух известных наборах данных изображений, Kodak1 и Kodak2, чтобы оценить его производительность. Результаты показывают, что алгоритм последовательно уменьшал среднюю квадратическую ошибку (MSE) между исходными и сжатыми изображениями. Более низкая MSE означает лучшее сохранение качества изображения.
После 800 итераций алгоритм достиг самого низкого значения MSE по сравнению с другими методами, а также показал хорошие результаты с точки зрения пикового отношения сигнал/шум и многомасштабного структурного сходства. Эти результаты показывают, что предложенный метод может эффективно сжимать изображения без существенной потери качества.
Подход будет полезен в области компьютерного искусства, но также может быть полезен в моделировании анимации, дизайне художественных интерфейсов и медицинской визуализации.
Предоставлено Inderscience
Изображение: Pixabay/CC0 Public Domain (тегиToTranslate)новости о высоких технологиях