Academic Journal

Performance enhancement of RGB image convolution using convolution kernel clustering algorithm for ARM64 processor architecture

Bibliographic Details
Title: Performance enhancement of RGB image convolution using convolution kernel clustering algorithm for ARM64 processor architecture
Source: Problems of Informatization and Management; Vol. 1 No. 81 (2025); 140-149
Проблемы информатизации и управления; Том 1 № 81 (2025); 140-149
Проблеми iнформатизацiї та управлiння; Том 1 № 81 (2025); 140-149
Publisher Information: Problems of Informatization and Management, 2025.
Publication Year: 2025
Subject Terms: convolution operation, convolution kernel clustering, sparse matrices, кластеризація ядер згортки, векторизація, SIMD optimization, digital image processing, RGB-зображення, SIMD-оптимізація, цифрова обробка зображень, операція згортки, vectorization, розріджені матриці, RGB images, ARM64, OpenCV, NEON64
Description: The paper presents a method for improving the performance of RGB image convolution operation on the ARM64 platform using a convolution kernel element clustering algorithm. The proposed approach is based on vectorization of computations using NEON64 SIMD instructions and grouping of non-zero kernel elements with the same sign for efficient skipping of operations with zero elements. A mathematical model of vectorized convolution operation has been developed, which takes into account the specifics of sparse convolution kernel matrices. Experimental study on the Orange Pi 5 Pro platform demonstrated significant acceleration compared to the cv::filter2D() function of the OpenCV library: for medium-sized kernels (7×7 – 11×11), an acceleration of 5.0–9.7 times was achieved, for large kernels (12×12 – 15×15) – 1.7–5.5 times. The proposed method is particularly effective for processing high-resolution images and can be applied in real-time systems on single-board computers with limited computational resources. У статті представлено метод підвищення швидкодії операції згортки RGB-зображень на платформі ARM64 з використанням алгоритму кластеризації елементів ядер згортки. Запропонований підхід базується на векторизації обчислень з використанням SIMD-інструкцій NEON64 та групуванні ненульових елементів ядра згортки однакового знаку для ефективного пропуску операцій з нульовими елементами. Розроблено математичну модель векторизованої операції згортки, яка враховує специфіку розріджених матриць ядер згортки. Експериментальне дослідження на платформі Orange Pi 5 Pro продемонструвало значне прискорення порівняно з функцією cv::filter2D() бібліотеки OpenCV: для ядер середнього розміру (7×7 – 11×11) досягнуто прискорення в 5,0–9,7 разів, для великих ядер (12×12 – 15×15) – в 1,7–5,5 разів. Запропонований метод особливо ефективний для обробки зображень високої роздільної здатності та може бути застосований у системах реального часу на одноплатних комп'ютерах з обмеженими обчислювальними ресурсами.
Document Type: Article
File Description: application/pdf
Language: Ukrainian
DOI: 10.18372/2073-4751.81.20144
Access URL: https://jrnl.nau.edu.ua/index.php/PIU/article/view/20144
Accession Number: edsair.aviationuniv..3f597811f6d3c6df3ccdfaf0909d5a7c
Database: OpenAIRE
Description
DOI:10.18372/2073-4751.81.20144