Academic Journal

A RESEARCH OF THE LATEST APPROACHES TO VISUAL IMAGE RECOGNITION AND CLASSIFICATION

Λεπτομέρειες βιβλιογραφικής εγγραφής
Τίτλος: A RESEARCH OF THE LATEST APPROACHES TO VISUAL IMAGE RECOGNITION AND CLASSIFICATION
Πηγή: Radio Electronics, Computer Science, Control; No. 1 (2024): Radio Electronics, Computer Science, Control; 140
Радиоэлектроника, информатика, управление; № 1 (2024): Радіоелектроніка, інформатика, управління; 140
Радіоелектроніка, iнформатика, управління; № 1 (2024): Радіоелектроніка, інформатика, управління; 140
Στοιχεία εκδότη: National University "Zaporizhzhia Polytechnic", 2024.
Έτος έκδοσης: 2024
Θεματικοί όροι: machine learning, computer vision, image processing, convolutional neural networks, visual image recognition, visual image classification, algorithms, telecommunication systems, машинне навчання, комп'ютерний зір, обробка зображень, згорткові нейронні мережі, розпізнавання візуальних образів, класифікація візуальних образів, алгоритми, телекомунікаційні системи
Περιγραφή: Context. The paper provides an overview of current methods for recognizing and classifying visual images in static images or video stream. The paper will discuss various approaches, including machine learning, current problems of these methods and possible improvements. The biggest challenges of the visual image retrieval and classification task are discussed. The main emphasis is placed on the review of such promising algorithms as SSD, YOLO, R-CNN, an overview of the principles of these methods, network architectures. Objective. The aim of the work is to analyze existing studies and find the best algorithm for recognizing and classifying visual images for further activities. Method. Primary method is to compare different factors of algorithms in order to select the most perspective one. There are different marks to compare, like image processing speed, accuracy. There are a number of studies and publications that propose methods and algorithms for solving the problem of finding and classifying images in an image [3–6]. It should be noted that most promising approaches are based on machine learning methods. It is worth noting that the proposed methods have drawbacks due to the imperfect implementation of the Faster R-CNN, YOLO, SSD algorithms for working with streaming video. The impact of these drawbacks can be significantly reduced by applying the following solutions: development of combined identification methods, processing of edge cases – tracking the position of identified objects, using the difference between video frames, additional preliminary preparation of input data. Another major area for improvement is the optimization of methods to work with real-time video data, as most current methods focus on images. Results. As an outcome of the current research we have found an optimal algorithm for further researches and optimizations. Conclusions. Analysis of existent papers and researches has demonstrated the most promising algorithm for further optimizations and experiments. Also current approaches still have some space for further. The next step is to take the chosen algorithm and investigate possibilities to enhance it.
Актуальність. У статті представлено огляд сучасних методів розпізнавання та класифікації візуальних образів на статичних зображеннях або у відеопотоці. Будуть розглянуті різні підходи, включаючи машинне навчання, поточні проблеми цих методів та можливі вдосконалення. Обговорюються найбільші проблеми пошуку та класифікації візуальних зображень. Основний акцент зроблено на огляді таких перспективних алгоритмів, як SSD, YOLO, R-CNN, огляді принципів роботи цих методів, мережевих архітектур. Мета. Метою роботи є аналіз існуючих досліджень та пошук найкращого алгоритму розпізнавання та класифікації візуальних зображень для подальшої діяльності. Метод. Основним методом є порівняння різних факторів алгоритмів з метою вибору найбільш перспективного. Існують різні показники для порівняння, такі як швидкість обробки зображень, точність. Існує ряд досліджень та публікацій, в яких пропонуються методи та алгоритми розв’язання задачі пошуку та класифікації образів на зображенні [3–6]. Слід зазначити, що найбільш перспективні підходи базуються на методах машинного навчання. Варто зазначити, що запропоновані методи мають недоліки, пов’язані з недосконалою реалізацією алгоритмів Faster R-CNN, YOLO, SSD для роботи з потоковим відео. Вплив цих недоліків можна суттєво зменшити шляхом застосування наступних рішень: розробка комбінованих методів ідентифікації, обробка крайніх випадків – відстеження положення ідентифікованих об’єктів, використання різниці між відеокадрами, додаткова попередня підготовка вхідних даних. Іншим важливим напрямком вдосконалення є оптимізація методів для роботи з відеоданими в реальному часі, оскільки більшість сучасних методів орієнтовані на зображення. Результати. В результаті проведеного дослідження було знайдено оптимальний алгоритм для подальших досліджень та оптимізацій. Висновки. Аналіз існуючих робіт та досліджень показав найбільш перспективний алгоритм для подальших оптимізацій та експериментів. Також існуючі підходи все ще мають певний простір для розвитку. Наступним кроком є робота над обраним алгоритмом та дослідження можливостей його вдосконалення.
Τύπος εγγράφου: Article
Περιγραφή αρχείου: application/pdf
Γλώσσα: English
ISSN: 1607-3274
2313-688X
Σύνδεσμος πρόσβασης: http://ric.zntu.edu.ua/article/view/300997
Rights: CC BY SA
Αριθμός Καταχώρησης: edsair.scientific.p..4a84b0daada8cb5ade53d45d0717b0c1
Βάση Δεδομένων: OpenAIRE