Research and comparative analysis of the effectiveness of software and hardware implementations of transposed matrix multiplication

Bibliographic Details
Title: Research and comparative analysis of the effectiveness of software and hardware implementations of transposed matrix multiplication
Authors: Antonov, Alexander, Besedin, Denis, Filippov, Alexey
Publisher Information: Computing, Telecommunication and Control, 2024.
Publication Year: 2024
Subject Terms: parallel computing, hardware costs, pipelining, производительность, аппаратная реализация, затраты на оборудование, hardware implementation, параллельные вычисления, конвейерная обработка, performance, FPGA, ПЛИС
Description: Статья посвящена исследованию и сравнительному анализу программной и аппаратной реализации операции транспонированного матричного умножения и ее модифицированной версии – операции транспонирования матричного умножения. Особенностью данного исследования является использование высокоуровневых средств синтеза для получения и оптимизации аппаратных реализаций указанных операций. Актуальность данного исследования обусловлена широким использованием матричных операций, таких как транспонирование и умножение, для решения различных прикладных задач, степенной асимптотической сложностью матричных вычислений и отсутствием данных об эффективности использования высокоуровневых средств синтеза в задачах создания аппаратных устройств для матричных вычислений. Предложен пошаговый метод синтеза и оптимизации аппаратной реализации указанных операций. Проведено сравнительное исследование программной и аппаратной реализаций двух указанных операций. Показано, что выигрыш в производительности аппаратных реализаций достигается за счет увеличения степени параллелизма матричных вычислений. Дополнительно были проведены исследования требуемых ресурсов при повышении производительности за счет распараллеливания.
The article is devoted to the study and comparative analysis of the software and hardware implementation of the transposed matrix multiplication operation and its modified version, the matrix multiplication transpose. A feature of this study is the use of high-level synthesis tools to obtain and optimize hardware implementations of these operations. The relevance of this study is due to the widespread use of matrix operations, such as transposition and multiplication, to solve various applied problems, the power-law asymptotic complexity of matrix calculations and the lack of data on the effectiveness of using high-level synthesis tools in the tasks of creating hardware devices for matrix calculations. A step-by-step method for synthesizing and optimizing the hardware implementation of these operations is proposed. A comparative study of the software and hardware implementations of these two operations was carried out. It is shown that the gain in performance of hardware implementations is achieved by increasing the degree of parallelism of matrix calculations. Additionally, studies were conducted on the required resources while increasing productivity through parallelization.
Document Type: Other literature type
Language: English
DOI: 10.18721/jcstcs.17104
Accession Number: edsair.doi...........2eea951eca92472ea008bfd0001081a8
Database: OpenAIRE
Description
DOI:10.18721/jcstcs.17104