Academic Journal
Спектрально-аналитический метод распознавания неточных повторов в символьных последовательностях
| Τίτλος: | Спектрально-аналитический метод распознавания неточных повторов в символьных последовательностях |
|---|---|
| Πηγή: | Труды Института системного программирования РАН. |
| Στοιχεία εκδότη: | Федеральное государственное бюджетное учреждение науки Институт системного программирования Российской академии наук, 2015. |
| Έτος έκδοσης: | 2015 |
| Θεματικοί όροι: | 0301 basic medicine, 03 medical and health sciences, СПЕКТРАЛЬНО-АНАЛИТИЧЕСКИЙ МЕТОД,РЯДЫ ФУРЬЕ,ОРТОГОНАЛЬНЫЕ МНОГОЧЛЕНЫ,РЕКУРРЕНТНЫЕ СООТНОШЕНИЯ,OPENMP,CILK PLUS,SPECTRAL-ANALYTICAL METHOD,FOURIER SERIES,ORTHOGONAL POLYNOMIALS,RECURRENCE RELATIONS, 0101 mathematics, 01 natural sciences |
| Περιγραφή: | Proposed are theoretical basis and algorithmic implementation of spectral-analytical method of recognition of repeats in character sequences. The theoretical justification is based on the theorem on equivalent representation of the character sequence by the vector of continuous characteristic functions. Comparison of fragments of characteristic functions is performed in the standard metric in Euclidean space of expansion coefficients of the Fourier series of orthogonal polynomials. An essential feature of this approach is the ability to evaluate repeats at different scales. Another important feature is the possibility of efficient parallelization of data. In the development of algorithms we preferred scheme of computing with a minimal amount of references to memory, implying repetitive calculations and evaluations on demand. In this paradigm, proposed is an algorithm for calculating the coefficients of expansions in the orthogonal polynomials through the use of recurrence relations. It is shown that the algorithm for calculating the coefficients of expansions in the orthogonal polynomials can be effectively vectorized by computing with a fixed vector length. Parallelization and vectorization implemented using the OpenMP standard and extension Cilk Plus of language C/C++. The developed method effectively scales, depending on the parameters of the problem and the number of processor cores on systems with shared memory. Предложены теоретическое обоснование и алгоритмическая реализация спектрально-аналитического метода распознавания повторов в символьных последовательностях. Теоретическое обоснование основывается на теореме об эквивалентном представлении символьной последовательности вектором непрерывных характеристических функций. Сравнение фрагментов характеристических функций производится в стандартной метрике в евклидовом пространстве коэффициентов разложения рядов Фурье по ортогональным многочленам. Существенным свойством данного подхода является способность оценивать повторы на разных масштабах. Другим важным свойством является возможность эффективного распараллеливания по данным. При разработке алгоритмов предпочиталась схема вычислений с минимальным количеством обращений к оперативной памяти, подразумевающая повторяющиеся и отложенные вычисления. В данной парадигме разработан алгоритм вычисления коэффициентов разложения по ортогональным многочленам за счет использования рекуррентных соотношений. Показано, что алгоритм вычисления коэффициентов разложения по ортогональным многочленам может быть эффективно векторизован за счет вычислений с фиксированной длиной вектора. Распараллеливание и векторизация реализованы с использованием стандарта OpenMP и расширения Cilk Plus языка C/C++. Разработанный метод эффективно масштабируется в зависимости от параметров задачи и числа ядер процессора на системах с общей памятью. |
| Τύπος εγγράφου: | Article |
| Περιγραφή αρχείου: | text/html |
| Γλώσσα: | Russian |
| ISSN: | 2220-6426 2079-8156 |
| Σύνδεσμος πρόσβασης: | http://cyberleninka.ru/article/n/spektralno-analiticheskiy-metod-raspoznavaniya-netochnyh-povtorov-v-simvolnyh-posledovatelnostyah http://cyberleninka.ru/article_covers/16425741.png |
| Αριθμός Καταχώρησης: | edsair.od......2806..1d43569889569e244ab44b76cb646a3b |
| Βάση Δεδομένων: | OpenAIRE |
| ISSN: | 22206426 20798156 |
|---|