Academic Journal

Применение методов обработки естественного языка в области языковых моделей белков: текущие и будущие тенденции

Λεπτομέρειες βιβλιογραφικής εγγραφής
Τίτλος: Применение методов обработки естественного языка в области языковых моделей белков: текущие и будущие тенденции
Στοιχεία εκδότη: ООО Цифра, 2025.
Έτος έκδοσης: 2025
Θεματικοί όροι: PUBMED collection, коллекция PUBMED, библиометрический анализ, visual analytics, protein language models, долгосрочный прогноз трендов, trending topics, обработка естественного языка, bibliometric analysis, трендовые темы, long-term trend forecasting, natural language processing, языковые модели белков, визуальная аналитика
Περιγραφή: В работе представлен прогнозный библиометрический анализ трендовых тем в коллекции PubMed в области языковых моделей белков. Анализ выполнен с использованием коллекции научных статей PubMed, из которой были отобраны 187 статей, имеющие в заголовках слова «protein» (белок) и «language» (язык). Выявлен значительный рост (в 54 раза за 6 лет) ежегодно публикуемых подобных статей. Рассчитан и представлен рейтинг релевантных ключевых слов в отобранных статьях. Среди релевантных ключевых слов выявлены трендовые ключевые слова прогнозируемым долгосрочным ростом трендов. Представлена семантическая карта трендовых ключевых слов, содержащая информацию о новизне и долгосрочности трендов. В результате визуального анализа семантической карты выявлены четыре трендовые темы: 1) обработка естественного языка (natural language processing); 2) базы данных и языковые модели белков (databases and protein language models); 3) глубокое обучение (deep learning); 4) белковая инженерия (protein engineering). Дано сравнение выявленных трендов с опубликованными в научной литературе.
The work presents a predictive bibliometric analysis of trending topics in the PubMed collection in the field of linguistic models of proteins. The analysis was performed using the PubMed collection of scientific articles, from which 187 articles with the words "protein" and "language" in their titles were selected. A significant increase (54-fold over 6 years) in the number of such articles published annually was found. The ranking of relevant keywords in the selected articles was calculated and presented. Among the relevant keywords, trending keywords with predicted long-term trend growth are identified. A semantic map of trending keywords containing information about the novelty and long-term trend growth is presented. As a result of visual analysis of the semantic map, four trending topics are identified:1) natural language processing;2) databases and protein language models;3) deep learning;4) protein engineering. The detected trends are compared with those published in the scientific literature.
Cifra. Компьютерные науки и информатика, Выпуск 1 (5) 2025
Τύπος εγγράφου: Article
Γλώσσα: Russian
DOI: 10.60797/comp.2025.5.1
Rights: CC BY
Αριθμός Καταχώρησης: edsair.doi...........7389d00b3c171158aba78bff53f82d4c
Βάση Δεδομένων: OpenAIRE