Academic Journal
In silico the Ames Mutagenicity Predictive Model of Environment
| Title: | In silico the Ames Mutagenicity Predictive Model of Environment |
|---|---|
| Source: | Innovative Biosystems and Bioengineering; Vol. 9 No. 2 (2025): Biosecurity and Biohazard Management in Medicine, Pharmacy and Biotechnology; 42-52 Innovative Biosystems and Bioengineering; Том 9 № 2 (2025): Біозахист і управління біологічними ризиками в медицині, фармації та біотехнології; 42-52 |
| Publisher Information: | Igor Sikorsky Kyiv Polytechnic Institute, 2025. |
| Publication Year: | 2025 |
| Subject Terms: | molecular descriptors, QSAR-модель, мутація, генотоксичність, genotoxicity, QSAR model, молекулярні дескриптори, моделі машинного навчання, mutation, machine learning models |
| Description: | Проблематика. Розроблені та широко використовувані в минулі десятиріччя класичні in vitro та in vivo методи оцінки генетичних ефектів факторів навколишнього середовища є складними з точки зору їх проведення, є дороговартісними, тривалими в часі, мають проблему відтворюваності результатів експерименту в різних лабораторіях і можуть стикатися з етичними проблемами використання в експериментах теплокровних тварин. Мета. Розробка, оптимізація й апробація ефективних in silico моделей оцінки мутагенності Еймса впливу факторів навколишнього середовища Методика реалізації. Генетична оцінка впливу факторів навколишнього середовища була проведена відповідно до набору хімічних сполук, для яких експериментально, за допомогою in vitro тесту Еймса Salmonella/microsome, була отримана інформація про потенційну мутагенну активність. Для розв’язання задачі бінарної класифікації з метою формування двох класів ксенобіотиків (мутаген/не мутаген) було розроблено чотири моделі машинного навчання. Загальну вибірку, що представлена набором із 8083 ксенобіотиків, було розділено на тренувальну та валідаційну у співвідношенні 75 до 25% відповідно. Результати. Точність розроблених моделей машинного навчання була в межах 85%, що відповідає відтворюваності експериментальних даних, отриманих у кількісному, напівкількісному та якісному тестах Еймса в різних лабораторіях. Запропоновано бінарний класифікатор, що за умов зменшення розмірності вхідних даних дає змогу підвищити точність результатів in silico прогнозування мутагенності Еймса. Висновки. Обґрунтовано необхідність оновлення та розширення переліку ефективних і більш продуктивних методів і підходів для оцінки генотоксичних ефектів факторів навколишнього середовища, що дає змогу уникнути застосування в експерименті теплокровних тварин, заощадити час та зменшити кількість хибнонегативних і хибнопозитивних результатів. Показано можливість збільшення точності прогностичних моделей машинного навчання для оцінки генотоксичного потенціалу впливу факторів навколишнього середовища за умов зменшення розмірності набору даних. Background. The classical in vitro and in vivo methods developed and widely used in the past decades to assess the genetic effects of environmental factors are complex in view of their implementation, are expensive, long-lasting, have the problem of reproducibility of the results of experiment in different laboratories and may face ethical problems of using warm-blooded animals in experiments. Objective. Development, optimisation and testing of effective in silico models for assessment of Ames mutagenicity of environmental factors. Methods. The genetic assessment of the impact of environmental factors was carried out in accordance with a set of chemical compounds for which information on potential mutagenic activity was obtained experimentally, using the in vitro Ames Salmonella/microsome test. Four machine learning models were developed to solve the problem of binary classification to form two classes of xenobiotics (mutagen/non-mutagen). The total sample is represented by a set of 8,083 xenobiotics. Results. We developed four machine learning models with 85% accuracy, matching the reproducibility of Ames test data across laboratories. In addition, we have proposed a binary classifier that subject to dimensionality reduction of the input data, taking into account the qualitative composition of molecular descriptors, allows us to improve the accuracy of in silico prediction of genotoxicity of chemicals. Conclusions. The necessity of updating and expanding the list of effective and more productive methods and approaches for assessing the genotoxic effects of environmental factors is substantiated, which allows avoiding the use of warm-blooded animals in the experiment, saving time and reducing the number of false-negative and false-positive results. The possibility of increase the accuracy of predictive machine learning models for assessing the genotoxic potential of environmental factors in conditions of dimensionality reduction of the data set is presented. |
| Document Type: | Article |
| File Description: | application/pdf |
| Language: | English |
| ISSN: | 2616-177X |
| Access URL: | https://ibb.kpi.ua/article/view/316239 |
| Rights: | CC BY |
| Accession Number: | edsair.scientific.p..cdaec5ca48bf8ae0737b12641c8e0802 |
| Database: | OpenAIRE |
| ISSN: | 2616177X |
|---|