Academic Journal
MACHINE LEARNING IN SPECTROSCOPIC ANALYSIS OF SALIVA: EVALUATION OF THE EFFECTIVENESS OF CLUSTERING AND DEEP NEURAL NETWORKS FOR THE DETECTION OF ORAL CANCER
| Title: | MACHINE LEARNING IN SPECTROSCOPIC ANALYSIS OF SALIVA: EVALUATION OF THE EFFECTIVENESS OF CLUSTERING AND DEEP NEURAL NETWORKS FOR THE DETECTION OF ORAL CANCER |
|---|---|
| Source: | Clinical and experimental pathology; Vol. 24 No. 1 (2025) Клиническая и экспериментальная патология; Том 24 № 1 (2025) Клінічна та експериментальна патологія; Том 24 № 1 (2025) |
| Publisher Information: | Буковинський державний медичний університет, 2025. |
| Publication Year: | 2025 |
| Subject Terms: | saliva, кластеризація, screening, Раманспектроскопія, biomarkers, рак ротової порожнини, машинне навчання, oral cancer, згорткові нейронні мережі, Raman-spectroscopy, machine learning, clastering, слина, convolutional neural networks, скринінг, біомаркери |
| Description: | Oral cancer (OC) remains a serious oncological problem, as late detection significantly reduces patient survival. Raman spectroscopy is a promising method for non-invasive screening; however, its effectiveness depends on the chosen analytical approach. Unsupervised clustering methods often fail to identify clear groups in spectral data, limiting their applicability. In contrast, convolutional neural networks (CNNs) can detect hidden patterns in spectral data. Objective – to evaluate the effectiveness of clustering methods and CNNs in the saliva spectroscopic analysis for OC screening and determine the optimal approach for spectral classification. Materials and Methods. Spectral data from four patient groups were analyzed: healthy individuals, patients with precancerous conditions (leukoplakia, lichen planus), and patients with oral cancer. Various clustering methods (PCA, t- SNE, K-Means, DBSCAN, GMM, autoencoder + K-Means) and CNNs were applied. Results. Clustering methods failed to form distinct groups, as indicated by low ARI (0.02-0.05) and silhouette coefficient (~0.1). CNNs achieved an accuracy of 84.6% and an AUC of 0.86 when using the full spectral range. Conclusions. Unsupervised clustering methods proved ineffective due to the high overlap of spectra from different groups. In contrast, CNNs demonstrated high classification accuracy, making them a promising tool for automated OC screening. Рак ротової порожнини (РРП) є серйозною онкологічною проблемою, оскільки його пізнє виявлення значно знижує виживаність пацієнтів. Раман-спектроскопія є перспективним методом неінвазивного скринінгу, проте ефективність її обробки залежить від вибору аналітичного підходу. Неконтрольовані методи кластеризації часто не виявляють чітких груп у спектрах, що обмежує їхню застосовність. Натомість згорткові нейронні мережі (CNN) можуть виявляти приховані патерни у спектральних даних. Мета – оцінити ефективнсть кластеризації та згорткових нейронних мереж у спектроскопічному аналізі слини для скринінгу раку ротової порожнини та визначити оптимальний підхід до класифікації спектрів. Матеріали та методи. Досліджено спектральні дані слини осіб чотирьох груп: здорових, пацієнтів із передраковими станами (лейкоплакія, ліхен-планус) та хворих на рак. Використано методи кластеризації (PCA, t- SNE, K-Means, DBSCAN, GMM, автоенкодер + K-Means) та CNN. Результати. Кластеризація не виявила чітких груп, що підтверджено низькими значеннями ARI (0,02-0,05) та коефіцієнта силуету (~0,1). CNN досягла точності 84,6% та AUC 0,86 при використанні всього спектрального діапазону. Висновки. Неконтрольовані методи є неефективними через високе перекриття спектрів різних груп. Натомість CNN забезпечує високу точність класифікації, що робить її перспективним інструментом для автоматизованого скринінгу РРП. |
| Document Type: | Article |
| File Description: | application/pdf |
| Language: | Ukrainian |
| ISSN: | 1727-4338 2521-1153 |
| Access URL: | http://cep.bsmu.edu.ua/article/view/330535 |
| Rights: | CC BY NC SA |
| Accession Number: | edsair.scientific.p..c3849dc193aa542d27a2743bce83b18c |
| Database: | OpenAIRE |
| ISSN: | 17274338 25211153 |
|---|