Conference
Integrating smooth motion assumptions with RANSAC-based sound source localization
| Title: | Integrating smooth motion assumptions with RANSAC-based sound source localization Integration av antagande om mjuk rörelse i RANSAC-baserad lokalisering av ljudkälla |
|---|---|
| Authors: | Gulin, Jens, Åström, Kalle, Aminifar, Amir |
| Contributors: | Lund University, Faculty of Engineering, LTH, Departments at LTH, Department of Electrical and Information Technology, Integrated Electronic Systems, Lunds universitet, Lunds Tekniska Högskola, Institutioner vid LTH, Institutionen för elektro- och informationsteknik, Integrerade elektroniksystem, Originator, Lund University, Faculty of Science, Centre for Mathematical Sciences, Mathematics (Faculty of Engineering), Computer Vision and Machine Learning, Lunds universitet, Naturvetenskapliga fakulteten, Matematikcentrum, Matematik LTH, Datorseende och maskininlärning, Originator, Lund University, Faculty of Engineering, LTH, LTH Profile areas, LTH Profile Area: AI and Digitalization, Lunds universitet, Lunds Tekniska Högskola, LTH profilområden, LTH profilområde: AI och digitalisering, Originator, Lund University, Faculty of Medicine, Department of Clinical Sciences, Lund, Section V, Diagnostic Radiology, (Lund), Stroke Imaging Research group, Lunds universitet, Medicinska fakulteten, Institutionen för kliniska vetenskaper, Lund, Sektion V, Diagnostisk radiologi, Lund, Stroke Imaging Research group, Originator, Lund University, Profile areas and other strong research environments, Strategic research areas (SRA), ELLIIT: the Linköping-Lund initiative on IT and mobile communication, Lunds universitet, Profilområden och andra starka forskningsmiljöer, Strategiska forskningsområden (SFO), ELLIIT: the Linköping-Lund initiative on IT and mobile communication, Originator, Lund University, Profile areas and other strong research environments, Strategic research areas (SRA), eSSENCE: The e-Science Collaboration, Lunds universitet, Profilområden och andra starka forskningsmiljöer, Strategiska forskningsområden (SFO), eSSENCE: The e-Science Collaboration, Originator, Lund University, Faculty of Science, Centre for Mathematical Sciences, Research groups at the Centre for Mathematical Sciences, Mathematical Imaging Group, Lunds universitet, Naturvetenskapliga fakulteten, Matematikcentrum, Forskargrupper vid Matematikcentrum, Mathematical Imaging Group, Originator, Lund University, Faculty of Engineering, LTH, Competence centers, LTH, NEXTG2COM – a Vinnova Competence Centre in Advanced Digitalisation, Lunds universitet, Lunds Tekniska Högskola, Kompetenscentrum, LTH, NEXTG2COM – ett Vinnova kompetenscenter inom Avancerad Digitalisering, Originator, Lund University, Faculty of Engineering, LTH, Departments at LTH, Department of Electrical and Information Technology, Secure and Networked Systems, Lunds universitet, Lunds Tekniska Högskola, Institutioner vid LTH, Institutionen för elektro- och informationsteknik, Säkerhets- och nätverkssystem, Originator |
| Source: | 33rd European Signal Processing Conference 33rd European Signal Processing Conference (EUSIPCO 2025). |
| Subject Terms: | Engineering and Technology, Electrical Engineering, Electronic Engineering, Information Engineering, Signal Processing, Teknik, Elektroteknik och elektronik, Signalbehandling, Natural Sciences, Computer and Information Sciences, Computer graphics and computer vision, Naturvetenskap, Data- och informationsvetenskap (Datateknik), Datorgrafik och datorseende |
| Description: | Att vid ett tillfälle avgöra positionen för en ensam ljudkälla, i en omgivning med mikrofoner utspridda på kända positioner, kan göras med multilaterering, genom uppskattade ankomsttidskillnader (TDOA, time-difference-of-arrival). TDOA uppskattad med korskorrelation är emellertid brusig i verkliga miljöer, och metoder för robust multilaterering måste kunna hantera avvikande värden. Att som begränsning anta en mjuk rörelse över tid kan förbättra den uppskattade positionen för både stillastående och rörliga ljudkällor. I detta arbete utforskas hur antagandet om mjuk rörelse kan tas med i olika steg av en RANSAC-baserad (Random Sample Consensus) implementation. Utvärderingen görs på riktiga inspelningar från det publika LuViRA datasetet, det första publicerade 3D resultatet för datat. Vardera av de föreslagna stegen visas förbättra lokaliseringsfelet i jämförelse mot grundmetoden. The momentary localization of a single sound source, in an environment with microphones distributed at known positions, can be done with multilateration, using time-difference-of-arrival (TDOA) estimates. However, TDOA estimates from cross-correlation are noisy in real environments, and a robust multilateration method must handle outliers. Assuming constraints on the smoothness of movement over time, the location estimate can be improved for both stationary and moving sources. In this work, the smooth motion assumption is explored in different stages of a RANSAC-based (Random Sample Consensus) implementation. The evaluation is done on real recordings from the public LuViRA dataset, giving the first 3D baseline result on the dataset. Each of the proposed steps is shown to reduce the localization error compared to the benchmark method. |
| Access URL: | https://eusipco2025.org/wp-content/uploads/pdfs/0000226.pdf |
| Database: | SwePub |
| Description not available. |