Hét vraag- en antwoordplatform van Nederland

Hoe werken muziek herkennings programma's?

Ik vraag hier naar hoe shazam en soundhound werken, we hebben deze discussie vaak maar komen er maar niet op hoe het precies in elkaar steekt!
Zou iemand ons willen helpen?:)
Groetjes

Verwijderde gebruiker
13 jaar geleden
in: Audio

Heb je meer informatie nodig om de vraag te beantwoorden? Reageer dan hier.

Geef jouw antwoord

Het is niet mogelijk om je eigen vraag te beantwoorden Je mag slechts 1 keer antwoord geven op een vraag Je hebt vandaag al antwoorden gegeven. Morgen mag je opnieuw maximaal antwoorden geven.

/
Geef Antwoord
+
Selected image

Antwoorden (2)

Ik denk dat het word herkend dmv elektrische signalen.

In een microfoon zit namelijk een magneet en een spoel. Die spoel gaat bewegen als er geluidsgolven voorbij komen. Als een spoel langs een magneet gaat ontstaat er door de magnetische flux een magnetische inductie. Door deze inductie ontstaan elektrische signalen die dan eventueel later weer door speakers worden omgezet naar geluidsgolven.

Soundhound en shazam en dat programma van sony ericsson onderscheppen denk ik deze elektrische signalen en vergelijken die signalen met elk bekend liedje in hun database. Als er een liedje overeen komt heeft hij het liedje kunnen vinden!
(Lees meer...)
Verwijderde gebruiker
13 jaar geleden
Men gebruikt software die op basis van het spectrogram van de muziek karakteristieken uit de muziek haalt, waarmee een 'fingerprint' wordt gemaakt die vervolgens met een database van 'fingerprints' wordt vergeleken. Van elk nummer wordt een serie 'fingerprints' gemaakt zodat het programma maar een klein deel van het nummer hoeft te analyseren om het nummer te kunnen vinden.

Het woord 'fingerprints' klinkt gemakkelijk maar in feite gaat het om hashes. Een hash is een (doorgaans erg groot) getal dat wordt berekend op basis van de input. Die input kan van alles zijn, zoals een heel bestand, een stuk tekst, of, zoals hier, een combinatie van eigenschappen. Essentieel is dat dezelfde combinatie van eigenschappen steeds dezelfde hash oplevert. De methode is dus zo ontworpen dat de eigenschappen die uit het geluid worden geëxtraheerd ongevoelig zijn voor achtergrondruis en zelfs voor stemmen van mensen door het geluid heen. Tegelijk moeten de gevonden eigenschappen uniek zijn voor het betreffende nummer. Hierin school feitelijk de uitdaging van de ontwerpers, waarbij snelheid en efficiëntie tevens een belangrijke rol speelden.

Het is een knap stukje werk. De link verwijst naar een Engelstalig artikel van de ontwerpers.
(Lees meer...)
Verwijderde gebruiker
13 jaar geleden
Deel jouw antwoord

Het is niet mogelijk om je eigen vraag te beantwoorden Je mag slechts 1 keer antwoord geven op een vraag Je hebt vandaag al antwoorden gegeven. Morgen mag je opnieuw maximaal antwoorden geven.

/
Geef Antwoord
+
Selected image

Bekijk alle vragen in deze categorieën: