Jeg ved ikke meget om at analysere musik-streams til at finde lignende musik, som er en del af, hvorfor jeg meget glad for at læse \ "Content-Based Music Information Retrieval \" (PDF). Det er en stor undersøgelse af de anvendte teknikker, hjælpsomt peger på et par tilgængelige værktøjer, og giver flere eksempler på interessante forskningsprojekter og kommercielle applikationer.
Nogle udvidede uddrag: På nuværende tidspunkt den mest almindelige metode til at få adgang til musik er gennem tekstlige metadata .... [som] kunstner, album ... sportitel ... Stemning ... genre ... [og] stil .... men er ikke i stand til nemt at give deres brugere med søgefunktioner til at finde musik, de ikke allerede kender, eller ikke ved, hvordan man søger efter.
For eksempel ... Shazam ... kan identificere en bestemt optagelse fra en prøve taget på en mobiltelefon i en dans klub eller overfyldt bar ... Nayio ... gør det muligt at synge en forespørgsel og forsøger at identificere arbejde .... [I] Musicream ... ikoner, der repræsenterer stykker flow ene efter den anden ... [og] ved at trække en disk i strømmen, kan brugeren let kan udvælge andre lignende stykker .... MusicRainbow ... [bestemmer] lighed mellem kunstnere ... beregnes fra audio-baserede lighed mellem musik stykker ... [og] de kunstnere derefter sammenfattes med ordet etiketter udvundet af websider med relation til de kunstnere .... Soundbite ... bruger en strukturel opdeling [af musiknumre] at generere thumbnails repræsentant for [anbefalinger] og søg.
En intuitiv udgangspunkt for indhold-baseret musik informationssøgning er at bruge musikalske begreber som melodi eller harmoni til at beskrive indholdet af musik .... Overraskende nok er det ikke kun svært at udtrække melodi fra lyd, men også fra symboler såsom MIDI-filer. Det samme er tilfældet for mange andre højt niveau musik begreber som rytme, klang og harmoni .... [I stedet] lavt niveau audio-funktioner og deres samlede repræsentationer [ofte] anvendes som første etape ... at opnå et højt niveau repræsentation af musik.
Low-level lydfunktionerne [omfatter] frame-baserede segmenteringer (periodisk prøveudtagning på 10ms - 1000ms mellemrum), beat-synkron segmenteringer (funktioner tilpasset musikalske slå grænser), og statistiske måleredskaber at konstruere sandsynlighedsfordelinger ud af funktioner (pose funktioner modeller ).
Estimering af den tidsmæssige struktur i musik, som musikalsk beat, tempo, rytme og måler ... [lader os] finde musikstykker, der har samme tempo uden brug af metadata .... Den grundlæggende tilgang ... er at opdage debut gange og bruge dem som referencer ... [og] have flere hypoteser ... [i] tvetydige situationer.
Melodi udgør kernen i vestlige musik og er en stærk indikator for identiteten af et musikstykke ... Skønnet melodi ... [giver] hentning baseret på lignende sangstemme timbres ... klassifikation baseret på melodiske ligheder ... og forespørgsel ved nynnende .... Melodien og bas-linier er repræsenteret som en kontinuerlig tidsmæssig-bane repræsentation af grundlæggende frekvens (F0, opfattet som pitch) eller en serie af noder .... [for] det mest fremherskende harmonisk struktur ... inden for en bevidst begrænset frekvensområde.
Audio fingeraftryk systemer ... søge at identificere specifikke optagelser i nye sammenhænge ... til [eksempelvis] normalisere store musik-databaser, så et utal af versioner af den samme optagelse, ikke er medtaget i en brugers søgning og relatere bruger anbefaling af data til alle versioner af en kildeoptagelsen herunder radio edits, instrumentale, remixes, og udvides mix versioner ... [Et andet eksempel] er Apokryfe skrifter ... [hvor] værker er falsk tilskrevet en kunstner ... [eventuelt af en modstander efter] en vis grad af signal transformation og forvrængning ... Audio shingling ... [i] features ... [i] sekvenser på 1 til 30 sekunder varighed ... [hjælp] LSH [ofte] beskæftiget i den virkelige verden systems.The papiret går i mange detaljerede oplysninger om disse emner såvel som dækker andre områder såsom akkord og vigtige anerkendelse, kor afsløring, tilpasning melodi og tekster (for Karaoke), omtrentlige string matching teknikker til symbolsk musik data (f.eks matchende støjende melodi score), og problemer som polyfonisk musik eller skalering til massive musik databaser. Der er også en dejlig pointer til offentligt tilgængelige værktøjer til at lege med disse teknikker, hvis du er så lyst.
Af den måde, at gøre til et kig på et alternativ til den slags automatiserede analyser af musik, ikke glip af denne sidste søndag i New York Times Magazine afsnittet artiklen, \ "The Song Dekodere \", der beskriver Pandoras indsats for manuelt at tilføje fin - grained stemning, genre og stil kategorier til sange og artikler, og derefter bruge dem til at finde lignende musik.
Abonner på:
Kommentarer til indlægget (Atom)
Ingen kommentarer:
Send en kommentar