Artykuł  

Pre-trained Deep Neural Network using Sparse Autoencoders and Scattering Wavelet Transform for musical genre recognition

Link do zdalnego zasobu
Dostęp z terminali w BG AGH
Data publikacji
2015
Data publikacji (copyright)
Data prezentacji
Data obrony
Data nadania stopnia
Autorzy (rel.)
Kleć, Mariusz
Koržinek, Danijel
Nr albumu:
Prawa dostępu
Dostęp: otwarty dostęp
Uwagi:
Prawa: CC BY 4.0
Attribution 4.0 International
Uznanie autorstwa 4.0 Międzynarodowe (CC BY 4.0)

Inny tytuł
Typ zasobu:
artykuł
Wersja
wersja wydawnicza
Sygnatura:
Nr normy / patentu
Numer czasopisma (rel.)
Numer czasopisma
Computer Science
2015 - Vol. 16 - No. 2
Szczegóły wydania / pracy
Uczelnia:
Opublikowane w: Computer Science. -:. Vol. 16 No. 2, pp. 133-144
Opis fizyczny:Skala:Zasięg:
ISBN:e-ISBN:
Seria:ISSN: 1508-2806e-ISSN: 2300-7036
Jednostka AGH:
Kierunek:
Forma studiów:
Stopień studiów:
Uzyskany tytuł:
Instytucja sprawcza:
Redaktorzy (rel.)
Promotorzy (rel.)
Recenzenci (rel.)
Projekty badawcze (rel.)
Projekt
Tytuł:
ID:Program:
Instytucja Finansująca
ROR: 
Dane badawcze:
Jednostki organizacyjne (rel.)
Wydarzenia (rel.)
Dyscyplina
Słowa kluczowe
Sparse Autoencoders, deep learning, genre recognition, Scattering Wavelet Transform
Dyscyplina (2011-2018)
Specjalność
Klasyfikacja MKP
Abstrakt

Research described in this paper tries to combine the approach of Deep Neural Networks (DNN) with the novel audio features extracted using the Scattering Wavelet Transform (SWT) for classifying musical genres. The SWT uses a sequence of Wavelet Transforms to compute the modulation spectrum coefficients of multiple orders, which has already shown to be promising for this task. The DNN in this work uses pre-trained layers using Sparse Autoencoders (SAE). Data obtained from the Creative Commons website jamendo.com is used to boost the well-known GTZAN database, which is a standard benchmark for this task. The final classifier is tested using a 10-fold cross validation to achieve results similar to other state-of-the-art approaches.

Opis
Zawartość