Number of the records: 1  

Time-domain Blind Audio Source Separation Using Advanced Component Clustering and Reconstruction

  1. 1.
    0307438 - ÚTIA 2010 RIV IT eng C - Conference Paper (international conference)
    Koldovský, Zbyněk - Tichavský, Petr
    Time-domain Blind Audio Source Separation Using Advanced Component Clustering and Reconstruction.
    [Slepá separace audio signálů za použití pokročilého klastrování komponent a zpětné rekonstrukce.]
    2008 Hands-free Speech Communication and Microphone Arrays. Trento: IEEE, 2008, s. 216-219. ISBN 978-1-4244-2337-8; ISBN 978-1-4244-2338-5.
    [Hands-free Speech Communication and Microphone Arrays 2008. Trento (IT), 06.05.2008-08.05.2008]
    R&D Projects: GA MŠMT 1M0572
    Grant - others:GA ČR(CZ) GP102/07/P384
    Program: GP
    Institutional research plan: CEZ:AV0Z10750506
    Keywords : blind source separation * audio signals
    Subject RIV: BI - Acoustics

    We present a novel time-domain method for blind separation of convolutive mixture of audio sources (the cocktail party problem). The method allows efficient separation with good signal-to-interference ratio (SIR) and signal-to-distortion ratio (SDR) using short data segments only. In practice, we are able to separate 2-4 speakers from audio recording of the length less than 6000 samples, which is less than 1-s in the 8-kHz sampling. The average time needed to process the data with filter of the length 20 was 2.2 seconds in Matlab v.-7.2 on an ordinary PC with 3GHz processor.

    V práci je prezentována nová metoda slepé separace konvolutorních směsí audio signálů, pracující v časové oblasti. Metoda umožňuje efektivní separaci (měřeno pomocí poměru signálu vůči šumu a signálu vůči zkreslení) za použití pouze krátkých úseků dat. V praxi umožňuje separovat promluvy dvou až čtyř současně hovořících řečníků z audionahrávek získaných stejným počtem mikrofonů o délce 6000 vzorků, což při vzorkovací frekvenci 8kHz představuje méně než 1s. Výpočetní čas pro inverzní filtr délky 20 je 2.2s v Matlabu na běžném PC s 3GHz procesorem.
    Permanent Link: http://hdl.handle.net/11104/0004593

     
     
Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.