本發(fā)明涉及基于聚焦損失函數(shù)的指導(dǎo)型聲學(xué)事件檢測模型訓(xùn)練方法,該方法包括:從音頻數(shù)據(jù)訓(xùn)練集中提取聲學(xué)特征;搭建指導(dǎo)型聲學(xué)事件檢測模型并根據(jù)所述聲學(xué)特征解決聲學(xué)事件檢測任務(wù)和聲學(xué)事件分類任務(wù);指導(dǎo)型聲學(xué)事件檢測模型包括:復(fù)雜教師模型、輕量化學(xué)生模型和分類器部分;兩階段訓(xùn)練方式訓(xùn)練指導(dǎo)型聲學(xué)事件檢測模型。本申請實(shí)施例指導(dǎo)型聲學(xué)事件檢測模型能充分學(xué)習(xí)不同數(shù)據(jù)類型中所包含的特征信息,同時將復(fù)雜教師模型學(xué)習(xí)的特征信息蒸餾到輕量化學(xué)生模型中,減少了參數(shù)量,加快了模型收斂速度,在不同訓(xùn)練階段有針對性學(xué)習(xí)簡單樣本與困難樣本,改善了指導(dǎo)型聲學(xué)事件檢測模型對復(fù)雜類別事件的檢測性能,提高了聲學(xué)事件檢測的魯棒性。
聲明:
“基于聚焦損失函數(shù)的指導(dǎo)型聲學(xué)事件檢測模型訓(xùn)練方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)