新浪科技讯 12月25日上昼音书,日前,设想机外洋声学、语音与信号处答理议ICASSP 2025公布论文寄托名单,由巨东说念主收集AI践诺室与浙江大学相助的语音探讨后果入选ICASSP 2025。该后果建议了一种精确莳植音频讲话模子性能的篡改表率,在践诺限度中达到该畛域最优效果。
据悉,外洋声学、语音与信号处答理议 (International Conference on Acoustics, Speech and Signal Processing, 简称ICASSP) 是全天下最大、最全面的信号惩办额外专揽方面的顶级会议。行为外洋电子技艺与信息科学工程师协会 (Institute of Electrical and Electronics Engineers,简称IEEE) 的进军会议之一,在外洋上享有殊荣并具有等闲的学术影响力。
巨东说念主收集AI践诺室与浙江大学探讨团队在相助论文《Multiple Consistency-guided Test-Time Adaptation for Contrastive Audio-Language Models with Unlabeled Audio》中,建议了一种无需标注标签的多重指点提醒学习表率,莳植了音频分类零样本学习上的效果,为后续在视频配音(Video-to-Audio,V2A)任务上提供精确提拔。
阐明践诺限度,与来源进的模子比较,该表率平均准确率相对莳植了4.41%,在12个任务的跨畛域测试中,平均准确率也相对莳植了5.33%,岂论是针对域内数据的效果依然跨域的踏实性,王人达到了该畛域的SOTA(State-of-the-Art,最优的)效果。(罗宁)
背负裁剪:尉旖涵 世博体育app下载