
اگرچه امروزه استفاده از سامانه های رایانه ای، جستجو و بازیابی اطلاعات را تسهیل کرده است؛ ولی جستجو و بازیابی، تاکنون به طور عمده در محتواهای متنی انجام می پذیرفته است؛ در حالیکه نیاز به استخراج اطلاعات از محتواهای غیرمتنی مانند صدا نیز احساس می شود، هر چند این نیاز تا حدی با تولید فراداده برای محتواهای صوتی رفع می شود، ولی تولید فراداده کاری زمان بر و پرهزینه است. بنابراین به دنبال روش یا روش هایی هستیم که بدون نیاز به فراداده و تنها با استفاده از محتوای خود صدا و مشخصات آکوستیکی آن، جستجو و بازیابی اطلاعات را در آن انجام دهد. به این روش ها، بازیابی مبتنی بر محتوا گفته می شود که بازیابی صدا یکی از این موارد محسوب می شود. مسئله بازیابی صدا را می توان به صورت زیر تعریف کرد: یک مجموعه از مستندات صوتی در اختیار داریم؛ می خواهیم از بین این مجموعه مستندات، سند یا سندهایی را پیدا کنیم که درجه شباهت و یا میزان ارتباط و نزدیکی آن با یک نمونه صدای مورد نظر ( و یا توصیفی از آن صدا) بیشتر باشد. نمونه صدا (یا توصیفی از آن) را که به دنبال سندهای مرتبط با آن در مجموعه هستیم، در اصطلاح پرس و جو نامیده می شود. با این تعریف، یک سامانه بازیابی صدا به طور کلی به این صورت عمل می کند که کاربر درخواست خود را به صورت پرس و جو به سامانه می دهد. سامانه بازیابی صدا با روش های خاص خود میزان شباهت و یا میزان ارتباط و نزدیکی پرس و جوی داده شده را، با تک تک سندهای صوتی موجود در بایگانی می سنجد و سپس فهرستی از شبیه ترین و یا مرتبط ترین سندها به پرس و جوی داده شده را به ترتیب رتبه، به کاربر بر می گرداند.