
یادگیری دوگان، تلاشي با هدف بهبود نتایج و كاهش نياز به مجموعه داده های بزرگ برچسب دار از طریق آموزش همزمان دو مدل دوگان است. همواره در یادگيری دوگان به دو مسئله به طور همزمان پرداخته مي شود كه به یکي از آنها وظيفه اصلی و به دیگری وظیفه دوگان می گویند. به این ترتيب خروجي مدل وظيف اصلي ورودی مدل وظيفه دوگان خواهد بود و برعکس. در حالت تعميم یافته آن كه یادگيری حلقه بسته نام دارد، چندین وظيفه به دنبال هم در یک مسير بسته قرار مي گيرند به طوری كه خروجي هر مدل ورودی مدل بعدی باشد. ایده یادگيری دوگان نخستين بار توسط تيم تحقيقاتي مایکروسافت در سال ۲۰۱۶ در آموزش مترجم ماشيني عصبي به كار گرفته شد و هدف از آن، آموزش دو مترجم به صورت همزمان بود به گونه ای كه دو مدل به صورت همکار باهم تعامل داشته و سبب بهبود یکدیگر شوند. درواقع، دو مترجم ماشيني، یکي از زبان انگليسي به فرانسوی و دیگری از زبان فرانسوی به انگليسي، در تعامل با یکدیگر با استفاده از روش های گرادیان سياست در یادگيری تقویتي آموزش داده شدند. به این صورت كه جمله ای از زبان انگليسي، ابتدا با استفاده از مدل اول به زبان فرانسوی ترجمه شده، سپس جمله حاصل با استفاده از مدل دوم به زبان انگليسي باز گردد و انتظار مي رود این دو جمله انگليسي مشابه یکدیگر باشند.
یادگیری دوگان در سطح داده
در یادگيری دوگان در سطح داده، همبستگي موجود ميان وظایف اصلي و دوگان از طریق مجموعه داده استخراج مي گردد. به طوركلي، این آموزش مي تواند از طریق افزودن یک عبارت منظم ساز یا با استفاده از روش گرادیان سياست صورت پذیرد. از عبارت منظم ساز به منظور اعمال یک قيد احتمالاتي برای نزدیک نمودن توزیع مدلها به توزیع واقعي استفاده مي شود. همچنين مي توان این دو مدل را در نقش دو عامل در یک بازی همکارانه قرار داده كه با ارسال بازخوردهای موثر به یکدیگر سبب بهبود نتایج یکدیگر گردند. در این حالت، یادگيری با استفاده از روش های گرادیان سياست انجام مي شود. از همبستگي دوگان در سطح داده به روش های مختلفي ازجمله یادگيری بدون نظارت، یادگيری بانظارت، یادگيری نيمه نظارتي، یادگيری انتقالي و یادگيری تخاصمي مي توان بهره گيری نمود.