رفتن به محتوای اصلی
امروز: ۰۷:۳۰:۳۹ ۲۰۲۵/۰۲/۰۵     ورود
EN - FA

برای تبلیفات در سایت

 

 

 

 

 

 

 

 

 

برای تبلیفات در سایت

 

 

 

 

 

 

 

 

برای تبلیفات در سایت

kholasehsazi

با توجه به رشد روز افزون اطلاعات در عصر اینترنت نیاز به یک ابزار دقیق و کارآمد جهت استخراج اطلاعات مهم و مرتبط احساس می گردد. این مساله با مکانیزم خلاصه سازی خودکار متن حل می گردد. خلاصه سازی می تواند به دو صورت خلاصه سازی استخراجی و  خلاصه سازی چکیده  انجام شود. در روش اول یعنی خلاصه سازی استخراجی جملات مهم به همان صورتی که در متن اصلی بیان شدند، شناسایی و لفظ به لفظ در متن خلاصه کپی می شوند. در روش خلاصه سازی چکیده، جملات متن خلاصه برگرفته از متن اولیه هستند. به عبارت دیگر جملات خلاصه عینا در متن اصلی وجود ندارند. از دیدگاه دیگر، خلاصه سازی را می توان به دو روش کلاسیک و نیز روش مبتنی بر یادگیری پیاده سازی نمود. در روش خلاصه سازی کلاسیک، پس از پیش پردازش متن ورودی، با توجه به نشانگرهای جمله مانند نقطه، آن را به جملات موجود تقسیم بندی می کنیم. سپس هر جمله به صورت برداری از ( ویژگی ها و مقدار آن ویژگی در جمله) نمایش داده می شوند. این ویژگی ها مانند موقعیت جمله، متوسط تکرار کلمات در آن جمله و تعداد کلمات موجود در عنوان از پیش تعریف شده هستند. همچنین ارزش و اهمیت هر ویژگی نیز ثابت می باشد. بنابر این به هر جمله به مقدار و ارزش آن ویژگی، امتیازی داده می شود و در نهایت با توجه به مجموع امتیاز هر جمله، جملات دارای ارزش بالاتر در خلاصه قرار می گیرند. در روش خلاصه سازی بر اساس تکنیک های یادگیری ماشین پس از پیش پردازش متن ورودی، با توجه به نشانه های خاص، آن را به جملات و زیر جملات می شکند. سپس هر جمله با یک مجموعه ویژگی مانند موقعیت جمله، متوسط تکرار کلمات در آن جمله و تعداد کلمات موجود در عنوان بیان می شود. این ویژگی  ها توسط یک بردار ویژگی برای آن جمله در نظر گرفته می شوند. چالش مهمی که در اینجا وجود دارد انتخاب ویژگی های صحیح برای هر جمله و نیز تعیین اهمیت هر ویژگی می باشد. در خلاصه ساز کلاسیک به هر یک از ویژگی ها ارزش ثابتی داده می شود، اما در این نوع خلاصه سازها به یک الگوریتم یادگیری ناظر و همچنین مجموعه آموزشی جهت آموزش طبقه بندی و ارزش ویژگی ها نیاز است. به عبارت دیگر در ابتدا یک طبقه بندی کننده مانند دسته بندی کننده بیز و یا شبکه عصبی را انتخاب می شود. سپس با ورود یک مجموعه آموزشی از جملات که به صورت بردار ویژگی نمایش داده شده اند به طبقه بند انتخابی، و با توجه به اینکه جمله مورد نظر در خلاصه موجود است یا خیر، به هر ویژگی  ضریب اهمیت پویایی داده می شود. حال به ازای هر متن اولیه که به عنوان مجموعه تست شناخته می شود، ابتدا آن متن به جملاتی تقسیم شده و هر جمله به صورت بردار ویژگی نمایش داده می شود. سپس هر بردار ویژگی به خلاصه ساز آموزش دیده وارد شده و با توجه به مقدار کلاس خروجی، تعیین می شود آیا آن جمله در خلاصه وجود دارد یا خیر. همچنین با استفاده از این روش می توان با ورود انواع ویژگی و بررسی خلاصه به دست آمده ویژگی های نامرتبط را تعیین و از مجموعه ویژگی حذف نمود. به عبارت دیگر با استفاده از تکنیک های یادگیری ماشین می توان ضرایب و اهمیت هر یک از ویژگی های جملات را تعیین نمود.

 

field_video
کپی رایت | طراحی سایت دارکوب