خلاصه سازی متون
فرآیند جمع آوری و کوتاه کردن یک یا چندسند توسط ماشین، به طوری که مفاهیم و نکات اصلی آنها حفظ شود، خلاصهسازی نام دارد. خلاصهسازی را میتوان یک فرآیند تصمیمگیری در نظر گرفت زیرا ارزش جملات بر اساس یکسری معیار سنجیده میشود و باید تعدادی از جملات انتخاب شوند. متن خلاصه شده باید مختصر، روان، پیوسته، آموزنده، خوانا و حاوی نکات اصلی اسناد و همچنین فاقد ایرادهای دستور زبانی، حشو و غیره باشد.
خلاصهسازی خودکار متون بخشی از دانش یادگیریماشین و پردازش زبان طبیعی است و ایده اصلی آن یافتن زیر مجموعهایی از دادههایی است که اطلاعات کلی را دربردارند. این علم در پردازش زبان طبیعی بسیار محبوب میباشد، زیرا از قابلیتهای آن میتوان در سیستمهای پرسش و پاسخ، موتورهای توصیهشخصی، خلاصهسازی محتوای صفحات وب استفاده کرد. هدف تمامی سیستمهای خلاصهساز خودکار گردآوری خلاصهایی از اطلاعات مطابق با نیاز کاربر میباشد، بهطوری که خلاصه تولیدی از نظر کیفیت به خلاصههای انسانی شبیه باشد.
اهمیت خلاصه سازی متون
نرخ تولید اطلاعات بر روی شبکه گسترده وب به صورت روزافزون در حال افزایش میباشد بنا به گفته مرکز صنعت اطلاعات جهانی، هر ساله ۳۰ درصد به حجم اطلاعات وب اضافه میگردد. افزایش روزافزون منابع اطلاعاتی در بستر اینترنت، جستجو و یافتن اطلاعات مورد نیاز را مشکل کرده است. از طرفی مشکل محققان در عصر حاضر دسترسی دقیق به اطلاعات مورد نیازشان در کوتاهترین زمان ممکن از میان حجم انبوهی از اطلاعات سطح وب میباشد.
رشد اطلاعات و محدودیت زمان باعث شده تا خلاصهسازی متن برای محققان به یک موضوع جذاب تبدیل شود. برای حل این سری مشکلات به سراغ خلاصهسازها می رویم. ولی خلاصهسازی اسناد بزرگ توسط انسان امری دشوار و به شدت زمانبر میباشد. پس برای خلاصهسازی به سراغ روشهای ماشینی و خودکار میرویم که سرعت کار را چند برابر کرده و در زمان کمی انجام میشود. سپس وقتی خلاصهسازهای ماشینی و خودکار به خوبی راه اندازی شدند کاربر میتواند خلاصهایی از مطالب مهم را در اختیار داشتهباشد. این موضوع باعث کاهش زمان خواندن متن توسط او میشود. در واقع مشکل یافتن منابع اطلاعاتی در مورد یک موضوع خاص از میان انبوه اطلاعات موجود در وب و همچنین گزینش مطالب مهم از میان این منابع توسط سیستم خلاصهسازی خودکار قابل حل است.
بدون دیدگاه