- تاریخ انتشار : ۱۳۹۶
- ناشر : سومین کنفرانس بین المللی پژوهش در مهندسی ،علوم و تکنولوژی
- زبان مقاله : همه
- تعداد صفحات : 12
- حجم فایل : 0 کیلوبایت
- نوع مقاله : مجموعه مقالات کنفرانس
- مجموعه : مهندسی و فناوری
چکیده مقاله
طبقه بندی در زمره روشهای یادگيری ماشين مبتنی بر محتوا قرار می گيرد . طبقه بند معمولا در یک فرآیند یادگيری ساخته میشود.با توجه به افزایش چشمگير حجم مطالب متنی ،ابزارهاو روش های خودکار برای مدیریت اسناد و مطالب متنی،مورد توجهبسيارزیادی قرار گرفته اند .از جمله این ابزارها می توان به طبقه بندی متن اشاره کرد که می تواند در این زمينه بسيار موثرباشداین ابزار کاربردهای فراوانی در سيستم های بررسی متون مانند موتورهای جستجو،سيستم های فيلترینگ،تشخيص هرزنامهها،کتابخانه های دیجيتال و سایر سيتم های مشابه دارد.در این تحقيق بر روی پيکره همشهری برای ارزیابی متون فارسی استفادهشده است و با استفاده از ترکيب الگوریتم های SVM و KNN به طبقه بندی متون پرداخته است .این طبقه بند را بوسيله 045متن فارسی که ازپيکره همشهری گرفته شده بودآموزش داده و برروی 05 متن مشابه آزمایش کردیم . متن هابه 0دسته تقسيم شدهبودند که دربين این دسته ها،متن های متعلق به دسته های ورزشی،پزشکی وسياسی بهترازبقيه دسته بندی شدند.الگوریتم هایاستفاده شده برای اندازه گيری دقت ترکيب طبقه بندها دربهترین حالت برای متنهای سياسی به 5.08 رسيد . ونتایج آزمایشها برروی پيکره همشهری بااستفاده ازالگوریتم SVM و KNN نشان دادکه ترکيب الگوریتم هاروشهای انتخاب ویژگی ضمن کاهش تعدادویژگيها،موجب افزایش کارایی و دقت سيستم ترکيب طبقه بندها می شود.
نحوه استناد به مقاله
در صورتی که می خواهید به این مقاله در اثر پژوهشی خود ارجاع دهید، می توانید از متن زیر در بخش منابع و مراجع بهره بگیرید :
1.سمیه اسماعیلی راد؛2.امیر رجبی بهجت؛3.محمد علی باقری؛ ۱۳۹۵، طبقه بندی دست نوشته فارسی با استفاده ازروش مبتنی، سومین کنفرانس بین المللی پژوهش در مهندسی ،علوم و تکنولوژی، https://scholar.conference.ac:443/index.php/download/file/7989-Classification-of-handwritten-Persian-using-the-method-based
در داخل متن نیز هر جا به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پرانتز، مشخصات زیر نوشته شود.
(1.سمیه اسماعیلی راد؛2.امیر رجبی بهجت؛3.محمد علی باقری؛ ۱۳۹۵)