دانلود پژوهش استخراج اتوماتیک اطلاعات بر اساس آنتالورژی


دانلود پژوهش استخراج اتوماتیک اطلاعات بر اساس آنتالورژی

لازمه توسعه و گسترش وب معنایی ، ازدیاد هر چه بیشتر آنتالوژی ها می باشد . آنتالوژی ها با ایجاد فهم مشترک از مفاه یم موجود در دامنه دانش ، امکان همکاری و تبادل اطلاعات بین ماشین ها را بوجود می آورند . اما ایجاد دستی آنتالوژی ها سخت و طاقت فرسا بوده و احتمال بروز خطای انسانی نیز بسیار زیاد می باشد . از این رو ، استخراج اطلاعات از منابع وب بصورت نیمه اتوماتیک و یا تمام اتوماتیک مورد توجه بسیاری از محققان قرار گرفته است.

اولین است که اطلاعات موجود در صفحات وب را در یک قالب Wrapper ایده در استخراج اطلاعات، تهیه برنامه ای بنام ها بصورت دستی، نیمه اتوماتیک و اتوماتیک Wrapper ساخت یافته، استخراج می کند . ابزار های متنوعی جهت تولید مورد پژوهش قرار گرفته اند. برخی از این ابزار ها ابتدا قواعد استخراج را آماده کرده و در هنگام استخراج اطلاعات با آگاهی از محل داده ها، به سرعت اطلاعات مورد نیاز را استخراج می نمایند . برخی دیگر نیز با استفاده از آنتالوژی استخراج، داده های موجود در صفحه وب را پردازش کرده و مفهوم مرتبط با هر مقدار متنی را از

آنتالوژی دامنه یافته و در نهایت با توجه به الگوهای موجود، اطلاعات را استخراج می نمایند.
Wrapper در این تحقیق، روش پیشنهادی ما که منجر به تولید یک سیستم نرم افزاری نیز خواهد شد، توصیف می باشد . این زبان با ترکیب مکانیزم های استخراج مبتنی بر مکان و مبتنی بر WDML با استفاده از زبان نشان گذاری بصورت درختی WDML آنتالوژی، از مزایای هر دو روش بهره می برد . قواعد استخراج توصیف شده در فایل های تعریف شده و به آن الگوی استخراج گفته می شود از این رو نسبت به سایر روش ها د ارای انعطاف پذیری بسیار با استفاده از یک آنتالوژی WDML بالایی می باشد . همچنین در این تحقیق روشی را جهت تولید اتوماتیک فایل های استخراج ارائه خواهیم کرد.

توجه: این فایل داری واتر مارک می باشد.

فرمت فایل:  Pdf
تعداد صفحات: 134
حجم: 2.94 مگابایت

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *