دانلود ترجمه مقاله آنالیز مسائل مربوط به کیفیت داده ها در سیستم های اطلاعات پژوهشی


دانلود ترجمه مقاله آنالیز مسائل مربوط به کیفیت داده ها در سیستم های اطلاعات پژوهشی

موفقیت یا شکست یک RIS در یک موسسه علمی عمدتاً مربوط به کیفیت داده های موجود به عنوان پایه ای برای کاربردهای RIS است. زیباترین ابزارهای هوش کسب و کار (BI) (گزارش دهی و غیره), هنگامی که داده های نادرست، ناقص و یا متناقض را نمایش دهند, بی ارزش هستند. بنابراین بخشی جدایی ناپذیر از هر RIS، ادغام داده ها از سیستم های عملیاتی است. قبل از شروع فرآیند ادغام (ETL) یک سیستم منبع، یک تحلیل غنی از داده های منبع ضروری است. با حمایت از یک بررسی کیفیت داده ها، علل مشکلات کیفی معمولاً قابل شناسایی می شوند.

تحلیل های مربوطه با استفاده از پروفایل های داده ها انجام می شوند تا تصویر خوبی از وضعیت داده ها ارائه شود. در این مقاله، روش های پروفایل سازی داده ها به منظور به دست آوردن یک مرور کلی از کیفیت داده ها در سیستم های منبع قبل قبل از ادغام آنها در RIS ارائه شده است. با کمک پروفایل سازی داده ها ها، موسسات علمی نه تنها می توانند اطلاعات تحقیقاتی خود را ارزیابی کنند و نیز اطلاعاتی در مورد کیفیت آنها ارائه دهند، بلکه همچنین وابستگی ها و زواید از میان زمینه های داده را بررسی می کنند و آنها را در RIS خود اصلاح می کنند.

Abstract

The success or failure of a RIS in a scientific institution is largely related to the quality of the data available as a basis for the RIS applications. The most beautiful Business Intelligence (BI) tools (reporting, etc.) are worthless when displaying incorrect, incomplete, or inconsistent data. An integral part of every RIS is thus the integration of data from the operative systems. Before starting the integration process (ETL) of a source system, a rich analysis of source data is required. With the support of a data quality check, causes of quality problems can usually be detected.

Corresponding analyzes are performed with data profiling to provide a good picture of the state of the data. In this paper, methods of data profiling are presented in order to gain an overview of the quality of the data in the source systems before their integration into the RIS. With the help of data profiling, the scientific institutions can not only evaluate their research information and provide information about their quality, but also examine the dependencies and redundancies between data fields and better correct them within their RIS.

توجه: این فایل داری واتر مارک می باشد.

فرمت فایل:  Pdf
تعداد صفحات: —
حجم: 3.58 مگابایت

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *