جواد سدیدی؛ سعیده صاحبی وایقان؛ هانی رضائیان
چکیده
در سالهای اخیر با پیشرفت فنآوریهای جمعآوری و مدیریتداده، پایگاهدادههای بسیار بزرگ پدیدار شدهاند. بسیاری از پرسوجوهای تجزیه و تحلیل بر اساس ماهیتشان به تجمیع و خلاصهسازی بخشهای بزرگی از دادههای در حال تجزیه و تحلیل نیاز دارند. مسئله اصلی در حیطهی پایگاه داده پردازش کارآمد پرسوجو مخصوصاً در سیستمهای ...
بیشتر
در سالهای اخیر با پیشرفت فنآوریهای جمعآوری و مدیریتداده، پایگاهدادههای بسیار بزرگ پدیدار شدهاند. بسیاری از پرسوجوهای تجزیه و تحلیل بر اساس ماهیتشان به تجمیع و خلاصهسازی بخشهای بزرگی از دادههای در حال تجزیه و تحلیل نیاز دارند. مسئله اصلی در حیطهی پایگاه داده پردازش کارآمد پرسوجو مخصوصاً در سیستمهای لحظهای[1] است که نیازمند رسیدن به جواب آنی میباشد تا اینکه کاربر زمان زیادی را برای دریافت پاسخ صرف نکند. (AQP (Approximate Query Processingبهعنوان روشی جایگزین برای پردازش پرسوجو در محیطهایی که ارائه یک پاسخ دقیق زمانبر است، با هدف ارائه پاسخ تخمینی، کاهش زمان پاسخ را با حذف یا کاهش تعداد دسترسیها به دادهی پایه میسر میسازد. پردازش [2]In-Database عملکرد شبکههای کامپیوتری را بهبود بخشیده و به طراحی مناسب پرسوجوها با نتایج نسبتاً سریع و دقیق کمک میکند. در این پژوهش عملیات تجمیع (Sum) در پایگاه داده PostgreSQL روی دادههای رستری بارش به دو روش معمولی و بهینه پیشنهاد شده، انجام شده است. بررسی نتایج نشان میدهد که سرعت اجرای تابع Sum با خوشهبندی، 2/27 برابر اجرای این تابع بدون خوشهبندی است و میانگین اختلاف عددی پیکسلهای حاصل از اجرای تابع Sum بهینه با اجرای تابع معمولی آن 028/0 میباشد.میانگین زمان اجرای پرسوجوهای معمولی و بهینه برای تابع Sum به ترتیب 211 و 754/7 ثانیه میباشد که نشانگر کارآمد بودن روش پیشنهاد شده در این تحقیق میباشد. نتایج تحقیق حاضر که در حقیقت کاهش معنی دار زمان پاسخ آنالیزهای داخل پایگاه دادهای در دادههای رستری میباشد، میتواند در ارائه سرویسهای رئال تایم تحت وب مانند هواشناسی، ترافیک و ... که نیازمند تحلیلهای آنی و جواب لحظهای میباشند مورد استفاده قرار گیرد. [1]- Real time [2]- درون پایگاهداده