دانلود ترجمه مقاله مشخصات مربوط به شکل گیری و کارایی سیستم های موازی در مقیاس بزرگ


خلاصه

چندین متریک و اندازه استاندارد وجود دارد که مشخص کننده کارایی و شکل گیری مربوط به سیستم موازی مانند زمان اجرا شدن موازی، تسریع و کارایی می باشد. تعدادی از مشخصات مربوط به این استانداردهای متریک مورد مطالعه قرار گرفته بود. برای مثال این یک حقیقت شناخته شده می باشد که یک معماری موازی مشخص و یک مساله مربوط به اندازه ثابت شده مورد بحث قرار گرفته است و تسریع مربوط به الگوریتم موازی برای افزایش یافتن با تعداد فزاینده ای از پردازش کننده ها ادامه نیافته است. این معمولا تمایل به اشباع شدن یا حداکثر شدن در یک محدوده معین دارد. بنابراین این برای به کار بردن بیش از یک تعداد بهینه ای از پردازش کننده ها برای حل کردن یک مساله براساس یک کامپیوتر موازی ممکن نیست که مفید باشد. این تعداد بهینه از پردازش کننده ها بستگی به اندازه مساله، الگوریتم موازی و معماری موازی دارد. در این مقاله ما اثر مربوط به بالاسری های پردازش کننده موازی و درجه مربوط به همزمانی الگوریتم موازی را براساس تعداد بهینه ای از پردازش کننده هامورد مطالعه قرار داده ایم که این موارد به صورت ملاکی برای بهینه بودن مورد استفاده قرار می گیرد که زمان اجرا شدن موازی را به حداقل می رساند. ما سپس ملاک بسیار کلی تری از بهینه شدن را مورد مطالعه قرار می دهیم و چگونگی اجرا شدن را در نقطه بهینه نشان می دهیم که معادل با اجرایی شدن در یک مقدار منحصر به فردی از کارایی است که مشخص کننده ملاکی از بهینه شدن و مشخصات مربوط به سیستم موازی تحت مطالعه است. ما نتایج فنی به دست آمده در این مقاله را در دیدگاهی با نتایجی مشابه مورد بررسی قرار داده ایم که در مقاله قبل از این نشان داده شده است و علاوه بر این نتایج کلی شده و نتایج اولیه نیز به صورت گسترده در این مقاله نشان داده شده است.

  • مقدمه

بی پرده کامپیوترهای موازی صدها تا هزارها پردازشگر را به کار گرفته اند که به صورت تجاری امروزه در دسترس هستند و اساسا قدرت محاسبه کردن خام بالاتری را در مقایسه با سوپر کامپیوترهای مداوما سریع دارند. دسترسی مربوط به چنین سیستم هایی در ارزیابی مربوط به کارایی کامپیوترهای موازی موجود می باشد که حاوی تعداد زیادی از پردازش کننده ها می باشد.

کارایی مربوط به الگوریتم موازی نمی تواند در جداسازی کردن از معماری موازی مورد اجرا تحت مطالعه قرار گیرد. برای هدف مربوط به ارزیابی کردن کارایی ما یک سیستم موازی را به عنوان ترکیبی از الگوریتم موازی معرفی کرده ایم و معماری موازی در آن براساس اجرایی شدن آن تعریف شده است. چندین استاندارد متریک وجود دارد که مشخص کننده کارایی سیستم موازی مانند زمان اجرایی شدن موازی، تسریع و کارایی می باشد. تعدادی از مشخصات مربوط به این متریک ها مورد مطالعه قرار گرفته است. این حقیقت به خوبی شناخته شده است که معماری موازی و مساله مربوط به اندازه ثابت شده مشخص می باشد و تسریع مربوط به الگوریتم موازی برای افزایش یافتن با تعداد فزاینده ای از پردازش کننده ها ادامه نیافته است. این معمولا تمایل به اشباع شدن یا حداکثر شدن در یک محدوده معین دارد. چنان چه در اوایل سال 1967، Amdahl مشاهده ای را ایجاد کرد که در آن اگر s به عنوان بخش سریالی در یک الگوریتم باشد، سپس تسریع آن برای یک مساله با اندازه ثابت شده توسط 1/s محدود می گردد و هیچ گونه موضوعی در مورد چگونگی و تعداد پردازش کننده های مورد استفاده وجود ندارد. Gastafason, Montry و Benner به صورت آزمایشی نشان دادند که حد بالا براساس تسریع و سرعت می تواند توسط افزایش یافتن اندازه مساله غالب گردد چنان چه تعداد پردازش کننده افزایش می یابد. Worley  نشان داد که برای کلاس مربوط به الگوریتم های موازی، اگر زمان اجرا شدن موازی ثابت گردد در این صورت یک اندازه مساله ای وجود دارد که نمی تواند در زمان ثابت شده با توجه به تعداد پردازش کننده های مورد استفاده حل گردد. Flatt و Kennedy برخی از حدهای بالا را مرتبط با کارایی مربوط به کامپیوترهای موازی در حضور بالاسری های هم زمان و ارتباطی به دست آوردند. آن ها نشان دادند که اگر بالاسری پردازش کننده موازی برای یک محاسبه معین دارای مشخصه های ملاکی موفقیت آمیزی باشد سپس یک مقدار منحصر به فرد از p0 برای تعدادی از پردازش کننده ها وجود دارد که در آن ها زمان اجرا شدن موازی برای یک اندازه مساله معین حداقل می باشد. به هر حال، از این نقطه نظر، کارایی مربوط به اجرا شدن موازی نسبتا ضعیف می باشد. بنابراین آن ها پیشنهاد می کنند که تعداد پردازش کننده ها باید برای حداکثر کردن محصول کارایی و سرعت انتخاب گردد. Flatt و Kennedy و Tang و li همچنین حداکثر شدن متوسط هندسه وزنی کارایی و سرعت را پیشنهاد می کنند. Eager و همکاران پیشنهاد کردند که یک نقطه اجرا شدن بهینه باید مانند کارایی اجرا شدن انتخاب گردد که به صورت گرد شده 5/0 می باشد.

To appear in Journal of Parallel and Distributed Computing, October 1993.
A preliminary version of this paper appears in the Proceedings of the 26th Hawaii
International Conference on System Sciences, 1993.
Performance Properties of Large Scale
Parallel Systems

Anshul Gupta and Vipin Kumar
Department of Computer Science,
University of Minnesota
Minneapolis, MN – 55455
Email:
agupta@cs.umn.edu and kumar@cs.umn.edu
TR 92-32, September 1992 (Revised June 1993)
Abstract
There are several metrics that characterize the performance of a parallel system, such as, parallel execution time,
speedup and eciency. A number of properties of these metrics have been studied. For example, it is a well
known fact that given a parallel architecture and a problem of a xed size, the speedup of a parallel algorithm
does not continue to increase with increasing number of processors. It usually tends to saturate or peak at a
certain limit. Thus it may not be useful to employ more than an optimal number of processors for solving a
problem on a parallel computer. This optimal number of processors depends on the problem size, the parallel
algorithm and the parallel architecture. In this paper we study the impact of parallel processing overheads and
the degree of concurrency of a parallel algorithm on the optimal number of processors to be used when the
criterion for optimality is minimizing the parallel execution time. We then study a more general criterion of
optimality and show how operating at the optimal point is equivalent to operating at a unique value of eciency
which is characteristic of the criterion of optimality and the properties of the parallel system under study. We put
the technical results derived in this paper in perspective with similar results that have appeared in the literature
before and show how this paper generalizes and/or extends these earlier results.
This work was supported by IST/SDIO through the Army Research Oce grant # 28408-MA-SDI to the
University of Minnesota and by the University of Minnesota Army High Performance Computing Research Center
under contract # DAAL03-89-C-0038

این فایل ورد ترجمه در 26 صفحه و فایل اصلی لاتین pdf مقاله در 21 صفحه به خدمتتون ارائه میشود.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *