ترجمه مقاله و پروژه رید سولومون در ذخیره ارشد: افزونگی توازن درکلاسترهای سیستم دخیره سازی


ترجمه مقاله و پروژه رید سولومون در ذخیره ارشد: افزونگی توازن درکلاسترهای سیستم دخیره سازی

 پیاده سازی الگوریتم Read Solomon با زبان c++(  در 17 صفحه)

افزونگی توازن درکلاسترهای سیستم دخیره سازی(  در 19 صفحه)

(  در 8 صفحه)Parity Redundancy in a Clustered Storage System

– چکیده

یک سیستم ذخیره سازی توزیعی مناسب، باید علاوه بر قابلیت دسترسی بالا، مقیاس پذیری مناسب و قابلیت اطمینان بالایی داشته باشد.

اضافه کردن توازن، با وجود اینکه قابلیت اطمینان را بالا می برد اما ممکن است روی عملکرد سیستم تاثیر سویی بگذارد . بنابراین پیدا کردن راهکار مناسب برای اضافه کردن افزونگی حائز اهمیت می باشد.

در این مقاله سعی کردیم مکانیسم های اضافه کردن بیت توازن با کم ترین تاثیر روی عملکرد  سیستم لاستر فایل مورد بررسی قرار دهیم.

الگوریتم های مورد بررسی ما علاوه بر قابلیت تحمل پذیری خطا ،قابلیت دسترس پذیری بالا باید همروندی ، انسجام را حفظ کرده و راندمان سیتستم را در شرایط مطلوب نگه دارد.

2- معرفی

1- سیستم  DAS(Direct Attached  Storage): در این سیستم فضای ذخیره سازی سرور به طور مستقیم روی یک دیسک سخت قرار دارد. مشکل اصلی این روش این است که اتصال به صورت محلی صورت نگرفته است و علاوه بر آن، این روش مشکل bottleneck را نیز دارد.

2- شبکه های فایل سرور: در این سیستم فضای ذخیره سازی روی چندین دیسک سخت و یک شبکه دخیره سازی قرار می گیرد .از ویژگی های اصلی این روش استفاده از کلاسترینگ و مجازی سازی است که شامل سیستم های زیر می باشد:

* سیستم SAN (Storage Area Network): در این تکنولوژِی فضای ذخیره سازی روی یک سرور منحصر به فرد نخواهد بود و اطلاعات روی Hard Drive های داخلی سرور ذخیره نمی شوند، بلکه این فضای ذخیره سازی در خارج از سرور روی یک شبکه ذخیره اطلاعات قرار می گیرد.

این تکنولوژی علاوه بر اینکه به سادگی قابلیت گسترش فضا و پهنای باند مصرفی را ایجاد می کند به دلیل استفاده از سرورهای مختلف امکان استفاده از سرویسهای ناهمگن را در یک Plan واحد امکان پذیر می سازد.

* سیستم NAS (Network Attached Storage): ): انباره (Storage) ذخیره سازی متصل به شبکه (Nas) دستگاهی است که به صورت اشتراکی در شبکه مورد استفاده قرار می گیرد. این دستگاه، با استفاده از NFS (سیستم فایلی شبکه ای مختص یونیکسی)، CIFS (سیستم فایلی شبکه ای مختص محیط های ویندوزی)، FTP، HTTP و سایر پروتکل ها با اجزای شبکه ارتباط برقرار می کند. وجود NAS در یک شبکه برای کاربران آن شبکه افزایش کارایی و استقلال از سکو را به ارمغان می آورد، گویی که این انباره مستقیما به کامپیوتر خودشان متصل است.

سیستم های فایل سرور اگرچه قابلیت دسترس پذیری را بالا می برند، اما چون به صورت توزیع شده می باشند، سربار زیادی به شبکه تحمیل می کنند و پهنای باند آن را نیز تحت تاثیر قرار می دهند.

برای حل مشکل فوق، سیستم های فایل سرور از روش باریکه سازی (Striping) استفاده می کنند، بنابراین داده های گره های متعدد به صورت همزمان در تمام باریکه ها نوشته می شود. اما باریکه سازی می تواند مشکل node failure در سطح کلاستر را تشدید کند.

 

فهرست مطالب افزونگی توازن درکلاسترهای سیستم دخیره سازی(  در 19 صفحه)

1- چکیده3

2- معرفی4

3- اقدامات مرتبط5

4- سیستم لاستر فایل 6

5- عدم دسترس پذیری 7

1.5- انواع خطاها 7

2.5- توازن(parity) 8

6- مدیریت عمل خواندن و نوشتن با استفاده از DRD 8

1.6- عمل نوشتن هنگام خرابی گره 9

2.6- عمل خواندن هنگام خرابی گره 10

7- نتایج11

1.7- تک کلاینته 11

2.7- چند کلاینته 15

8- اقدامات آینده16

9- منابع17

 

 

Parity Redundancy in a Clustered Storage System
Sumit Narayan John A. Chandy
Department of Electrical & Computer Engineering
University of Connecticut, Storrs, CT USA 06269–2157
Email:
{sumit.narayan , john.chandy}@uconn.edu
Abstract
Distributed storage systems must provide highly
available access to data while maintaining high performance and maximum scalability. In addition, reliability
in a storage system is of the utmost importance and the
correctness and availability of data must be guaranteed.
Adding parity redundancy to distributed storage systems
has been problematic because of the impact on performance. In this paper, we investigate mechanisms to add
redundancy to the Lustre cluster file system with minimal
effect on overall system performance. With data spread
across multiple nodes, ensuring the consistency of the
data requires special techniques. We describe fault tolerant algorithms to maintain the consistency and reliability of the data. We show how these techniques guarantee data integrity and availability of systems for read
and write even under failure mode scenarios.
1. Introduction
Direct Attached Storage (DAS) was the first storage
solution, and is still the simplest storage solution. In a
DAS system, a disk hardware is directly connected to
the server using high speed channels like SCSI or IDE.
However, development in network speeds and demand
for data sharing brought several newer ideas forward
while sending the data behind the network. Network file
servers allow the local direct attached file system to be
visible to client machines attached to the network. Several file systems emerged to distribute data over the network including NFS [28], CIFS [18], AFS/Coda [21, 29] and Sprite [24]. Several companies developed these
Network Attached Storage (NAS) appliances, including EMC, Network Appliance, IBM and Sun Microsystems. However, the use of a single file server for a large
number of clients raised scalability issues and also presented a single failure point. Significant research work
has been done to remove the bottleneck of the single
server model. Some of them include storage area networks (SAN), virtual disks [19, 32], network attached
storage disks (NASD) [13] and serverless storage systems [14, 4]. Most of these file systems try to improve
the performance by reducing the time to satisfy service
requests while providing sharing capabilities [15, 16].
Due to the distributed structure of network file servers as
against direct attached storage, these file systems have
CPU overhead due to protocol handling and are also
affected by network bandwidth. Although computing
power has improved exponentially, disk bandwidth has
struggled to keep up with the pace. The significant improvement in processor performance reduces the concern for CPU overhead. In order to improve data bandwidth, the file systems or storage managers typically
stripe the data across the nodes in the storage system.
Thus, writes spread the data across the stripe and reads
collect the data simultaneously from multiple nodes.

این فایل ورد (word) ترجمه در36 صفحه و فایل اصلی لاتین pdf مقاله در 8 صفحه به خدمتتون ارائه میشود.


سعیدسان تابع قوانین جاری کشور جمهوری اسلامی ایران در زمینه حقوق مولفین و ناشرین است، چنانچه نسبت به محتوای این صفحه صاحب حق نشر هستید و درخواست حذف آن را دارد، خواهشمند است از طریق این لینک به ما اطلاع دهید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *