پردازش تصوير ديجيتال – بخش اول


فصل اول:

مقدمه اي بر پردازش تصوير ديجيتال

 

1-1 : مقدمه

پردازش تصوير ديجيتال[1] دانش جديدي است كه سابقه آن به پس از اختراع رايانه هاي ديجيتال باز مي گردد . با اين حال اين علم نوپا در چند دهه اخير از هر دو جنبه نظري و عملي پيشرفت هاي چشمگيري داشته است . سرعت اين پيشرفت به اندازه اي بوده است كه هم اكنون و پس از اين مدت نسبتاً كوتاه ، به راحتي مي توان رد پاي پردازش تصوير ديجيتال را در بسياري از علوم و صنايع مشاهده نمود . علاقه به روش هاي پردازش تصوير ديجيتال از دو محدوده كاربردي اصلي نشات مي گيرد كه آن محدوده ها عبارتند از : بهبود اطلاعات تصويري به منظور تعبير انساني و پردازش داده هاي صحنه براي ادراك ماشيني مستقل .

چند دسته مهم از كاربرد هاي پردازش تصوير به شرح زير مي باشد [ 1 ] :

الف ) كاربردهاي عكاسي مانند ارتقاء ، بازسازي تصاوير قديمي ، بازسازي تصاوير خراب شده با نويز و بهبود ظاهر تصاوير معمولي.

ب ) كاربرد هاي پزشكي مانند ارتقاء ويژگي هاي تصاوير اشعه ايكس ، توليد تصاوير MRI و

CT-scan.

ج ) كاربرد هاي امنيتي مانند تشخيص حركت ( در دزد گير ها ) ، تشخيص اثر انگشت ، تشخيص چهره و تشخيص امضاء.

د ) كاربرد هاي نظامي مانند تشخيص و رهگيري خودكار اهداف متحرك يا ثابت از هوا يا از زمين.

ه ) كاربرد هاي سنجش از راه دور مانند ارتقاء و تحليل تصاوير هوايي و ماهواره اي (برداشته شده از مناطق مختلف جغرافيايي) كه در كاربرد هاي نقشه برداري ، كشاورزي ، هوا شناسي و موارد ديگر مفيد هستند .

و ) كاربرد هاي صنعتي مرتبط با خودكار سازي صنايع مانند تفكيك محصولات مختلف بر اساس شكل يا اندازه ، آشكارسازي نواقص و شكستگي هاي موجود در محصولات ، تعيين محل اشياء و اجراي فرايند توليد با استفاده از روبات ها و بينايي ماشيني .

ز ) كاربرد هاي فشرده سازي تصوير مانند ذخيره سازي ، ارسال تصاوير تلويزيون با كيفيت بالا و ارسال تصاوير متحرك و زنده از روي شبكه اينترنت و يا خط تلفن.

ح ) موارد متفرقه ديگري نيز مانند تصوير برداري از اسناد و ارسال آنها توسط دور نگار و تشخيص خودكار نويسه در رديف كاربرد هاي پردازش تصوير قرار دارند.

1-2 : مراحل اساسي پردازش تصوير

پردازش تصوير ديجيتال محدوده وسيعي از سخت افزار ، نرم افراز و مباني نظري را در بر مي گيرد . در اين قسمت مراحل اساسي مورد نياز براي اجراي يك پردازش روي تصوير را نام مي بريم كه در شكل 1-1 نمايش داده شده است .

E:\My Documents\untitled.jpg

شكل 1-1 : مراحل اساسي پردازش تصوير ديجيتال

مرحله اول اين فرايند ، تصوير برداري[2] – يعني به دست آوردن تصوير ديجيتال – است . انجام دادن چنين كاري نيازمند يك حسگر تصوير بردار[3] و قابليت ديجيتال سازي سيگنال خروجي حسگر مي باشد . پس از اينكه تصوير ديجيتال به دست آمد ، مرحله بعدي پيش پردازش آن است . وظيفه اصلي پيش پردازش ، بهبود تصوير به روش هايي است كه امكان توفيق ساير پردازش ها را نيز افزايش دهد . پيش پردازش ، به طور معمول به روش هايي براي ارتقاء تمايز ، حذف نويز و جداسازي آن نواحي كه زمينه شان نشان دهنده احتمال وجود اطلاعات حرفي – عددي است ، مي پردازد . مرحله بعدي به بخش بندي[4] مي پردازد . در تعريف وسيع ، بخش بندي فرايندي است كه تصوير ورودي را به قسمت ها يا اجزاي تشكيل دهنده اش تقسيم مي كند . به طور كلي بخش بندي يكي از مشكل ترين كارها در پردازش تصوير ديجيتال است . از طرفي يك شيوه قوي بخش بندي ، تا حد زيادي فرايند را به حل موفق مساله نزديك مي كند . از طرف ديگر الگوريتم هاي ضعيف يا خطا دار بخش بندي ، تقريباً هميشه باعث خرابي اتفاقي [5]مي شوند . خروجي مرحله بخش بندي معمولاً ، داده هاي پيكسلي خام است كه يا مرز يك ناحيه يا تمام نقاط درون آن ناحيه را تشكيل مي دهند . در هر دو حالت بايد داده ها را به شكل مناسب براي پردازش رايانه اي تبديل نمود . اولين تصميمي كه بايد گرفته شود اين است كه آيا داده ها بايد به صورت مرز يا به صورت يك ناحيه كامل نمايش داده شود . نمايش مرزي وقتي مفيد است كه مشخصات خارجي شكل نظير گوشه ها يا خميدگي ها مورد نظر باشد . نمايش ناحيه اي وقتي مفيد است كه خواص دروني بخش هاي تصوير نظير بافت يا استخوان بندي شكل مورد توجه باشد . در هر حال در بعضي كاربرد ها هر دو نمايش به كار مي رود . انتخاب يك روش نمايش ، تنها قسمتي از راه تبديل داده هاي خام به شكل مناسب براي پردازش بعدي رايانه اي است . توصيف[6] ، كه انتخاب ويژگي[7] نيز خوانده مي شود ، به استخراج ويژگي هايي كه مقداري از اطلاعات كمي مورد نظر را به ما مي دهند يا براي تشخيص گروهي از اشياء از گروه ديگر ، اساسي هستنند ، مي پردازد . مرحله آخر شكل 1-1 شامل تشخيص و تعبير است . تشخيص[8] فرايندي است كه بر اساس اطلاعات حاصل از توصيف گرها يك برچسب را به يك شي منتسب مي كند . تعبير[9] شامل انتساب معنا به يك مجموعه از اشياء تشخيص داده شده است . دانش به شكل پايگاه داده دانش[10] در درون سامانه پردازش تصوير ، ذخيره مي شود . اين دانش ممكن است ، تنها دانستن محل نواحي داراي جزئيات مورد علاقه باشد . بنابراين جستجوي مورد نياز براي آن اطلاعات محدود مي شود . پايگاه دانش ممكن است كاملاً پيچيده باشد ، نظير فهرست به هم مرتبط تمام نقايص اصلي ممكن در يك مساله بازرسي مواد يا يك پايگاه داده تصويري كه حاوي تصاوير ماهواره اي تفكيك بالا از يك منطقه در ارتباط با كاربرد هاي آشكارسازي تغيير[11] باشد . پايگاه دانش علاوه بر هدايت عمل هر واحد پردازش ، بر تعامل بين واحد ها نيز نظارت مي كند . اين نمودار نشان مي دهد كه ارتباط بين واحد هاي پردازش اغلب براساس دانش قبلي در مورد نتيجه پردازش است . اين پايگاه دانش نه تنها عمل هر واحد را هدايت مي كند ، بلكه به عمليات بازخورد[12] بين واحد ها نيز كمك مي كند [1].

1-3 : يك مدل ساده تصوير

عبارت تصوير به تابع دو بعدي شدت نور كه به صورت نوشته مي شود ، اشاره دارد كه مقدار يا دامنه در مختصات مكاني ، شدت روشنايي تصوير در آن نقطه مي باشد . چون نور صورتي از انرژي است ، بايد بزرگتر از صفر و متناهي باشد ، يعني

تصاوير دريافتي در فعاليت هاي روزانه معمولاً نور منعكس شده از اشيا است . طبيعت پايه اي را مي توان با دو عامل مشخص نمود : (1) مقدار نور تابشي از منبع روي صحنه اي كه ديده مي شود و (2) مقدار نور منعكس شده به وسيله اشياء صحنه .

اين دو عامل به ترتيب مولفه هاي روشنائي و انعكاس[13] ناميده مي شوند و به ترتيب با و

نشان داده مي شوند . توابع و به شكل حاصل ضرب تركيب مي شوند تا ايجاد شود :

 

كه

 

و

معادله بيان مي كند كه ضريب انعكاس به بازه عددي صفر (جذب كامل) و يك (انعكاس كامل) محدود مي شود . طبيعت توسط منبع نور و نيز توسط مشخصات اشياي صحنه معين مي شود .

شدت تصوير تكرنگ در مختصات را سطح خاكستري تصوير در آن نقطه مي ناميم .

بازه محدوده خاكستري ناميده مي شود . معمولاً تلاش مي شود كه اين بازه را به بازه كه در آن بيانگر سياه و بيانگر سفيد است ، تغيير دهيم . تمام مقادير مياني سايه هاي خاكستري هستند كه به طور پيوسته از سياه تا سفيد تغيير مي كنند[1] .

 

4-1: تشخيص صورت

يكي از مهم ترين كاربرد هاي پردازش تصوير ديجيتال در زمينه ي تشخيص صورت است . تشخيص صورت ، محبوبيت و اهميت زيادي را در جامعه بصري كامپيوتري[14] بدست آورده است . با حضور همزمان تكنولوژي اطلاعاتي جديد و رسانه هاي گروهي ، روش هاي موثر تر و آشنا تري براي برهم كنش هاي انسان – كامپيوتر[15] (HSI) توسعه داده مي شوند ، واسط هاي انسان – كامپيوتر كه بر مبناي حالات چهره و حركات بدن انسان مي باشند ، به عنوان روش هايي مورد استفاده قرار گرفته اند كه جايگزين واسط هاي سنتي از قبيل صفحه كليد ،‌ ماوس و نمايشگر ها شده اند . تحقيقات در حال گسترش در ارتباط با پردازش صورت بر اين اساس هستند كه اطلاعاتي درباره هويت ، موقعيت و مقصود يك كاربر از تصاوير قابل استخراج باشند و متعاقباً كامپيوتر متناظر هم بتواند واكنش نشان دهد . تلاش هاي صورت گرفته در پردازش صورت ، شامل شناسايي صيورت ، رديابي صورت ، شناسايي حالت چهره ، تصديق صورت و تشخيص صورت مي باشد . براي ساختن سيستم هاي خودكاري كه اطلاعات قرار كرفته در تصاوير صورت را آناليز كنند ، الگوريتم هاي موثر و قدرتمندي از تشخيص صورت مورد نياز است . با داشتن يك تصوير مجزا ،‌ هدف تشخيص صورت ، تعيين تمام نواحي صورت است كه شامل صورت مي باشند ، با صرف نظر كردن از وضعيت سه بعدي تصوير ، جهت و شرايط روشنايي آن . در سالهاي اخير فعاليت هاي بسياري در زمينه ي شناسايي و تشخيص صورت انجام گرفته است . كاربردهاي نظارتي و كنترلي و تجاري بسياري در حوزه اين فعاليت ها ،‌توسعه داده شده اند . تكنيك هاي بيشماري براي تشخيصي صورت در تصاوير مجزا پيشنهاد شده اند . اين روش ها به دو دسته كلي تر مبتني بر ويژگي و تصوير تقسيم بندي شده اند . كه هر يك مزايا و معايب خاص خود را دارند . از بين اين روش ها ، روش مبتني بر رنگ و شبكه ي عصبي و ماشين بردار حمايتي (SVM) ، رايج تر هستند و كارايي آنها به مراتب بيشتر از ساير روش هاست . تكنيك هاي مبتني بر رنگ اغلب خيلي مطمئن هستند ،‌ اما ممكن است كه منجر به تشخيص هاي غلط بي شماري شوند ، در نتيجه نياز به آن دارند كه با ساير روش ها تركيت شوند . شيوه هاي شبكه ي عصبي و ماشين بردار حمايتي كه مبتني بر الگوريتم هاي يادگيري و رده بندي هستند عمدتاً شامل پارامتر هاي بي شماري هستند كه نيار به تنظيم دارند كه مسلماً اين عمليات وقت گير است . با داشتن يك تصوير دلخواه به عنوان ورودي ، كه مي تواند از ويدئو و يا يك عكس بي جاني ، ‌حاصل آمده باشد ، هدف تشخيص صورت ، تعيين اين مساله است كه آيا صورتي در تصوير وجود دارد يا خير ، و اگر وجود داردموقعيت و محدوده ي هر صورت را برمي گرداند . فعاليت هايي كه در زمينه ي تشخيص صورت ، انجام گرفته به اوايل سال 1970 بر مي گردد . هر چند براي بيشتر از بيست سال است كه اين امر توسط مهندسان و روانشناسان مورد مطالعه ي جدي قرار گرفته است ،‌و مخصوصاً از سال 1995 ، روش هاي بسياري در تلاش براي حل اين مسئله ، توسعه داده شده اند . در حقيقت ما تصاويري را كه فقط حاوي قورت باشد را دريافت نمي كنيم . به سيستمي نياز هست كه صورت ها را در تصاوير درهم ، تشخيصي ،‌تعيين موقعيت و جدا كند و در نتيجه ي آن ، اين صورت هاي جداسازي شده مي توانند به عنوان ورودي به سيستم هاي تشخيص [16]چهره تحويل داده شوند . عمل تشخيص صورت براي مغز بشري ، يك عمل جزئي و كم اهميت است ، در حالي كه هنوز چالش ها و مشكلات سختي را براي آنكه كامپيوتر قادر به انجام تشخيص صورت ،‌ باشد باقي گذاشته است . چالش هايي كه با تشخيص صورت مرتبط هستند را در موارد زير خلاصه مي كنيم :

  • وضع [17]صورت : تصاوير يك صورت متناظر با وضعيت هاي مختلف قرار گيري دوربين – صورت ، همچون روبرو ، تمام رخ ، 45 درجه ، وارون و …. تغيير مي كنند . كل اين وضعيت ها را به بالا ، پايين و عادي تقسيم مي كنيم كه قرار گيري صورت نسبت به محور مستقيم دوربين را نشان مي دهند .
  • وجود يا عدم وجود مولفه هاي ساختاري[18]: مولفه هاي اضافي مرتبط با صورت همچون سبيل ، ريش ، كلاه و عينك هستند كه ممكن است وجود داشته باشند يا نداشته باشند . اين مولفه ها در صورت وجود تغييرات زيادي را موجب مي شوند .
  • حالات چهره [19] : ظاهر صورت مستقيماً متاثر از حالات چهره ي اشخاص است .
  • انسداد[20] يا همپوشاني : صورت ها ممكن است به طور جزئي توسط اشياء ديگر از جمله صورت ديگر يا كلاه و … پوشيده شده باشند .
  • شرايط تصوير[21] : زماني كه تصوير ايجاد مي شود ، عواملي چون روشنايي ( طيف ها ، توزيع منبع و شدت[22]) و مشخصات دوربين ( واكنش حسگر و لنز ها ) مي توانند روي ظاهر يك صورت تاثير بگذارند .
  • تاثير رنگ يا به هم ريختگي زمينه : صورت ها ممكن است در زمينه هاي پيچيده ظاهر شوند كه در اين صورت ، اشييايي كه رنگ مشابهي با پوست دارند ،‌ نيز به اشتباه ممكن است ، شناسايي شوند .

از نتيجه حاصله از عمليات تشخيص صورت بر روي عكس ورودي مي توان در زمينه هاي ديگري استفاده نمود . از جمله :

مكان يابي صورت[23] : اين عمل ، موقعيت تصوير را از يك صورت تك مشخص مي كند .

تشخيص خصائص صورت[24] : هدف از انجام اين عمل ، تشخيص وجود و موقعيت خصايص صورت ، همچون چشم ها ، بيني ، ابرو ، دهان ، لب ها ، گوش ها و …. مي باشد .

شناسائي صورت[25]: يك تصوير ورودي ( كاوشگر) را با يك پايگاه داده (گالري ) ، مقايسه مي كند و يك تطابق[26] را اگر وجود داشته باشد ، گزارش مي دهد .

رديابي صورت[27] : روش هاي رديابي صورت ، پيوسته موقعيت و احتمالاً جهت يك صورت را در دنباله اي از تصوير در بلادرنگ [28]، بر آورد مي كنند .

1-5 : تشخيص و تعبير

در اين قسمت با ارائه چند روش تشخيص و تعبيرتصوير ، مبحث پردازش تصوير ديجيتال را پايان مي دهيم .

تحليل تصوير شامل فرآيند هاي كشف ، شناسايي و فهم الگو هاي مرتبط با يك كار تصويري است . يكي از اهداف اصلي تحليل رايانه اي تصوير اين است كه ماشين بتواند بعضي توانايي هاي انسان را تا حدودي تقريب بزند . بنابراين سامانه خودكار تحليل تصوير بايد بتواند درجات گوناگوني از هوشمندي را ارائه كند . مفهوم هوشمندي[29] تا حدي ، به ويژه راجع به ماشين ، تقريبي است . با اين حال شناخت انواع مشخصه هايي كه معمولاً با هوشمندي مرتبط هستند ، مشكل نيست . در اين مورد چند مشخصه فوراً به ذهن مي آيند : (1) توانايي استخراج اطلاعات مرتبط از زمينه اي با جزئيات نامرتبط ؛. (2) توانايي يادگيري از مثال ها و تعميم آن طوري كه در شرايط جديد و متفاوت قابل استفاده باشد و (3) توانايي استنتاج از اطلاعات ناقص .

قسمت اعظم تحليل تصوير رايانه اي كنوني بر اساس روابط تجربي كه براي حل مسائل خاصي طرح شده اند ، مي باشد . مثلاً بعضي ماشين ها قادرند نوشته هاي چاپي را كه قالب مناسبي داشته باشند ، با سرعت هايي كه بارها سريع تر از سرعت خواندن ماهرترين انسان ها است ،‌ بخوانند . با اين حال اين نوع سامانه ها بسيار خاص هستند و توسعه پذيري كمي دارند يا اصلاً توسعه پذير نيستند . بنابراين محدوديت هاي عملي و نظري فعلي در مبحث تحليل تصوير ،‌ راه حل هايي را تحميل مي كنند كه شديداً وابسته به مساله هستند .

تقسيم روش هاي تحليل تصوير به سه گروه اصلي مفيد به نظر مي رسد . اين گروه ها عبارتند از : (1) پردازش سطح پايين ،‌(2) پردازش سطح مياني و (3) پردازش سطح بالا . گر چه اين تقسيم بندي ها مرز هاي قطعي ندارند ، ‌اما چهار چوب مفيدي براي دسته بندي فرآيند هاي مختلفي كه اجزاي اصلي سامانه خودكار تحليل تصوير هستند ، فراهم مي آورند . پردازش سطح پايين[30] به اعمالي گفته مي شود كه واكنش هايي خودكار هستند و اصلاً نيازي به هوشمندي ندارند . ما تصوير برداري و پيش پردازش[31] را به عنوان اعمال سطح پايين در نظر مي گيريم . اين گروه شامل فعاليت هايي از تشكيل تصوير تا جبران سازي هايي نظير كاهش نويز يا مات زدايي مي شود . پردازش سطح مياني[32] به عمل استخراج و مشخص كردن اجزاي ( مثلاً نواحي ) تصوير كه حاصل فرآيند سطح پايين هستند ، مي پردازد . فرآيندهاي سطح مياني شامل بخش بندي و توصيف مي باشد . در نهايت پردازش سطح بالا[33] شامل تشخيص و تعبير است . اين دو فرآيند تشابه بيشتري به مفهوم عام درك هوشمندانه[34] دارند . در ادامه از بين روش هاي موجود سه روش به طور خلاصه شرح داده مي شود : (1) روش هاي تشخيص با نظريه تصميم[35] تشخيص ، (2) روش هاي ساختاري تشخيص و (3) روش هاي تعبير تصوير . تشخيص با نظريه تصميم بر اساس نمايش الگوها به شكل بردار و سپس جستجوي روش هايي براي گروه بندي و انتساب اين بردار ها به دسته الگوهاي متفاوت است . روش هاي اصلي تشخيص با تظريه تصميم ، دسته بندي كننده هاي حداقل فاصله ، همبسته سازها ،‌ دسته بندي كننده بيز[36] و شبكه هاي عصبي هستند . در تشخيص ساختاري الگوها به شكل نمادين (نظير رشته ها يا درخت ها ) نمايش داده مي شوند و روش هاي تشخيص بر اساس تطبيق نماد يا براساس مدل هايي هستند كه با الگوها نمادي به عنوان جمله هايي از يك زبان مصنوعي رفتار مي كنند . تعبير تصوير به مجموعه اي از عناصر تصويري تشخيص داده شده ، معنا نسبت مي دهد . مهمترين مفهومي كه زير بناي روش هاي تعبير تصوير است ،‌ سازماندهي و استفاده موثر از دانش درباره حوزه مورد نظر است . روش هاي فعلي تعبير تصوير بر اساس منطق گزاره ها ، شبكه هاي معنايي[37] و سامانه فرآوري[38] (به ويژه خبره[39]) هستند [1] .

  1. Digital Image Processing
  2. Image acquisition
  3. Imaging sensor
  4. Segmentation
  5. Eeventual failure
  6. Description
  7. Feature selection
  8. Recognition
  9. Interpretation
  10. Knowledge base
  11. Change detection
  12. Feed back
  13. Illumination and reflectance
  14. computer vision community
  15. Human computer interaction
  16. face recognition system
  17. pose
  18. presence or absence of structural component
  19. facial expressions
  20. occlusion
  21. image condition
  22. intensity
  23. face localization
  24. facial feature detection
  25. face recognition or identification
  26. match
  27. face tracking
  28. real-time
  29. Intelligence
  30. Low-level processing
  31. رجوع شود به قسمت 1-2
  32. Intermediate-level processing
  33. High-level processing
  34. Intelligent congnition
  35. Decision–theoretic method
  36. Bayes
  37. Semantic networks
  38. Production system
  39. Expert

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *