2-2 : الگوريتم تشخيص صورت بر مبناي مكان يابي ويژگي هاي صورت
مقدمه
تشخيص صورت انسان اغلب به عنوان اولين قدم در كاربردهائي مثل نظارت ويدئوئي، رابطه انسان كامپيوتر، شناسائي صورت و مديريت پايگاه تصوير مي باشد. اين روش شامل يك الگوريتم براي تصاوير رنگي مي باشد كه با وجود شرايط مختلف نور و پس زمينه هاي متفاوت نتايج خوبي ارائه مي دهد.
اين متد نواحي پوست را در تمام تصوير مشخص نموده، سپس كانديد هاي صورت را بر مبناي روابط فضائي نواحي پوست ايجاد مي كند. سپس نقشه چشم، دهان و مرز صورت را براي بررسي هر ناحيه كه به عنوان كانديدي از يك صورت مي باشد، مي سازد. نتايج تجربي حاكي از موفقيت اين الگوريتم در تشخيص صورت روي تعداد زيادي از تصاوير كه در زمينه رنگ، موقعيت، مقياس، چرخش، وضعيت و حالات چهره تفاوت دارند و از منابع مختلفي تهيه شده اند، مي باشد.
2-2-1 : چكيده
روش هاي مختلف تشخيص صورت كه از تكنيك هائي مثل شبكه هاي عصبي، آموزش ماشين، تطبيق مدل هاي تغيير پذير، تبديل Hough ، استخراج حركت و آناليز رنگ استفاده مي كنند، در [4] بيان شده اند. روش هاي مبتني بر شبكه عصبي [5] و تصوير[6] به تعداد زيادي از نمونه هاي آموزشي شامل صورت و غير صورت نياز دارند و براي پيدا كردن صورت در تصاوير مقياس خاكستري طراحي شده اند. در جديد ترين متد مبتني بر تصوير [7] با استفاده از تكنيك پارامتري تشخيص صورت از حالت تمام رخ به نيم رخ ارتقا داده شده است. روش هاي مبتني بر مدل به طور گسترده در رديابي صورت استفاده مي شود، اغلب در اين روش ها فرض بر اين است كه مكان اوليه صورت معين مي باشد.
رنگ پوست يك راهنماي مهم در زمينه تشخيص صورت مي باشد. اما روش هاي مبتني بر رنگ با وجود پس زمينه هاي مختلط و تغييرات شرايط نوري به مشكل بر مي خورند. روشي كه در ادامه بيان مي شود مي تواند به خوبي از عهده تمام مسائل فوق برآيد.
2-2-2 : الگوريتم تشخيص صورت
به كارگيري اطلاعات رنگ مكان يابي صورت در فضاي مركب و مختلط را آسان مي سازد
[4 , 8]. شكل 2-10 توضيح اجمالي از الگوريتم اين روش را بيان مي كند، اين شكل شامل دو قسمت اصلي مي باشد :1 ) مكان يابي صورت براي پيدا كردن نواحي كانديد صورت
2 ) تشخيص ويژگي هاي مربوط به صورت براي بررسي نواحي معين شده در مرحله قبل
شكل2-10: الگوريتم تشخيص صورت بر مبناي مكان يابي ويژگي هاي صورت
2-2-3 : جبران سازي نور و تشخيص رنگ و تن پوست
رنگ پوست نمايش داده شده در تصوير در اثر شرايط مختلف نوري تغيير مي كند. به منظور جبران اين پديده از سفيد مرجع[1] براي نرماليزه كردن رنگ استفاده مي شود. پيكسل هائي با 5% بالا ترين مقدار لوما[2] به عنوان سفيد مرجع در نظ گرفته مي شود، اگر تعداد اين پيكسل هاي سفيد مرجع از 100 بيشتر باشد. براي تنظيم اجزا R، G و B يك تصوير رنگي، پيكسل هاي سفيد مرجع به سطح خاكستري 255 مقياس مي گردند. براي مدل كردن رنگ پوست بايد فضاي رنگي مناسب و يك گروه مرتبط با رنگ پوست در اين فضا انتخاب شود. بر اساس مقايسه اي كه در مورد فضاهاي رنگي كاربردي در زمينه تشخيص صورت توسط Terrilon [9] صورت گرفته، در اين روش از فضاي رنگي ycbcr كه به طور گسترده در استاندارد هاي فشرده سازي ويديوئي كاربرد دارد، استفاده شده است. از آن جائي كه رنگ پوست به نور[3] وابسته مي باشد، در اين روش فضاي ycbcr به طور غير خطي تغيير داده شده تا فضاي رنگ مستقل از لوما را توليد كند. ديگر مزيت آن اين است كه باعث مي شود تا پوست هاي با رنگ تيره و روشن هم به طور كامل تشخيص داده شوند. از يك مدل بيضي پارامتري در زير فضاي رنگي cb , cr به عنوان مدلي براي رنگ پوست استفاده شده است. شكل 2-11 يك نمونه از تشخيص پوست با اين روش را نمايش مي دهد.
(ب) (الف)
(د) (ج)
شكل2-11 : (الف) تصوير با تن زرد؛ (ب) تصوير جبران سازي شده اثر نور؛
(ج) نواحي پوست تصوير الف؛ (د) واحي پوست تصوير ب.
2-2-4 : مكان يابي ويژگي هاي مربوط به صورت
در ميان ويژگي هاي مختلف صورت، چشم ها و دهان مناسب ترين خصيصه ها براي شناسائي و تخمين وضعت هاي سه بعدي مي باشند [10]. بيشتر روش هاي مكان يابي چشم و صورت [12 , 11] بر مبناي مدل مي باشند،اما اين روش قادر است كه مكان چشم ها، دهان و مرز صورت را بر مبناي مقاديري كه از عناصر فضاي رنگي يك تصوير استخراج مي كند به طور مستقيم مشخص مي كند.
آناليز عناصر رنگي[4] نشان مي دهد كه مقادير بالاي cb و پايين cr در اطراف چشم ها و مقادير بالاي cr در اطراف دهان پيدا مي شوند. علاوه بر اين، چشم ها معمولا حاوي تاريكترين و تيره ترين پيكسل ها در عنصر لوما مي باشند. بر مبناي اين مشاهدات، توابع مورفولوژيكي مقياس خاكستري مثل گسترش[5] و كاهش [6] براي تاكيد روي پيكسل هاي روشن تر و تاريك تر عنصر لوما در اطراف چشم ها به كار برده مي شوند [13]. اين توابع به منظور ساختن بردار هاي ويژگي براي يك صورت كامل در مقياس هاي مختلف صورت تمام رخ به كاربرده مي شود [14]. در الگوريتم تشخيص چشم، توابع گسترش و كاهش كه از يك عنصر نيم كره يا نيم دايره[7] با مقياس تخمين زده شده استفاده مي كند، براي ساختن نقشه چشم در حالت لوما به طور مستقل به كاربرده مي شوند. نقشه چشم در حالت رنگ از cb ، معكوس cr و نسبت cb/cr توليد مي شود. دو نقشه حاصله در هم ادغام شده و در نقشه نهائي همان طور كه در شكل2-12 نشان داده شده، دو چشم روشن تر نمايش داده مي شود و ديگر نواحي صورت تاريك مي باشد.
شكل 2-12 : پياده سازي مكان يابي چشم براي دو نمونه
سپس كانديد هاي چشم طي دو مرحله كه در ادامه شرح داده مي شود انتخاب مي گردند. مرحله اول شامل تجزيه هرمي نقشه گسترش يافته چشم براي مكان يابي هاي اشتباه و مرحله دوم شامل بستن[8] و آستانه گيري روي نقشه گسترش يافته براي مكان يابي هاي صحيح چشم مي باشد. ناحيه دهان شامل عنصر قرمز بيشتر و عنصر آبي كمتر نسبت به ديگر نواحي صورت مي باشد. از اين رو در ناحيه دهان عنصر cr از cb بزرگتر مي باشد. علاوه بر اين،لازم به ذكر است كه نسبت cr/cb در نزديك دهان كم تر و cr2 بالاتر مي باشد. بنابراين تفاوت بين cr2 و cr/cb مي تواند بر روي ناحيه دهان تاكيد داشته باشد. شكل 2-13 نقشه هاي مربوط به مكان يابي دهان تصوير نشان داده شده در شكل2-12 را نمايش مي دهد.
شكل2-13 : پياده سازي مكان يابي دهان براي دو نمونه
كانديد هاي چشم و دهان در زمينه سه گزينه زير مورد بررسي قرار مي گيرند :
1)تغييرات لوما در ناحيه چشم و دهان
2) محدوديت هاي جهت و هندسي مثلث دهان- چشم
3) وجود داشتن يك مرز اطراف مثلث دهان- چشم
در اين الگوريتم در ابتدا بر مبناي مكان كانديد هاي چشم – دهان يك نقشه مرز صورت در مولفه لوما ساخته مي شود. سپس تبديل Hough براي بيرون كشيدن مناسب ترين بيضي به كاربرده مي شود. اين بيضي متناسب با سنجش استفاده شده براي محاسبه وزن مثلث دهان – چشم مي باشد. شكل 2-14 نقشه مرزي را نشان مي دهد كه از اجزا اندازه و جهت گراديان لوما درون نواحي كه جهت هاي مثبت چرخش گراديان را دارا هستند ساخته مي شود. تبديل Hough براي تشخيص اشكال پارامتري مفيد مي باشد و كارائي آن به ابعاد جمع كننده بستگي دارد. يك بيضي در يك سطح داراي پنج پارامتر مي باشد :
1 ) زاويه چرخش
2،3 ) دو مولفه مختصات مركز
4،5 ) طول كوچكترين و بزرگترين محور.
ازآن جائي كه مكان چشم ها و دهان مشخص مي باشد، چرخش بيضي به وسيله جهت برداري كه از نقطه مياني بين چشم ها و دهان آغاز مي شود تخمين زده مي شود.
مكان مركز بيضي هم به وسيله مرز صورت تخمين زده مي شود. از اين رو، فقط يك جمع كننده دو بعدي براي يك بيضي در يك سطح مورد نياز مي باشد. بيضي هر كانديد مثلث دهان – چشم در ارتباط با نقشه دهان – چشم، جهت صورت در مقايسه با صورت هاي عمودي و نقشه متناسب با ويژگي هاي صورت مي باشد [15] .
شكل2-14 : مرز صورت و مثلث دهان- چشم
نتايج اجراي اين الگوريتم بر روي تصاوير HHI MPEG7 [16] و مجموعه تصاوير Champion Data [17] در سايت معرفي شده در مرجع ]18[ در دسترس مي باشد.
5-2-2 : نتايج
در اين روش يك الگوريتم تشخيص صورت براي تصاوير رنگي كه از يك مدل رنگ پوست و ويژگي هاي صورت استفاده مي كند به كاربرده شد. اين متد در ابتدا رنگ تصوير را به وسيله متد جديد جبران سازي نور كه به طور اتوماتيك پيكسل هاي سفيد مرجع را تخمين مي زند، تصحيح مي كند. در اين روش با استفاده از يك تبديل غير خطي در فضاي رنگي ycbcr بر تاثيرات لوما غلبه شده است. اين متد نواحي پوست را در كل تصوير مشخص نموده، سپس كانديدهاي صورت را بر مبناي روابط فضائي قطعات پوست ايجاد مي كند. اين الگوريتم نقشه هاي مرز، دهان و چشم را براي بررسي هر كدام از كانديد هاي صورت مي سازد. هدف اين روش اين است كه سيستم هائي را طراحي كند كه صورت ها و ويژگي هاي مربوط به صورت را تشخيص دهد و كاربران بتوانند صورت ها را ويرايش كرده و ويژگي هاي صورت را براي بازيابي آن به كار برند [18].
2-3: یک متد آماری برای تشخیص اجسام سه بعدی
مقدمه
دراین روش یک متد آماری برای اجسام سه بعدی شرح داده می شود.آمارها نتیجه هیستوگرام بوده و هر هیستوگرام آماری از یک زیر مجموعه از ضریب موج و مکان و موقعیت آنها روی جسم را نشان می دهد.این روش برای موارد استفاده هیستوگرامهای این چنینی تنوع عظیمی از خواص بصری را نشان می دهد.این روش اولین الگوریتمی است که می تواند صورت انسان را با چرخش تشخیص دهد و همچنین تشخیص ماشین ها از نقطه نظرهای مختلف را بررسی می کند.
2-3-1 : چکیده
تغییرات محیط احاطه شده در پروسه تشخیص اهمیت زیادی دارند.منابع نور در شدت، رنگ و موقعیتشان نسبت به جسم متنوع هستند.اطراف جسم ممکن است سایه ها را روی جسم پراکنده کند یا نورهای اضافی را روی جسم منعکس کند.
ظاهر جسم همچنین به ژست آن بستگی دارد،که همان موقعیت و جهت جسم نسبت به دوربین است.برای مثال نمای از جلووازکنار صورت یک انسان خیلی متفاوت است.
یک تشخیص دهندۀ[9] مناسب خود را با همه این موارد تطبیق داده وجسم را درهرموقعیتی که قرار بگیرد،تشخیص می دهد.
بدین منظور ازیک استراتژی دومرحله ای برای تشخیص استفاده شده است.برای از عهده برآمدن تنوع در ژست، از روشی که بر مبنای ظاهر[10] اجسام میباشد،استفاده شده است.دراین روش تشخیص دهنده هایی را که هر کدام مخصوص یک جهت خاصی از جسم هستند،با هم ادغام می شوند،که در بخش دو به تفضیل بیان می شود.سپس برای هر تشخیص دهنده از مدل آماری برای محاسبۀ باقی مانده ها استفاده می شود،که این مدل آماری هدف اصلی این روش است.
در قسمت 3 تابعی را که در همۀ تشخیص دهنده های مجری روش فوق استفاده می شود،به دست می آید.در قسمت 4 بیان میشود که چگونه آمارها برای تشخیص دهنده ها در زمینۀ چرخش عکس ها استفاده می شود.در قسمت 5 در مورد پیاده سازی بحث کرده و درقسمتهای 6 و7 صحت اجرای تشخیص دهنده های صورت و ماشین شرح داده شده است.
2-3-2 : تشخیص بر مبنای ظاهر
ما تشخیص دهنده های مختلفی را که هرکدام مخصوص جهت خاصی از جسم هستند را بررسی می کنیم.برای مثال،ما یک تشخیص دهنده خاص برای نمای نیم رخ راست[11] از صورت ها و یکی مخصوص نمای تمام رخ[12] داریم.این تشخیص دهنده ها به موازات هم به کار برده شده و نتایج حاصله با هم ترکیب می شود.
تعدادی جهت برای مدل کردن به صورت تجربی تعیین شده است.برای صورت دو تشخیص دهنده استفاده می شود:تمام رخ و نیم رخ راست.برای تشخیص نیم رخ چپ،تشخیص دهندۀ نیم رخ راست در آیینه ای که شکل های دریافتی را معکوس می کند قرار داده می شود.برای ماشین ها هشت تشخیص دهنده به کار برده می شود.دوباره برای تشخیص سمت چپ هفت مدل سمت راست در مقابل آیینه ای که معکوس می کند،قرار می گیرد.
شكل2-15 : نمونه هاي آموزشي جهت
شكل 2-16 : نمونه هاي آموزشي جهت
چون این تشخیص دهنده ها فقط برای تشخیص جسم در یک سایز مشخص در یک پنجره مستطیلی برنامه ریزی شده اند،برای تشخیص جسم درهرسایزی مکررأ عکس های دریافتی تغییر داده شده و عملیات روی آن دوباره اجرا می شود.
2-3-3 : قانون تصمیم آماری
هر تشخیص دهنده فرم یکسانی را برای قانون تصمیم آماری استفاده می کند و فقط به دلیل اینکه ازآمارهایی که از جهت های مختلف یک عکس جمع آوری شده اند،استفاده می کنند،متفاوتند.
برای هرتشخیص دهنده دو توزیع آماری مدل میشود.آمارهای اجسام داده شده با p(image|object) و آمارهای بقیه فضای عکس با p(image|non-object) نشان داده می شود.
سپس نسبت احتمال تخمین زده می شود:
نسبت احتمال مشابه قانون تصمیم بیز[13] است و اگر (P(image|object و image|non-object))P بدون خطا باشند،بهتر خواهد بود.
- reference white ↑
- اشعه گاما تصحيح شده غير خطي Luma : ↑
- Luminance ↑
- Chrominance Component ↑
- dilation ↑
- erosion ↑
- hemispheric structure elements ↑
- binary morphological closing ↑
- .object detector ↑
- . view_based approach ↑
- . view_based approach ↑
- . frontal views ↑
- . map decision bays ↑