یکی از نیازهای صنایع سنگ کشورمان دستگاه تشخیص و جداسازی سنگ های تزیینی است. این دستگاه باید قادر باشد با دریافت نوع های مختلف سنگ، الگوی بافتی آن ها را یادبگیرد و برای نمونه های شناخته نشده، دسته مناسب را تعیین کند
در این پروژه داده های خام، تصاویر سطح سنگ هستند باید با استفاده از مکانیزمی، ویژگی های بافت تصاویر را برای استفاده در دسته بندی استخراج کنیم یک تصویر چیزی نیست جز یک ماتریس که هر درایه آن توصیفگر یک سلول رزولوشن تصویر است.
مکانیزم مورد استفاده باید قادر باشد وابستگی های بین این سلول ها را به خوبی تصویر بکشد و انتزاعی مناسب از این ویژگی ها به دست دهد.
۱. مقدمه
تشخیص نوع و دسته بندی تصاویر، از پرکاربردی ترین مسائل در زمینه ی بینایی ماشین بوده که شامل دو مرحله اصلی استخراج خصوصیات تصویر و تشکیل مدل دسته بندی می باشد بافت تصویر از جمله ویژگی هایی است که در پردازش تصاویر و تشخیص الگو استفاده می شود.دسته بندی در حوزه ی یادگیری ماشین، با داده های برچسب دار در ارتباط است. این بدان معنی است که این داده ها در دسته بندی های متمایز قرار می گیرند و نمونه ی مجهول براساس ویژگی هایش در یک دسته بندی قرار میگیرد. بنابراین لازم است که براساس ویژگی های داده های آموزش مدلی بیابیم که خصوصیات یک نمونه مجهول را به عنوان ورودی دریافت نماید و برچسب آن را به عنوان خروجی ارائه دهد.
دسته بندی بافت سنگ ها یکی از مهمترین چالش های مسائل دسته بندی است. زیرا سنگ های طبیعی دارای بافت هایی کاملا مختلف هستند.از آنجا که سنگ های طبیعی به طور گسترده ای برای دکوراسیون استفاده می شوند، دسته بندی سنگ ها در زمینه های صنعتی بسیار مورد نیاز است .
۱.۱. شرح مساله
همانطور که پیشتر اشاره شد، کاربرد وسیع سنگ های طبیعی در صنعت و ضرورت دسته بندی سنگ ها بر اساس ویژگی های بافتی آنها موجب شده است تلاش هایی برای یافتن راه کار هایی جهت خودکار نمودن فرایند دسته بندی بدون حضور انسان صورت گیرد.
۱.۱.۱. هدف
هدف این پروژه، تعیین معدن سنگ برای نمونه های جدید با استفاده از ویژگی های بافتی آن ها است. در این پروژه نمونه هایی از 4 نوع سنگ متعلق به معادن مختلف مورد بررسی قرار میگیرند. همچنین سعی بر آن است که در راستای این هدف ویژگی های بافت تصاویر برای دسته بندی سنگ ها استخراج شود.
۱.۱.۲. داده ها
داده های خام، تصاویر سطح سنگ ها می باشد که در قسمت پیوند های مفید به عنوان مجموعه داده آموزشی قرار داده شده است.
۱.۱.۳. اصطلاحات
بافت :بافت را می توان به صورت یک تابع از تغییرات مکانی شدت روشنایی پیکسل ها تعریف نمود، بافت اندازه گیری میزان تغییرات هر سطح است که خصوصیاتی مانند همواری و نرمی زبری و منظم بودن هر سطح جهت وتفاوت های منظم را اندازه گیری می کند. تشخیص بافت در سیستم بینایی بشر به راحتی قابل تشخیص است اما در بینایی ماشین و پردازش تصویر پیچیدگی های خاص خود را دارد. استخراج بافت در پردازش تصویر و بینای ماشین دارای کاربردهای فراوانی است. از این کاربردها به مواردی نظیر تشخیص اشیا در تصاویر پزشکی و یا ردیابی اشیا در ویدئوها، تشخیص کیفیت در صنعت برای افزایش مرغوبیت کالاها، کنترل از راه دور نواحی زمین و تقسیم بندی نواحی زمین از نظر مواردی مانند آب ، اراضی کشاورزی و... می توان اشاره کرد.
سطوح تیرگی1 :مقداری است که به نمایندگی از میزان روشنایی یک پیکسل از سیاه تا سفید تعیین می گردد.این مقدار معمولا بین صفر (سفید) تا 255(سیاه) می باشد.
۱.۱.۴. محدودیت ها
یکی از محدودیت های موجود در این گونه مسایل این است که پردازش تصویر تنها با تصاویری از سطوح در ارتباط است، این در حالی است که سطوح یکسان ممکن است بافت هایشان هنگامی که تصاویری که در شرایط متفاوت از آنها گرفته می شود، با یکدیگر متفاوت باشند.با داشتن اطلاعات بیشتر از سطوح و تعداد تصاویر بیشتر ممکن است بتوان این محدودیت ها را رفع نمود[2].
۲. کارهای مرتبط
۲.۱. بافت های قابل تفکیک
ژولز 2مفهوم بافت را در زمینه ی تفکیک بافت ها مورد بررسی قرار داده است. او بر روی آماره های فضایی سطوح تیرگی تصویر تمرکز کرد. در ادامه به معرفی آماره های دسته اول3 و آماره های دسته دوم4 در تحلیل بافت پرداخته شده است.
آماره های دسته اول : این آماره ها شباهت مقدار تیرگی مشاهده شده در یک ناحیه تصادفی از تصویر را اندازه گیری می کنند. این آماره ها می توانند از هیستوگرامی از درجه ی تیرگی نقاط در تصویر محاسبه گردند. آماره های دسته اول به مقادیر تیرگی پیکسل ها بستگی دارد. اما به تعامل و همبستگی مقادیر پیکسل های مجاور وابسته نمی باشد. برای مثال ، میانگین درجه ی تیرگی در یک تصویر یک آماره ی دسته اول می باشد.
آماره های دسته ی دوم: این آماره ها میزان شباهت یک جفت پیکسل را اندازه گیری می کند که در نقاط انتهایی یک محور با طول تصادفی که بر مکانی خاص و با جهت یابی خاص بر روی تصویر قرار می گیرند[1].
ژولز دو بافتی را که آماره های دسته دوم یکسان هستند را غیر قابل تمایز توسط انسان دانست[11].اما نادرستی این حدس بعد ها توسط خود ژولز اثبات گردید[12] .این امر موجب شد که ژولز نظریه بافت واره ها 5 را مطرح کند تا غیرقابل تمیز بودن جفت بافت ها را شرح دهد.بافت واره ها رویداد های بصری (نظیر خاتمه 6 و بسته شدن 7)هستند که در فرایند تفکیک بافت حضور دارند.خاتمه ها در واقع نقاط انتهایی خطوط یا گوشه ها می باشند.ژولز ملاحظه کرد که تمیز دادن بافت توسط انسان را می توان با تراکم مرتبه اول از بافت واره ها مدل کرد[13].
در (تصویر 1)، بر اساس نظریه بافت واره ها ، ناحیه ی سمت راست بالای بافت a از بافت پس زمینه قابل تفکیک است زیرا عناصر در تعداد خطوط انتهایی متفاوت هستند .اما همان ناحیه در بافت b قابل تمایز نیست زیرا هر دو المان دارای تعداد خطوط انتهایی یکسانی هستند[10].
به تشخیص نواحی تصویر با استفاده از ویژگی های بافت ،دسته بندی بافت گفته می شود.هدف از دسته بندی بافت به دست آوردن یک نقشه می باشد که تصاویر مختلفی را به عنوان ورودی دریافت می کند و دسته ی آنها را تعیین می نماید.
اگر قادر به تعیین دسته ی بافت های موجود در تصویر نباشیم اما بتوانیم مرز بافت ها را مشخص کنیم با دسته ی دیگری از مسائل به نام قطعه بندی بافت 8 مواجه می شویم.هدف از قطعه بندی تصویر به دست آوردن نقشه ای است که از طریق آن مرزبافت ها به خوبی مشخص گردد[2].
۲.۲. روش های تحلیل بافت
اولین مرحله در راستای ایجاد یک مدل ریاضی برای بافت، تشخیص جنبه های درک شده در یک تصویر است. معمولا بافت توسط تغییرات دو بعدی در تصویر مشخص می شود.
بافت تصویر دارای تعدادی ادراکات است که نقش مهمی را در توصیف بافت ایفا می کنند. بعضی از ویژگی هایی که در توصیف بافت بسیار مؤثر می باشند،عبارتنداز:
یکنواختی، تراکم، زبری، سفتی، نظم، خطی بودن، جهت دار بودن، فرکانس و فاز. بنابراین به دلیل ابعاد گسترده مفهوم بافت، تنها یک روش برای ارائه و مشخص کردن بافت کافی نیست.
اکثر تحلیل های بافت را می توان به چهاردسته ی روش های آماری، روشهای ساختاری یا هندسی، روشهای تبدیلی و روشهای مبتنی بر مدل، تقسیم کرد که در ادامه به شرح آن ها پرداخته شده است.
۲.۲.۱. روش های آماری
اطلاعات مربوط به بافت از خصوصیات آماری پیکسل ها استخراج می شود ، که از جمله اولین روشهای استخراج بافت هستند. یکی از ویژگی های کیفی بافت، توزیع فضایی مقدار تیرگی است. وابستگی فضایی سطوح تیرگی، ویژگی های وابسته به آماره های دسته ی دوم تصویر را تخمین می زند.در همین راستا ما از مجموعه زیر برای معادل سازی یک تصویر N\times N با سطح تیرگی G استفاده می کنیم:
ماتریس تکرار9
درایه ی ( i,j ) از ماتریس تکرار سطوح تیرگی G\times G با نام { p }_{ d } برای بردار d=({ { d }_{ x },d }_{ y }) ، برابر با تعداد تکرار جفت مقادیر i و j با فاصله d در سطوح تیرگی تصویر است.
در (تصویر 2) نمونه ای از ایجاد ماتریس تکرار سطوح تیرگی را مشاهده می کنید:
ماتریس تکرار متقارن نیست ، اما اگر ماتریس p را به گونه ای تعریف کنیم که { p }_{ d }+{ p }_{ -d } برقرار باشد ، می توان به یک ماتریس متقارن دست یافت.
هارالیک برای اولین باراستفاده از ماتریس تکرار را پیشنهاد داد که امروزه از پر استفاده ترین روش های استخراج ویژگی های بافتی محسوب می شود. او تعدادی ویژگی بافتی مفید نظیر زاویه، کنتراست، میانگین واریانس و … معرفی کرد که این ویژگی ها از ماتریس تکرار قابل محاسبه می باشند.اما آنها در فواصل مختلف در جهت های مختلف هستند.این فرایند پیچیدگی محاسباتی و زمانی را افزایش می دهد. حتی اگر تمام ویژگی های مورد استفاده قرار گیرند ، نرخ طبقه بندی صحیح می تواند به 60-70٪ برسد[14]که این مقدار توانست با تمرکز تنها بر روی سطوح تیرگی تصاویر به 80% برسد[15] .ویژگی های بافتی که به وسیله ی ماتریس تکرار به دست می آیند، در مسائل جداسازی بافت های تصویر کاربردی نداشته و بیشتر در زمینه ی دسته بندی استفاده می شود[1].
روش بردار اختلاف سطوح تیرگی(Gray-Level Difference Vector;GLDV ) :
این روش تابع چگالی احتمال را برای اختلافات مقادیر تابع در موقعیت های با فضای d پیکسل دورتر و با زاویه ی s تخمین می زند. اندازه گیری های بافت حاصل بر اساس آماره های دسته ی اول می باشد. در حالی که اندازه گیری های حاصل در روش ماتریس تکرار بر اساس آماره های دسته ی دوم می باشد [4].
ویژگی های مربوط به همبستگی [^Auto-correlation Features]:
تابع همبستگی یک تصویر برای دستیابی به میزان نظم و نیز نرمی و سختی بافت های موجود در تصویر به کار برده می شود. تابع همبستگی تصویر (I(x,y به شکل زیر تعریف می شود:
همچنین تابع همبستگی به طیف توان سری فوریه وابسته است. روش های جدید که از این ویژگی های طیفی استفاده می کنند، دامنه فرکانس را در حوزه ی فرکانس، به حلقه ها و در حوزه ی جهت، به محورها تقسیم می کند. بنا براین در حوزه ی فرکانس، انرژی کل به حلقه ها تقسیم می شود و هرکدام از نواحی به عنوان ویژگی های بافتی محاسبه می شوند.
الگوی دودویی محلی 10
طرز کار عملگر الگوی دودویی محلی به این صورت است که برای مثال در شکل زیر 8 همسایگی روی عملگر را با پیکسل مرکزی مقایسه می کنند.هر یک از این هشت پیکسل همسایه اگر مقدارش از مقدار پیکسل مرکزی بزرگتر یا مساوی باشد،با 1 جایگزین می شوند. در غیر این صورت مقدار آنها صفر خواهد بود. در پایان پیکسل مرکزی با جمع وزن دار باینری پیکسل ها ی همسایه جایگزین می شود و سپس این کار برای سایر پیکسل ها مجدد تکرار می شود.با به دست آوردن هیستوگرام از این مقادیر ،توصیف کننده ای برای بافت تصویر حاصل می گردد.
۲.۲.۲. روش های هندسی
بافت بر اساس ترکیبی از ساختارهای اولیه بافت شامل اپراتور مورفولوژیک و گراف همجواری، که براساس قوانینی تعریف شده اند شناخته می شود. این روش برای بافت های با ساختار منظم و ویژه مانند ساختارهای با خطوط موازی افقی یا عمودی مناسب است ولی برای بافت های نامنظم روش بهینه ای نیست و بیشتر برای ترکیب بافت استفاده می شوند تا تحلیل آن. روش های هندسی با وجود اینکه تعریف دقیقی از بافت ارائه می دهند، از بازده مناسبی برخوردار نیستند.
روش موزاییک بندی ورونوی ( voronoi )
یکی ازروش های موجود این است که هر یک از تصاویر به تصاویر موزائیکی تبدیل می شود. در این روش، اشکال از مناطق کوچک درتصویر موزاییک با استفاده از نمودار ورونی تقریب زده می شود. در این نمودار به هر مجموعهای از نقاط ناحیهای اختصاص داده میشود. این نواحی سلولهای ورونوی نامیده میشود. برای یک مجموعه از نقاط نمودار ورونوی سطح را به مناطقی تقسیم بندی میکند که برای هر نقطه از مجموعه نقاط یک منطقه تعریف میشود. به طوری که تمام نقاط این منطقه به نقطه تولید کننده آن منطقه نزدیکتر میباشد.تصویر موزاییک به طور خودکار با ایجاد تولید نمودار بهینه ورونی به طوری که خطای بین تصویر اصلی و تصویر حاصل تا جایی که ممکن است کوچک می شود.ویژگی های هندسی چند ضلعی های ورونوی به عنوان ویژگی های بافت مورد استفاده قرار می گیرند[5].
۲.۲.۳. روش های تبدیلی و پردازشی
در این روش ها تصویر به فرم جدید تبدیل می شود به طوری که بافت در این فضای جدید راحت تر قابل تشخیص باشد. این روش ها سعی می کنند تا ویژگی های معینی از تصاویر فیلتر شده را برای کاربردهای طبقه بندی یا تقسیم بندی محاسبه کنند. انواع زیادی از روشهای استخراج ویژگی بر پایه پردازش سیگنال از قبیل ویژگی های تامورا، تبدیل موژک و غیره است که مبتنی بر اعمال فیلتر بر روی تصویر می باشند.
۲.۲.۴. روش های مبتنی بر مدل
روشهای مبتنی بر مدل، به مدل سازی بافت می پردازند و شامل روش خود بازگشت یا AR مدل گوسی مارکوف یا RMF و مدل Gibbs RMF می شوند. در این روش مدلی از تصویر ایجاد می شود و سپس از این مدل برای توصیف سنتز تصویر استفاده می شود. پارامترهای مدل ویژگی های کیفی اساسی بافت را استخراج می کنند[3].
مدل خود بازگشت 11 :
مدل خودبازگشت فرض می کند که یک تعامل محلی بین پیکسل های تصویر در آن شدت پیکسل ، مجموع وزن دار شدت پیکسل های همسایه می باشد[6].مدل فیلد های تصادفی 12 :
این مدل یک فرایند احتمالاتی است که در آن همه تعاملات محلی می باشد. احتمال این که یک سلول در حالت داده شده می باشد، به طور کامل توسط احتمال های حالت سلول های همسایه تعیین می شود. تعامل مستقیم تنها بین همسایگان بلافاصل رخ می دهد[6].
۲.۳. روش های دسته بندی
دسته بندی به عملیات یادگیری تابع f گفته می شود که هر مجموعه ویژگی x را به یکی از دسته های از پیش تعریف شده ی y نگاشت می دهد. به این تابع مدل دسته بندی نیز می گویند که شامل مدل های توصیفی و مدل های پیشگویانه می باشد. مدل توصیفی، مدلی است که به عنوان ابزار توضیحی برای تشخیص اشیا از دسته های مختلف به کار می رود و مدل پیشگویانه به مدلی گفته می شود که می تواند برچسب دسته یک رکورد شناخته نشده را تخمین زند.روش های دسته بندی برای ساخت مدل های دسته بندی از مجموعه های داده ای به می روند.این روش ها دارای یک الگوریتم یادگیری برای توصیف مدل می باشند.مدلی ساخته شده به وسیله ی این الگوریتم ها باید داده های ورودی را به خوبی تطبیق دهد و بتواند برچسب رکورد هایی را که تا کنون ندیده است، تخمین زند. به این منظور ابتدا یک مجموعه آموزش که شامل داده های با برچسب معین است فراهم می شود ،سپس از این مجموعه یک مدل دسته بندی تهییه می گردد.این مدل به مجموعه ی آزمون که شامل داده های با برچسب نا مشخص است، اعمال می شود. کارایی این مدل دسته بندی با بررسی تعداد تخمین های درست و غلطی که توسط مدل صورت گرفته ارزیابی می شود. در ادامه به معرفی دو روش مهم دسته بندی اشاره شده است :
۲.۳.۱. درخت تصمیم
درخت تصمیم یک ابزار برای پشتیبانی از تصمیم است که از درختان برای مدل کردن استفاده میکند. در آنالیز تصمیم، یک درخت تصمیم به عنوان ابزاری برای به تصویر کشیدن و آنالیز تصمیم، در جایی که مقادیر مورد انتظار از رقابتها متناوباً محاسبه میشود، استفاده میگردد. یک درخت تصمیم دارای سه نوع گره است:
گره تصمیم: به طور معمول با مربع نشان داده میشود.
گره تصادفی: با دایره مشخص میشود.
گره پایانی: با مثلث مشخص میشود.
مربع نشان دهنده تصمیم، بیضی نشان دهنده فعالیت و لوزی نشان دهنده نتیجه است. در (تصویر 4) نمونه ای از یک درخت تصمیم نشان داده شده است:
در (تصویر5) نمونه ای از یک درخت تصمیم برای یک مجموعه داده آموزش نشان داده شده است:
مشکل استفاده از درختهای تصمیم آن است که به صورت نمایی با بزرگ شدن مسئله بزرگ میشوند. همچنین اکثر درختهای تصمیم تنها از یک ویژگی برای شاخه زدن در گرهها استفاده میکنند در صورتی که ممکن است ویژگی ها دارای توزیع توأم باشند. ساخت درخت تصمیم در برنامههای داده کاوی حافظه زیادی را مصرف میکند زیرا برای هر گره باید معیار کارایی برای ویژگیهای مختلف را ذخیره کند تا بتواند بهترین ویژگی را انتخاب کند [7]. با این حال می توان با استفاده از الگوریتم هایی درخت تصمیم بهینه ای در بازه ی زمانی قابل قبولی تشکیل داد.از انواع این الگوریتم ها می توان به الگوریتم هانت13 ID3,C4.5, CART, SPRINT اشاره کرد که در ادامه به معرفی الگوریتم هانت می پردازیم.
الگوریتم هانت :
دراین الگوریتم یک درخت تصمیم گیری با یک روند بازگشتی با جداسازی داده های آموزش به زیر مجموعه هایی که به طور پی در پی خالص تر می شوند، توسعه می یابد.
فرض کنید که { D }_{ t } مجموعه داده های آموزشی باشد که می خواهیم در رابطه با قرار گرفتن یک مقدار از آن در گره t ام تصمیم گیری کنیم.
اگر { D }_{ t } شامل رکوردهایی باشد که متعلق به کلاس یکسان { y }_{ t ) هستتند، آنگاه t یک گره برگ است که با { y }_{ t } برچسب گذاری می شود.
اگر { D }_{ t } یک مجموعه ی خالی باشد، آنگاه t یک گره برگ با یک مقدار پیش فرض برای کلاس { y }_{ d } برچسب گذاری می شود.
اگر { D }_{ t } شامل رکوردهایی باشد که متعلق به بیش از یک کلاسند، یک صفت را برای جداسازی داده ها به زیرمجموعه هایی کوچکتر تست می کنیم. و برای هر زیر مجموعه رویه را به صورت بازگستی به کار می گیریم[8].
۲.۳.۲. ماشین بردار پشتیبانی ( Support Vector Machine; SVM )
هدف این دسته الگوریتم ها تشخیص و متمایز کردن الگوهای پیچیده در داده ها (از طریق کالسترینگ، دسته بندی، رنکینگ، پاکسازی و غیره)می باشد. مبنای کاری دسته بندی SVM دسته بندی خطی داده ها است و در تقسیم خطی داده ها سعی می شود خطی را انتخاب کنیم که حاشیه اطمینان بیشتری داشته باشد.اگر داده های آموزشی جدایی پذیر خطی باشند، می توان دو ابر صفحه در حاشیه نقاط در نظر گرفت؛ به طوری که هیچ نقطه مشترکی نداشته باشند. سپس می بایست فاصله آنها را به حداکثر رساند. نزدیکترین داده های آموزشی به ابر صفحه های جدا کننده بردارپشتیبان نامیده می شوند.
در (تصویر 7) ، دو دسته از داده های آموزش به وسیله ی یک ابر صفحه دسته بندی شده اند.
در مسایلی که داده ها بصورت خطی جداپذیر نباشند داده ها به فضای با ابعاد بیشتر نگاشت پیدا میکنند تا بتوان آنها را در این فضای جدید بصورت خطی جدا نمود[9] .
۳. آزمایشها
در این بخش به پیاده سازی برخی از روش های اشاره شده در بخش های قبلی پرداخته شده است.نحوه ی پیاده سازی از طریق این لینک در گیت هاب قابل مشاهده است.
۳.۱. داده ها :
همان طور که در بخش اول اشاره شد ،داده های خام، تصاویر سطح سنگ ها می باشد که در قسمت پیوند های مفید به عنوان مجموعه داده آموزشی قرار داده شده است.تعداد تصاویر 148 تا می باشد که هرکدام حدود 60 کیلو بایت می باشد. این تصاویر متعلق به چهار نوع سنگ به نام های a,b,c,d می باشند.بنابراین برای هر نوع سنگ 37 تصویر در نظر گرفته شده است.این تصاویر رنگی می باشند.برای آزمایش از هر نوع سنگ 10 تصویر جهت آموزش و 27 تصویر دیگر به عنوان داده ی جدید جهت آزمودن دقت روش به کار رفته ، مورد استفاده قرار گرفته شده است.
۳.۲. پیش پردازش:
برای پیاده سازی روش ماتریس تکرار جهت استخراج ویژگی های بافت به وسیله ی ماتریس تکرار لازم است سطوح تیرگی تصاویر (یا به اصطلاح حالت سیاه سفید تصاویر) را به دست آوریم.
۳.۳. استخراج ویژگی ها :
در این مرحله با به دست آوردن ماتریس تکرار سطوح تیرگی ، ویژگی هایی همچون عدم تجانس 14 ،همبستگی 15 و گشتاور زاویه ای مرتبه دوم16 قابل استخراج هستند.
۳.۴. دسته بندی:
پس از استخراج ویژگی های ذکر شده ، می توان ابزار طبقه بندی 17 مورد نظر خود را تربیت نمود . در این آزمایش از درخت تصمیم و ماشین بردار پشتیبانی که در بخش 2 به شرح آنها پرداخته شد ،استفاده شده است.
در این آزمایش ، با در نظر گرفتن هر یک از ویژگی های عدم تجانس،همبستگی و گشتاور جهت تربیت ابزار دسته بندی به طور جداگانه ، داده های جدید دسته بندی می شوند و دقت هرکدام برای دسته بندی مورد بررسی قرار می گیرند. سپس نتیجه را برای ترکیب هر سه ویژگی بررسی می کنیم.دقت ها با فرمول زیر محاسبه شده اند، به طوری که incorrect تعداد نمونه هایی است که در دسته ی نادرست قرار داده شده اند.totaltest تعداد کل نمونه های آزمون است.
۳.۴.۱. عدم تجانس:
در این مرحله ابزار دسته بندی فقط با میزان عدم تجانس مورد تربیت قرار می گیرد.بنابراین با روش دسته بندی درخت تصمیم و svm به ترتیب به دقت 81.48% و 73.14%دست یافتیم .
۳.۴.۲. همبستگی:
به طور مشابه،در این مرحله ابزار دسته بندی فقط با میزان همبستگی مورد تربیت قرار می گیرد.بنابراین با روش دسته بندی درخت تصمیم و svm به ترتیب به دقت 48.14% و 45.37%دست یافتیم .
۳.۴.۳. گشتاور زاویه ای مرتبه دوم:
در این مرحله نیز ابزار دسته بندی فقط با میزان گشتاور زاویه ای مرتبه دوم مورد تربیت قرار می گیرد.بنابراین با روش دسته بندی درخت تصمیم و svm به ترتیب به دقت 66.66% و 53.70%دست یافتیم .
۳.۴.۴. ترکیب هر سه ویژگی:
در این مرحله ابزار دسته بندی با هر سه ویژگی مورد تربیت قرار می گیرد.بنابراین با روش دسته بندی درخت تصمیم و svm به ترتیب به دقت 84.25% و 82.40%دست یافتیم .
در (تصویر8) نمودار ویژگی های ماتریس تکرار سطوح تیرگی برای داده های آموزشی مربوط به هر چهار نوع سنگ می باشد.همان طور که مشاهده می کنید ،میزان ویژگی های داده های آموزشی مربوط به هر نوع از سنگ ها تقریبا در یک محدوده قرار دارند و متراکم می باشند.
ویژگی گشتاور زاویه ای مرتبه دوم برای گونه های a و d مشابه است و در یک محدوده قرار میگیرند(به نقاط قرمز رنگ برای a و d توجه شود).این ویژگی برای گونه های c و b نیز مشابه است اما با گونه های a و d متفاوت است.بنابراین می توان از گشتاور زاویه ای مرتبه دوم برای جدا نمودن گوه های a,d از b,c استفاده نمود.ویژگی همبستگی برای تشخیص گونه ی a از سایر گونه ها مناسب است (به نقاط آبی رنک برای a و ارتباط آن با سایر نقاط آبی برای گونه های دیگر توجه شود.)ویژگی عدم تجانس به دلیل اینکه برای هر گونه محدوده ی مشخصی دارد و این محدوده با محدوده ی سایر گونه ها هم پوشانی کمی دارد ، برای تفکیک گونه ها می تواند مناسب باشد(به محدوده ی نقاط سبز رنگ برای هر گونه توجه شود.)
این تحلیل ها که از بررسی نمودار فوق به راحتی قابل دستیابی هستند، دقت های به دست آمده در مراحل ذکر شده را توجیح میکنند.برای نمونه همانطور که از نمودار برداشت شد، ویژگی عدم تجانس برای تفکیک هر چهار نوع سنگ ،مناسب است.دقت دسته بندی با این ویژگی نیز همان گونه که در بخش قبل اشاره شد،نسبت به سایر ویژگی ها مناسب تر است.
اما با توجه به نتایج آزمایش ها ترکیب هر سه ویژگی جهت تربیت ابزار دسته بندی و تفکیک گونه ها از یکدیگر ،روشی دقیق تر می باشد.
در دو تصویر فوق پراکندگی 148 سنگ موجود در مجموعه داده ها بر اساس سه ویژگی عدم تجانس ، گشتاور زاویه ای مرتبه دوم و همبستگی قابل مشاهده است،
بر اساس نمودار سه نمونه از گونه ی d در محدوده ی عدم تجانس گونه ی c قرار گرفته است.همچنین یک نمونه از گونه ی c در محدوده ی عدم تجانس گونه ی b قرار گرفته است.به طور مشابه نمونه های دیگری از قرار گرفتن سنگ ها در محدوده ی ویژگی های مربوط به یک گونه ی نادرست در این دو نمودار قابل مشاهده است، این همپوشانی ها موجب بروز خطا در امر دسته بندی می گرددند.لذا در مراحل آینده سعی می شود این هم پوشانی ها کاهش یافته و دقت دسته بندی را افزایش یابد.
۴. تکمیل آزمایش ها
در این مرحله قصد داریم به آزمایش روش الگوی دودویی محلی که در بخش 2 توضیح داده شد ،بپردازیم.
۴.۱. داده ها :
داده های آموزش و آزمون به همان صورت که پیشتر توضیح داده شد می باشند.
۴.۲. پیش پردازش:
با توجه به توضیحاتی که پیش از این در رابطه با نحوه ی عملکرد عملگر الگوهای دودویی محلی داده شد، لازم است ابتدا سطوح تیرگی تصاویر (یا به اصطلاح حالت سیاه سفید تصاویر) را به دست آوریم.
۴.۳. استخراج ویژگی ها :
ابتدا لازم است برای داده های آزمایش الگوهای دودویی محلی را استخراج کنیم و سپس با استفاده از آنها هیستوگرامی برای هر یک از آنها به دست آوریم تا به وسیله ی این هیستوگرام ها عمل دسته بندی را انجام دهیم.
در (تصویر 11) نمونه ای از هیستوگرام های حاصل از 4 نوع سنگ قابل مشاهده هستند:
همان طور که مشاهده می کنید، هیستوگرام نوع a و d بسیار مشابه هم هستند.هیستوگرام b و c نیز مشابه هم هستند اما در قسمت هایی تفاوت هایی دارند.
۴.۴. دسته بندی:
پس از استخراج ویژگی های ذکر شده ، می توان ابزار طبقه بندی مورد نظر خود را تربیت نمود . در این آزمایش نیز از درخت تصمیم و ماشین بردار پشتیبانی که در بخش 2 به شرح آنها پرداخته شد ،استفاده شده است.
دقت این آزمایش با دسته بندی به روش درخت تصمیم 80.55% و با دسته بندی به روش ماشین بردار پشتیبانی 83.33% می باشد.این دقت ها همانند آزمایش قبلی محاسبه شده اند.
(تصویر 12) بخشی از نتایج آزمایش است .همان طور که مشاهده می کنید خطا هایی که در دسته بندی رخ داده است بیشتر مربوط به گونه ی a و d می باشد و همان طور که در قسمت پیش اشاره شد ، این خطا ها به دلیل شباهت بسیار هیستوگرام های گونه ی a و d می باشد.
۵. بهبود نتایج
در این بخش سعی بر این است که نتایج مراحل قبل را بهبود بخشیم.
یکی از روش های رایج برای بهبود نتایج دسته بندی بر اساس ویژگی های بافتی تصاویر ، اعمال فیلتر گابور18 می باشد.فیلتر گابور یک فیلتر خطی می باشد که برای تشخیص لبه ها استفاده می شود. این فیلتر برای نمایش بافت و تمایز آنها مناسب است.تجزیه و تحلیل تصویر با فیلتر گابور شبیه به سیستم ادراک بصری انسان می باشد.[16]
در (تصویر 13) تصاویر 4 نوع سنگ را که فیلتر گابور روی آنها اعمال شده است مشاهده می کنیم .
با اعمال فیلتر گابور و سپس استخراج ماتریس تکرار و الگو های دودویی محلی و هیستوگرام حاصل از آنها می توان به دقت بهتری دست یافت . در جدول زیر مقایسه ی نتایج بدون فیلتر و با فیلتر گابور امکان پذیر است:
همچنین در (تصویر 15) لیستی از نمونه هایی که با اعمال فیلتر گابور در روش ماتریس تکرار با استفاده از درخت تصمیم گیری به درستی تشخیص داده نشده اند را مشاهده می کنید. اعدادی که در کنار حروف نشان داده شده اند شماره ی تصویر در مجموعه داده ها را بیان می کنند.
ا توجه به دو تصویر بالا ، دقت 91.3% به این معناست که تنها 10 مورد از 108 مورد آزمون به درستی دسته بندی نشده است که این در 10 مورد بیشتر مربوط به گونه های a و c می باشد.در واقع با اعمال این فیلتر، شباهت هایی در ویژگی های بافتی گونه ها تا حد مناسبی کاهش یافته و عمل دسته بندی با دقت بهتری صورت گرفته است. جهت یادآوری شباهت های ذکر شده به طور مفصل می توانید مجددا به توضیحات تصاویر 8 و 11 مراجعه فرمایید.
۶. کارهای آینده
می دانیم که یکی از مهمترین ویژگی های سنگ ها که می تواند برای دسته بندی آنها در نظر گرفته شود، رنگ این سنگ ها می باشد.بدین منظور می توان روش ماتریس تکرار را به گونه ای اصلاح کرد که بتوان ویژگی های بافتی رنگی تصاویر سنگ ها را استخراج کرد.به چنین ماتریسی ماتریس تکرار سطوح رنگی 19می گویند[17] .همچنین می توان ترکیب طبقه بند ها را مورد بررسی قرار داد.به این معنا که اطلاعاتی که به وسیله ی توصیف گر های بصری مختلف از تصاویر استخراج می شوند ، با هم ترکیب شوند.این امر موجب می شوند که عمل دسته بندی با دقت و سرعت بهتری انجام شود.[18].
۷. مراجع
[1] ر.مسعودی، تشخیص نوع سنگهای تزئینی با استفاده از ویژگیهای بافت آنها، پایاننامه کارشناسی، دانشگاه علم و صنعت ایران، ۱۳۹۱ دریافت
[2] Petrou, M. & Sevilla, P.G. (2006). Image Processing: Dealing With Texture. West Sussex, England: John Wiley & Sons Ltd.
[3]Li X, Chen S, Shyu M and Furht B, An Effective Content-Based Visual Image Retrieval System, in 26th IEEE Computer Society International Computer Software and Applications Conference (COMPSAC), Oxford, 2002, pp. 914- 919.
[4]Nahid Khazenie,University Corporation for Atmospheric Research and Boulder, CO 80301, Kim Richardson,Naval Research Laboratory, Monterey, CA 93943-5006,Comparison of Texture Analysis Techniques in Both Frequency and Spatial Domains for Cloud Feature Extraction.
[5]Yoshinori Dobashi, Toshiyuki Haga, Henry Johan, Tomoyuki Nishita,A Method for Creating Mosaic Images Using Voronoi Diagrams.
[6]A. Materka, M. Strzelecki, Texture Analysis Methods – A Review, Technical University of Lodz, Institute of Electronics, COST B11 report, Brussels 1998.
[7]Y. Yuan and M.J. Shaw, Induction of fuzzy decision trees.Fuzzy Sets and Systems 69 (1995), pp. 125–139.
[8] Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to Data Mining,Pearson Education,2006.
[9]Christopher J. C. Burges. A Tutorial on Support Vector Machines for Pattern Recognition. Data Mining and Knowledge Discovery 2:121 - 167, 1998.
[10]JAMES ENNS,Seeing textons in context,Dalhousie University, Halifax, Nova Scotia, Canada
[11]B. Julesz. Visual Pattern Discrimination. _IRE Transactions on Information Theory, 8:84-92, 1962.
[12]B. Julesz, E. N. Gilbert, L. A. Shepp, and H. L. Frisch. Inability of Humans to Discriminate between Visual Textures that Agree in Second-order Statistics- revisited". Perception, 2:391-405, 1973.
[13]B. Julesz. Textons, the Elements of Texture Perception, and their Interactions. Nature, 290:91-97, March 1981.
[14]Haralick, R.M., Shanmugam, L., Dinstein, Textural features for image classification, IEEE Trans. Systems, Manufact, Cybernet., Vol. 3, Issue 6, pp. 610-621, 1973.
[15]M. Partio, B. Cramariuc, M. Gabbouj, and A. Visa, “Rock texture retrieval using gray level co-occurrence matrix” Norsig2002, Oct 2002.
[16]J. G. Daugman. Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters. Journal of the Optical Society of America A, 2(7):1160–1169, July 1985.
[17]Miroslav Benco, Robert Hudec, Patrik Kamencay, Martina Zachariasova and Slavomir Matuska.# An Advanced Approach to Extraction of Colour Texture Features Based on GLCM.University of Zilina.Zilina.slovakia,May 2014.
[18]Leana Lepisto.Colour and texture based classificatio of rock images using classifier combinations.Tampare University of Technology,April 2006.
پیوندهای مفید
Gray-level
Julesz
First-Order Statistics
Second-Order Statistics
Textones
Termination
Closure
Texture segmentation
Co-occurrence matrix
Local Binary Patterns
Autoregressive (AR) model
Markov random fields
Hunt's algorithm
Dissimilarity
Correlation
Angular Second Moment
Classifier
Gabor
Colour-level Co-ocuurance Matrices