در این پروژه باید سامانه‌ای را توسعه دهید که با یادگیری ویژگی‌های اسکن مغزی بیماران مبتلا به اسکیزوفرنی، قادر باشد تا این بیماری را از روی ویژگی‌های استخراج شده از تصویر اسکن مغزی، تشخیص دهد.
مجموعه داده و نحوه ارزیابی پروژه خود را می‌توانید از این مسابقه دریافت کنید.

۱. مقدمه

اسکیزوفرنی یک اختلال روحی است که در حدود یک نفر در هر صد نفر به آن مبتلا می شوند. این بیماری دربین مردها و زنان به یک اندازه شایع است و در جوامع شهری و بین گروه های اقلیت بیشتر مشاهده شده است. قبل از سن 15 سالگی بسیار نادر است اما در هر سنی پس از آن رخ می دهد و بیشتر در سنین 15 تا 35 سالگی مشاهده شده است.
ازجمله نشانه های این بیماری، افکار پریشان، اختلالات فکری، رفتارهای عجیب و غریب، پارانویا (هذیان گویی شدید)، توهم بزرگی و عظمت و توهم از نوع شنوایی می باشد [1] .
ازآنجا که در این بیماری، تشخیص به موقع، میزان بهبودی و زنده ماندن بیماران را بهبود می بخشد، بنابراین پردازش تصویر به عنوان یک ابزار تصمیم گیرنده می تواند پزشکان را در تشخیص اولیه کمک کند. تصاویر پزشکی وضعیت بدن را به صورت دو بعدی و حتی سه بعدی(به وسیله کامپیوتر) نشان می دهند، از این رو پردازش تصویر و کاربرد آن در تشخیص بیماری ها از جمله اسکیزوفرنی اهمیت فراوانی دارد.
پردازش تصویر روشی برای تبدیل یک تصویر به صورت دیجیتال و انجام برخی از عملیات ها بر روی آن، به منظور دریافت یک تصویر بهبود یافته و یا برای استخراج برخی از اطلاعات مفید از آن است. معنای دقیق تر آن عبارت است از هر نوع پردازش سیگنال که ورودی یک تصویر است و خروجی پردازشگر تصویر می تواند یک تصویر یا یک مجموعه از نشانهای ویژه یا متغیرهای مربوط به تصویر باشد. اغلب تکنیک های پردازش تصویر شامل برخورد با تصویر به عنوان یک سیگنال دو بعدی و به کار بستن تکنیک های استاندارد پردازش سیگنال روی آن ها می باشد [2] .
یکی از سیستم های تصویربرداری ام آر آی می باشد، اما تصاویر حاصل به صورت خام قابل استفاده نیستند، لذا پردازش های وسیع و گسترده ای روی آن ها صورت می گیرد که شامل پردازش تصاویر و استخراج اطلاعات موثر در تشخیص و یافتن مواضع مورد توجه، بازسازی تصاویر در کامپیوتر به صورت سه بعدی و درون یابی اطلاعات جهت تولید برش های لازم از ارگان تحت تصویربرداری، حذف نویز، اختصاص رنگ و ارتقاء کیفیت تصویر می باشد.
اهداف پردازش تصویر :
• بهبود اطلاعات تصویر برای استفاده انسان
• پردازش داده های تصویر برای ادراک ماشین

شکل1 -مراحل اصلی در پردازش تصاویر دیجیتال[3]

مرحله ی پیش پردازش : پس از تصویربرداری (به دست آوردن ماتریس تصویر) که توسط حسگر مناسب و مبدل آنالوگ به دیجیتال انجام می شود ، پیش پردازش انجام می شود. هدف اصلی بهبود تصویر است به عنوان مثال حذف نویز از داده های تصویری در این مرحله انجام می شود.
مرحله ی بخش بندی : خروجی مرحلة بخش بندی، مرز یک ناحیه و یا تمام نقاط درون یک ناحیه است.
• نمایش مرزی زمانی مفید است که مشخصات خارجی شکل (مانند گوشه ها یا خمیدگی ها ) مهم باشد.
• نمایش ناحیه ای وقتی مفید است که خواص درونی بخش های تصویر( مانند بافت شکل ) مورد توجه باشد.
مرحله ی توصیف : در این مرحله که انتخاب ویژگی هم نامیده می شود ، روشی برای برجسته کردن ویژگی های مورد نظر اجرا می شود. مثلا در تشخیص بیماری اسکیزو فرنی ویژگی هایی در تصویر MRI که باعث تمایز بیمار از شخص سالم می شود.
مرحله تشخیص و تفسیر : طی این مرحله با استفاده از اطلاعات توصیف گر ها ، یک برچسب به هر شی نسبت داده می شود.

مطالعات بر روی MRI : در مغز بیماران مبتلا به اسکیزوفرنی، تغییرات ساختمانی خاصی نظیر افزایش حجم مایع مغزی- نخاعی و بطن های جانبی و کاهش حجم لوب‌های تمپورال، تالاموس‌ها، هیپوکامپ‌ها و اونکوس‌ها دیده می‌شود و MRI روش مناسبی برای نشان دادن این تغییرات می‌باشد. MRI همچنین نشان می دهد که حجم ماده خاکستری و سفید افراد مبتلا نسبت به گروه سالم کاهش یافتـه است. ما از این تفاوت هایی که در MRI افراد سالم و اسکیزوفرنی وجود دارد، برای تشخیص بیماری استفاده خواهیم کرد.

۲. کارهای مرتبط

مجموعه داده : داده ها از دو مجموعه اطلاعات جمع آوری شده توسط روش های مختلف تصویربرداری تشکیل شده است :
Functional Network Connectivity [4] و Source-Based Morphometry[5]
مجموعه FNC از اسکن FMRI(تصویرسازی تشدید مغناطیسی کارکردی) ، به دست آمده و هماهنگی بین مناطق مختلف مفز را توصیف می کند. SBM از اسکن MRI مشتق شده و غلظت ماده خاکستری را در مناطق مخنلف مغز نشان می دهد. می توانید مجموعه داده را از این آدرس دریافت کنید.
تشخیص الگو شاخه‌ای از مبحث یادگیری ماشینی است. می‌توان گفت تشخیص الگو، دریافت داده‌های خام و تصمیم گیری بر اساس دسته‌بندی داده‌ها است. روش‌های تشخیص الگو، الگوهای مورد نظر را از یک مجموعه داده‌ها با استفاده از دانش قبلی در مورد الگوها یا اطلاعات آماری داده‌ها، جداسازی می‌کند. الگوهایی که با این روش دسته‌بندی می‌شوند، گروه‌هایی از اندازه‌گیری‌ها یا مشاهدات هستند که نقاط معینی را در یک فضای چند بعدی تشکیل می‌دهند. این ویژگی اختلاف عمده تشخیص الگو با تطبیق الگو است، که در آنجا الگوها با استفاده از موارد کاملا دقیق و معین و بر اساس یک الگوی مشخص، تشخیص داده می‌شوند. مسئله دسته بندی ¹یکی از مسائل اصلی مطرح شده در یادگیری ماشین است و بسیاری از مسائل را می توان به صورت یک مسئله دسته بندی مطرح کرده و حل کرد. از طرفی در یادگیری ماشین نیز روش های مختلفی برای حل مسئله دسته بندی صورت گرفته است. در ادامه نمونه هایی از الگوریتم هایی که برای دسته بندی جهت تشخیص بیماری اسکیزوفرنی استفاده شده اند، معرفی می شوند.

روش Gaussian Process
یک نمونه [6] از روش هایی که برای دسته بندی انجام شده ، بر مبنای الگوی یادگیری ماشین های بیزی به نام دسته بندی فرایند گوسی می باشد. یادگیری بیزوی این امکان را فراهم می آورد که اطلاعات اولیه طراح در مورد داده ها را مدل سازی کنیم و به صورت یکپارچه با اطلاعات حاصل از داده های نمونه گیری شده ، ادغام کنیم. همچنین این مدل سازی، یکی از اصلی ترین مشکلات در مدل سازی داده ها ، برای رگرسیون یا کلاس بندی، یعنی بیش برازش ²را تا حد زیادی حل می کند. ساختار استنتاجی که می توان به وسیله ی الگوریتم های بیزوی به وسیله ی ایده ی بیزی بودن به مسائل اضافه کرد، بسیار انعطاف پذیر و مشابه روند طبیعی استدلال در انسان هاست. در واقع داشتن پیش فرض هایی در رابطه با یک حقیقت (توزیع پیشین )³ و استنتاج به وسیله ی تابعی که امکان پذیربودن رخدادی را به شرط داشتن (رخداد) پارامترهای پیش فرض(تابع یا توزیع درست نمایی ) ⁴برای بدست آوردن امکان پذیر بودن رخداد مورد نظر (تابع) اساس کار استدلال و آموزش بیزوی بوده، که بسیار مشابه روند استدلالی در انسان است. مدل GP بر اساس فرض داشتن یک فرایند گوسی روی داده های ورودی است[7] .
داده های آموزشی : {( D = {(Xi , Yi داده های تست : {( D={(Xi , Yi
بر اساس عملیات ریاضی که در فرآیند گوسی انجام می دهد، به داده های خروجی برچسبی را نسبت می دهد ، در این نمونه مقاله به بیماران اسکیزوفرنی عدد -1 و به افراد سالم 1 نسبت می دهد.
روش Support Vector Machines
روش های طبقه بندی خطی، سعی دارند که با ساختن یک ابرسطح ( که عبارت است از یک معادله خطی )، داده‌ها را از هم تفکیک کنند. روش طبقه بندی ماشین بردار پشتیبان که یکی از روش های طبقه بندی خطی است، بهترین ابرسطحی را پیدا میکند که با حداکثر فاصله⁵، داده‌های مربوط به دو طبقه را از هم تفکیک کند [8].
مجوعه داده های آزمایش D شامل n عضو(نقطه)را در اختیار داریم که به صورت زیر تعریف می شود:

{ D\quad =\quad \left\{ \left( { x }_{ i }{ ,{ y }_{ i } } \right) |{ x }_{ i }\in R^{ p }{ , }{ y }_{ i }\in \left\{ -1,1 \right\} \right\} }\begin{matrix} N \\ i=1 \end{matrix}

جایی که مقدار Y برابر ۱ یا 1- و هر یک بردار حقیقی P – بعدی است. هدف پیدا کردن ابرصفحه جداکننده با بیشترین فاصله از نقاط حاشیه ای است که نقاط باYi = 1 را از نقاط با Yi = -1 جدا کند. هر ابر صفحه می تواند به صورت مجموعه ای از نقاط که شرط مقبل را ارضا می کند نوشت: 0 = w . x - b جایی که . علامت ضرب است، w بردار نرمال است، که به ابرصفحه عمود است. ما می خواهیم w و b را طوری انتخاب کنیم که بیشترین فاصله بین ابر صفحه های موازی که داده ها را از هم جدامی کنند، ایجاد شود. این ابرصفحه ها با استفاده از این رابطه توصیف می شوند. w . x – b = 1 و w . x – b = -1
اگر داده های آموزشی جدایی پذیر خطی باشند، ما می توانیم دو ابر صفحه در حاشیه نقاط به طوری که هیچ نقطه مشترکی نداشته باشند، در نظر بگیریم و سپس سعی کنیم، فاصله آنها را، ماکسیمم کنیم. با استفاده از هندسه، فاصله این دو صفحه ( 2 تقسیم بر ||W|| ) است. بنابر این ما باید ||W|| را مینیمم کنیم. برای اینکه از ورود نقاط به حاشیه جلو گیری کنیم، شرایط زیر را اضافه می کنیم: برای هر i
برای کلاس اول : 1 =< w . xi - b
برای کلاس دوم : w . xi - b => -1

روش Random Forest
[9] فرض می شود (X = (X1, X2, ... , Xp مجومعه ای است از P متغیر پیش بین بالقوه ، Xj= (X1 j ,X2 j ,...,Xnj ) T و همچنین فرض می شود Y صفت تحت بررسی است (در اینجا ابتلا یا عدم ابتلا به بیماری اسکیزوفرنی) و در آن n تعداد افراد در نمونه است. همچنین b شماره درخت و B تعداد کل درختان است. مقدار اولیه b را برابر یک قرار می دهیم. در گام k-ام ، \Theta k نمونه مستقل و با توزیع یکسان از مجموعه داده ها انتخاب می گردد، این مجموعه با نام مجموعه یادگیری یا آموزشی خوانده می شود. همچنین x نیز نمونه تصادفی از مجموعه متغیر های پیش بین مورد مطالعه انتخاب می گردد. تابع پیش بین h با استفاده از x و تتایk ساخته می شود. گام ها B مرتبه تکرار شده تا به تعداد B درخت برسیم. فرض می شود :

{ P\quad =\quad \sum _{ K=1 }^{ E }{ I\left( h\left( x,{ \theta }_{ k } \right) \right) } }=\quad { 1 }

{ Q\quad =\quad \sum _{ K=1 }^{ E }{ I\left( h\left( x,{ \theta }_{ k } \right) \right) } }=\quad { 0 }

اگر P > Q باشد ، رندم فارست پیش بینی می نماید که x به به کلاس فرضا 1 (بیماران اسکیزوفرنی) تعلق دارد و برعکس، اگر P < Q باشد، پیش بینی می نماید که به کلاس فرضا 0 (افراد سالم) تعلق دارد.

روش درخت تصمیم
درخت تصمیم یکی از روش های ناپارامتری رده بندی کردن است که با توجه به نوع متغیر وابسته به دو دسته رده بندی درختی⁶ برای متغیر رسته ای و رگرسیون درختی ⁷برای متغیر پیوسته تقسیم می شود. در این روش مجموعه ای از شرط های منطقی ⁸به صورت یک الگوریتم با ساختار درختی برای رده بندی یا پیش بینی یک پیامد به کار می رود.

الگوریتم CART : Classification and Regression Tree
درخت کلاس بندی-رگرسیونی یکی از قدرتمند ترین و در غین حال ساده ترین روش های ناپارامتری آماری به منظور کلاس بندی متغیر پاسخ است.شمای این روش همانند نمودار گردشی است که در آن هر گره آزمونی برای متغیر پیش بین یا مشخصه فرد مورد مطالعه بوده و هر شاخه آن نتیجه آزمون و هر برگ یا گره انتهایی کلاس متغیر پاسخ را نشان خواهد داد. یک درخت ابتدا با تعیین متغیر Xj از میان تمام متغیر های بالقوه ساخته می شود، این متغیر "بهترین پیش بینی" را برای Y(متغیر پاسخ) خواهد داشت. بعد از انتخاب این متغیر، افراد بر اساس مقادیر Xj به دو گروه مختلف در درخت تقسیم می شوند. در این صورت افرادی که MRI آن ها ویژگی های MRI بیمار اسکیزوفرنی را دارد به یک گروه و سایر افراد به گروه دیگر تقسیم می شوند. این فرایند در هر گره به وجود آمده تکرار می شود. مجموعه افراد با \Omega نشان داده می شود. "بهترین پیش بین" اول با X1 نشان داده می شود. بر اساس مقادیر X1 افراد به دو گروه \Omega1` و \Omega2 تقسیم می شوند. که در آن :

{ \Omega }_{ 1 }=\left\{ i:{ x }_{ i1 }={ 0 } \right\} { , }\quad { \Omega }_{ 2 }=\left\{ i:{ x }_{ i1 }={ 1 } \right\} { ,\quad { i\quad =\quad { 1,2,... } } }

گام بعدی الگوریتم ساختن درخت، تشخیص متغیر بعدی است که "بهترین پیش بینی" را برای متغیر Y داشته باشد، اما در داخل هر گروه \Omega1` یا Omega1\ ، زیرگروه های بعدی بر اساس مقادیر Xi2 و Xi3 تعریف می شوند. این فرایند آنقدر به صورت بازگشتی ادامه می یابد تا به شرایط ملاک توقف برسیم. در آخر بعد از ساختن درخت ممکن آن را هرس نماییم، یعنی بعضی شاخه های درخت را حذف می نماییم تا از بیش برازش شدن مدل جلوگیری نماییم[10].

۳. آزمایش‌ها

مجوعه داده های مورد استفاده برای پیاده سازی⁹
فایل Train : مجموعه داده ها برای یادگیری، شامل 86 فرد می باشد. این فایل شامل سه مجموعه ی زیر است :

فایل train_labels.csv : به هرکدام از افراد یک Id و یک برچسب داده شده است. به فرد سالم برچسب صفر و به بیمار اسکیزوفرنی برچسب یک داده شده است.
فایل train_FNC.csv : برای هر فرد 378FNC معین شده و اعدادی که به هر FNC نسبت داده شده، که این مقادیر در واقع از ارتباط بین هر جفت نقشه های مغز به دست آمده است.
فایل train_SBM.csv :شامل 32SBM برای هر فرد است. این مقادیر وزن های استانداردی هستند که غلظت ماده خاکستری در مناطق مختلف مغز را نشان می دهند.

فایل Test : واضح است که مجموعه داده هایی که برای تست داده می شوند، فاقد برچسب هستند و تنها ویژگی های اقتباس شده ی FNC و SBM را دارا می باشند.

پیش پردازش و استخراج ویژگی ها ¹⁰
تنها داده ای که در اختیار ما قرار می گیرد عکس های MRI مانند زیر می باشد، لذا لازم است ویژگی هایی را از این عکس ها به دست آوریم تا بتوانیم طبق این ویژگی ها عامل ¹¹ خود را آموزش دهیم.

یک نمونه عکس mri که ویژگی ها را از آن استخراج کردیم

این عکس های رنگی توسط فرایند پردازش تصویر، نقشه های مستقل مغز ¹² و ارتباط بین بخش های مختلف در مرور زمان را بررسی می کند و این مقادیر ارتباط را تحت عنوان FNC در فایل train_FNC.csv ذخیره می کند. بنابراین ویژگی FNC¹³ ، تصویری از الگوی اتصال بین شبکه های مستقل(همان نقشه های مغز) ارائه می دهد.
ویژگی دیگر مربوط به غلظت ماده خاکستری در بخش های مختلف مغز می باشد کهSBM¹⁴نامیده می شود.
مراحل اقتباس ویژگی ها از عکس ها نیز در گیت قرار داده شده است.
آزمایش 1
در این روش پیاده سازی بدین صورت عمل شده است که ابتدا یک بردار تصادفی¹⁵ از مجموعه ویژگی ها مشخص می کنیم، و یادگیری به روش random forest که پیشتر توضیح داده شد، را بر روی این بردار اعمال میکنیم. سپس اهمیت ویژگی ها را محاسبه می نماییم و ویژگی هایی را که اهمیت آن ها کمتر از یک مقدار مشخصی می باشد را حذف می کنیم.ویژگی هایی که سمت چپ خط نارنجی قرار گرفته اند را نادیده می گیریم.
این برش ویژگی ها¹⁶ و محاسبه اهمیت ویژگی ها را از طریق random forest به دست آورده ایم.

سپس مجموعه ویژگی های جدید را ذخیره کرده و با استفاده از روش support vector machine ، مدل نهایی را به دست می آوریم.
کد های مربوط به پیاده سازی را می توانید از گیت هاب دریافت کنید.

آزمایش2
روش مدل کردن و یادگیری آزمایش ¹⁷
در مرحله ی آموزش از تابع فرایند گوسی به منظور طبقه بندی استفاده کرده ایم. برای استفاده از این فرایند که یک روش دارای فرمول های ریاضی جهت طبقه بندی است، نیاز داریم که از جعبه ابزار¹⁸ GPstuff استفاده نماییم. این ابزار را می توانید از این لینک دانلود و نصب نمایید. این ابزار، کامپایلرهای لازم جهت اجرای فرایندهای گوسی در متلب را فراهم می کند. در این برنامه (train.m) سه فایل Excel که در پوشه Train وجود دارد، به عنوان ورودی داده می شود و طبق روابط ریاضی فراید گوسی ، فایل مدل نهایی تحت عنوان gp ذخیره می شود.

p\left( { y }_{ i }|\quad f\left( { x }_{ i } \right) \right) =\Phi \left( { y }_{ i }f\left( { x }_{ i } \right) \right) =\int _{ -\infty }^{ { y }_{ i }f\left( { x }_{ i } \right) }{ N\left( z|0,1 \right) dz }

K\left( { x,x\prime } \right) \quad =\quad { { K }_{ const }\left( { x,x\prime } \right) \quad +\quad K }_{ linear }\left( { x,x\prime } \right) \quad +\quad { K }_{ metren }^{ v=5/2 }\left( { x,x\prime } \right)

{ K }_{ metren }^{ { v{ =\sfrac { 5 }{ 2 } } } }\left( { x,x\prime } \right)

\Kappa \left( \varkappa { ,\left \varkappa \prime \right) ={ \Kappa }_{ const } } \right \left( \varkappa { , }\varkappa \prime \right) +{ \Kappa }_{ linear }\left( \varkappa { ,\left \varkappa \prime \right) +{ \Kappa }_{ Metren }^{ \upsilon =\sfrac { 5 }{ 2 } } } \right \left( \varkappa { ,\varkappa \prime } \right)

{ K }_{ const }\left( { x,x\prime } \right) =\quad { \theta }_{ 1 }

{ K }_{ linear }\left( { x,x\prime } \right) =\quad { \theta }_{ 2 }\quad { x{ T }x\prime }

{ { \Kappa }_{ Matern }^{ \nu =\sfrac { 5 }{ 2 } } }\left( \varkappa { , }\varkappa \prime \right) ={ { \theta }_{ 3 }\left( 1+\sfrac { \sqrt { 5 } { r } }{ { \theta }_{ 4 } } +\sfrac { 5{ r } }{ 3{ \theta }_{ 4 }^{ 2 } } \right) }{ exp\left( -\frac { \sqrt { 5 } { r } }{ { \theta }_{ 4 } } \right) }

{ K }_{ metren }^{ v=5/2 }\left( { x,x\prime } \right) \quad =\quad { \theta }_{ 3\quad }\left( 1+\frac { \sqrt { 5 } { r } }{ { \theta }_{ 4 } } +\frac { 5r }{ 3{ \theta }_{ 4 }^{ 2 } } \right) { exp\left( -\frac { \sqrt { 5 } { r } }{ { \theta }_{ 4 } } \right) }

{ r=\parallel { \varkappa -{ \varkappa \prime \parallel } } }

مرحله ی تست کردن و پیش بینی آزمایش ¹⁹
کد قسمت پیش بینی ، داده های یادگیری و تست و نیز مدل gp را می خواند و احتمال ابتلا به بیماری را برای هر فرد بیان می کند.

قسمتی از فایل نتیجه نهایی که به هر فرد یک احتمال مبنی بر داشتن بیماری نسبت داده شده است

کد های مربوط به پیاده سازی را می توانید از گیت هاب دریافت کنید.

روش های پیاده سازی	درصد درستی
آزمایش 1	65%
آزمایش 2	91%

۴. کارهای آینده

اگر مجموعه دادگان ما دارای اطلاعاتی از قبیل سن افراد، جنسیت، مصرف داروهای مختلف در افراد باشد، می توانیم در مرحله ی کلاس بندی ، این ویژگی ها را نیز لحاظ کنیم و درصد درستی تشخیص عامل را بهبود بخشیم و دقت را بالا ببریم.

۵. مراجع

[1] Michael A. Arbib and T. Nathan Mundhenk. \Schizophrenia and the mirror system: an essay." Neuropsychologia, 43(2):268{280, 2005.
[2] fa.wikipedia.org/wiki/پردازشتصویر
[3] CYH/ImageFundamentals
[4] E. A. Allen, E. Damaraju, S. M. Plis, E. B. Erhardt, T. Eichele, and V. D. Calhoun. Tracking whole-brain connectivity dynamics in the resting state. Cerebral Cortex, pages 663–676, 2012.
[5] J. M. Segall, E. A. Allen, R. E. Jung, E. B. Erhardt, S. K. Arja, K. A. Kiehl, and V. D. Calhoun.Correspondence between structure and function in the human brain at rest. Frontiers in Neuroinformatics, 6(10), 2012.
[6] Arno Solin (arno.solin@aalto.fi) Doctoral student and Simo S¨arkk¨a (instructor) (simo.sarkka@aalto.fi) at Aalto University, Espoo, Finland
[7] http://research.cs.aalto.fi/pml/software/gpstuff/
[8] Can structural MRI aid in clinical classification A machine learning study in two independent samples of patients with schizophrenia, bipolar disorder and healthy subjects
[9]Lebedev_AV__MLSP2014_Sch.pdf - Kaggle
[10]Application and Comparison of Random Forest and CART in Genetic Association Study in Coronary Artery Disease

پیوندهای مفید

صفحه رسمی مسابقه تشخیص اسکیزوفرنی

Classification
Overfitting
Prior distribution
Likelihood function/distribution
maximum margin
Classification Tree
Regression Tree
Logical if-then conditions
DataSet
PreProcessing
againt
brain maps
Functional Network Connectivity
Source-Based Morphometry
Random Vector
Feature Trimming
Modeling techniques and training
toolbox
Testing and Prediction

ارزیابی شرح مسئله و کارهای مرتبط 1394/08/30

محسن ایمانی

چند مشکل در کار شما در این فاز وجود دارد که عرض می‌شود:

متن شما در برخی قسمت‌ها ثقیل شده است و نشان از یک ترجمه لغت به لغت دارد که مخاطب را در فهم مطلب کمی دچار مشکل می‌کند.
در موارد زیادی شما اصطلاحات انگلیسی را به جای آوردن در پاورقی در پرانتز جلوی کلمه آورده‌اید که از نظر ویرایشی ایراد محسوب می‌شود.
بهتر بود به جای گذاشتن عکس از روابط، آن‌ها را مستقیما بازنویسی می‌کردید.
روش‌های مرتبط شما برای این پروژه کمی محدود به روش‌های کلی هستند و می‌توانستید روش‌های مرتبط بیشتری را معرفی کنید.
روش‌های مرتبط شما، روش‌های کلی در رده‌بندی هستند و به طور خاص به مسئله مربوط به پروژه‌تان نپرداخته‌اید
برای پردازش تصویر، و اختصاصا پردازش تصاویر ام آر آی مغزی، نیاز به مراحل پیش‌پردازشی و استخراج خصیصه‌های خاصی خواهید داشت که هیچ اشاره‌ای به این مرحله و روش‌های پیش‌پردازش و خصیصه‌های استفاده شده در روش‌های مختلف برای پردازش تصاویر ام آر آی مغزی، اشاره‌ای نکرده‌اید.

ارزیابی پیاده‌سازی و گزارش نتایج 1394/10/05

تایید شده

سلام
در قسمت ابتدایی و مقدمه بهتر بود بعد از شرح مساله رابطه ی کلی این مساله با هوش مصنوعی و نحوه حل این مساله توسط الگوریتم های هوش مصنوعی را بیشتر مورد بحث قرار میداید . در قسمت های کارهای مرتبط تلاش شما خوب و کافی بوده ولی بهتر بود این الگوریتم ها با حوصله بیشتر و زبانی گویا تر برای خواننده توضیح داده می شد ؛ و همچنین توضیح بیشتری راجع به فرمول های نوشته شده داده می شد.
در قسمت آزمایش ها بهتر بود بیشتر راجع به روشی که برای پیاده سازی در پیش گرفتید صحبت می کردید و همچنین اگر روش دیگری راهم با روش اصلی مقایسه می کردید خیلی خوب بود.
توصیه دیگر من این است که برای نمایش نتایج آزمایش بهتر است از نمودار نیز استفاده شود. و اینکه بجای عکس برداری از جدول نتایج بهتر بود این جدول را در خود سایت طراحی می کردید.
استفاده از فرمول در ارائه گزارش خوب است ولی بهتر بود که برای هرکدام از فرمول ها توضیحی به اختصار می نوشتید تا برای خواننده گنگ نباشد.
و توصیه آخر بنده این است که در سایت گیت هاب توضیحاتی را در قالب فایل readme قرار دهید و نحوه اجرای برنامه خود را در آن توضیح دهید.
و در پایان امیدوارم این پیشنهادات بنده در بهبود روند این پروژه به شما کمک کند

با سلام ضمن تشکر از زحمات شما، نکاتی را عرض میکنم:
مرحله بخش بندی (segmentation) با جزییات توضیح داده نشده است در حالی که احتمالا مهمترین قسمت میباشد.
در قسمت کارهای مرتبط تنها به اشاره ۳ مقاله اکتفا شده است در حالی که صدها مقاله در این باره تنها از طریق approach های data mining ارایه شده است.
در قسمت های svm و گاوس تنها دیتا توضیح داده شده و جزییات روش قابل فهم نمیباشد.
مشخص نمیباشد که پروژه از کدام روش استفاده کرده و یا روش پیشنهادی چه میباشد.
در توضیح روش یادگیری یک سری فرمول بدون توضیح یا تعریف نوشته شده است.
جدول ارایه شده در مرحله تست و نتیجه کاملا غیر قابل فهم میباشد.
پیاده سازی بدون فایل راهنما ارایه شده و در نتیجه قابلیت اجرا را ندارد زیرا چندین فایل قرار داده شده و مشخص نمیباشد که هر کدام چه کاری انجام میدهند.
بهتر بود در قسمت مراجع نام نویسنده ها و جایی که مقاله در آن منتشر شده هم نمایش داده میشد.
با توجه به تلاش انجام شده و با ارفاق نمره ۳ تعلق خواهد گرفت.

سلام
سعی کردم پروژتون رو با دقت مطالعه کنم، به نظرم پروژه ی خوبی بود . فقط چند نکته به نظرم رسید که بگم :
-بخش کاراهای مرتبط قوی بود و الگوریتم های مختلف رو به خوبی توضیح داده بودید.
-یه مورد که به نظرم از قلم افتاده اینه که روش پیشنهادی که پیاده سازی شده است درست توضیح داده نشده مثلا باید گفته میشد تو پیش پردازش دقیقا چه کار هایی انجام میشه و چگونه ویژگی ها رو استخراج میکنه یا مثلا اگه لازم است عکس بهبود پیدا کند، چه کارهایی لازم است انجام شود.
-در بخش آزمایش به اختصار به توضیح روش پرداختید در صورتی که بخش آزمایش مربوط به نتایجه و نباید در ان قسمت روش یا پیاده سازی توضیح داده شود.
-مورد دیگه اینکه بهتر بود در قسمت نتایج توضیح داده شود که هر ستون بیانگر چه چیزی است. مثلا ستون های اول و دوم مشخص بود ولی ستون های بعدی واضح و قابل تشخیص نبود که چه چیزی رو بیان میکند.

ولی در کل پروژه ی خوبی بود، خسته نباشید:)

بنا بر این بود که شما در این فاز دو کار عمده‌ی آزمایش و ارزیابی و گزارش نتایج را انجام دهید. فارغ از کاستی‌هایی که در بخش گزارش آزمایشات خود داشته‌اید، شما نتایج شفافی را به عنوان نتیجه آزمایش گزارش نکرده و تلاشی در جهت ارزیابی مدل آموزش داده شده خود با استفاده از داده آزمایشی نداشته‌اید و در نهایت پروژه شما فاقد هر گونه ارزیابی نتایج آزمایش می‌باشد.
همچنین بهتر بود در مورد خصیصه‌های مورد استفاده در فرآیند یادگیری از مجموعه داده‌ی آموزشی بیشتر توضیح می‌دادید.
امیدوارم در فاز بعدی این کاستی را جبران نمایید.

ارزیابی بهبود نتایج و تکمیل گزارش 1394/11/05

+شرح مسئله بیان روانی داشت و به خوبی به اهمیت موضوع اشاره کرده بودید به طوری که توجه خواننده را جلب می کرد.
+بخش داده ها مختصر و مفید اشاره شده است .
+در بخش کارهای آینده به خوبی ایده پردازی نموده اید اما بهتر بود کمی بیشتر توضیح می دادید.
+در گیت هاب ، بخش readme بسیار کاملی داشتید.
+به کامنت گذاری های مناسب و کامل توجه داشتید.
+استفاده از نمودار از نکات مثبت کار شماست.
-به طور کلی به بیان روش های دسته بندی بیشتر پرداخته بودید بهتر بود به این نکته هم اشاره کنید که بر اساس چه ویژگی هایی دقیقا این تصاویر دسته بندی می شوند ، این ویژگی ها به چه صورت به دست می آیند.بهتر بود به صرف کلمه ی "ویژگی ها" اکتفا نمی کردید تا کار شما از ارزش بیشتری برخوردار می شد.
-در آزمایش اول اشاره کرده بودید که اهمیت ویژگی ها را به دست می آورید اما خوب بود اشاره می کردید این "اهمیت" چگونه به دست می آید و به چه معنی است .
-در آزمایش دوم بهتر بود روابط ریاضی ارائه شده را توضیح می دادید و یا در صورت امکان جهت فهم آسان تر از بیان آنها خوداری می کردید.
-مرجع 3 ام بهتر بود کامل تر اشاره می شد.
موفق باشید.

با سلام و خسته نباشید ، بهتر بود برای جدول مقایسه خود فاکتور های مختلفی در نظر میگرفتید و مقایسه را با توجه به انها انجام میدادید نه اینکه تنها یک عدد نشان داده شود. ضمن اینکه برای فاز نهایی کار خاصی صورت نگرفته است ،در آزمایش 2 ذکر فرمول ها غیر ضروری بوده وکمکی به درک مطلب نمیکند بهتر بود به جای آنها به توضیح مفصل تر این روش میپرداختید . و بعنوان نتیجه گیری تفاوت روش ها و دلایل بهبود را ذکر میکردید .

در متن از نیم فاصله استفاده نشده.
به نظر می رسد اگر یک بار دیگر از روی متن خوانده می شد اشکالات نگارشی کمی که در آن وجود دارد حل می شد.
بهتر بود لینک های استفاده شده در قسمت پیوند های مفید استفاده می شدند نه در قسمت مراجع.
fnc , sbm یک بار در قسمت کارهای مرتبط تعریف شده بود نیازی به تعریف دوباره ی آنها در قسمت آزمایش ها نبود.
بهتر بود برای فرمول ها توضیح بیشتری داده می شد.
کامنت های کد کمک زیادی به فهمیدن کدها می کرد.
از نقاط مثبت پروژه استفاده از دو روش و مقایسه ی بین این دو روش بود
در کل خسته نباشید پروژه ی جالبی بود

با عرض سلام و خسته نباشید، دو فاز اول به خوبی انجام شده با این حال به نظر نمی رسد برای بهبود نتایج کاری صورت گرفته باشد. پیاده سازی دو روش مختلف و مقایسه آنها ارزشمند است با این حال مواردی قابل اصلاح وجود دارد:

در متن شما نیم فاصله رعایت نشده است.
فرمول ها شماره ندارند.
بهتر بود کدی که از آن استفاده کرده اید را مشخص می کردید تا متوجه تفاوت کار شما بشویم.
بهتر بود نتیجه کار خود را با کارهای مشابه مقایسه می کردید.
بهتر بود فرمول ها و روش دیتاست بندی را بیشتر توضیح می دادید.
موفق باشید

رد شده

پروژه شما هنوز ناقص است در آزمایش های شما به بهبود نتایج آزمایش ها توجهی نشده است همچنین توضیحات ارائه شده برای آزمایش ها ناکافی به نظر میرسند
توضیحات بخش کار های آینده ناقص اند و معلوم می شود که روی این بخش فکری صورت نگرفته است همچنین قرار دادن بخشی تحت عنوان جمع بندی یا نتیجه گیری برای معرفی مناسب ترین روش انجام آزمایش ها هم می تواند کمک شایانی به کامل شدن مقاله شما بکند
موفق باشید

سلام، ممنون بابت پروژه‌ی خوبی که انجام دادید. بخش داده ها به مختصر و مفید شرح داده شده است. و همچنین کامنت‌گذاری و readme کاملی در کدهای خود دارید. این که شما دو روش را پیاده‌سازی و مقایسه نمودید از نکات قوت کار شماست.همچنین آزمایش‌ها به خوبی صورت پذیرفته. البته اشکالاتی نیز بر این پروژه وارد است که مهم‌ترین آن اشکالات نگارشی است.
موفق باشید.

زحمات زیادی کشیدید که قابل تقدیر می‌باشد. توجه به چند نکته می‌تواند کیفیت کار شما افزایش دهد:
شماره گذازی شکل‌ها و جداول می‌تواند ارجاع به آنها را ساده و از ابهامات بکاهد.
بهتر بود سیستم شماره گذاری را برای زیر قسمت‌ها نیز رعایت می‌کردید برای مثال 2.1. Gaussian Process
تعداد اندکی اشکال نگارشی و عدم رعایت نیم‌فاصله در متن به چشم می‌خورد.
اضافه کردن یک readme و کامنت گذاری، پروژه را برای افراد دیگر قابل استفاده می‌کند.
با توجه به اینکه پیاده‌سازی با زبان نسبتا جدید R انجام شده است ارایه توضیحاتی در ارتباط با چگونگی اجرا کردن پروژه می‌توانست بسیار مفید واقع شود.
موفق باشید

شما در این فاز تلاش کردید تا با استفاده از یک روش دیگر برای پیاده‌سازی، نتایج خود را بهبود دهید که موفق به این کار شده‌اید.
اما به نظر می‌رسد بهتر می‌بود مقایسه‌ای میان روش‌ها و تحلیل نتایج آن‌ها داشته باشید.

همچنین کارهای آینده شما خیلی مختصر و خیلی کلی بیان شده است و می‌توانستید با عمق بیشتر و تامل بیشتری این بخش را تالیف کنید.

موفق باشید