شاید بتوان تشخیص بیماری‌ها با استفاده از الگوریتم‌های هوش مصنوعی را مفیدترین و صلح‌آمیزترین کاربرد هوش مصنوعی تاکنون دانست. یکی از شایعترین بیماری‌ها و علل مرگ و میر در دنیای امروز بیماری‌های قلبی است.
در تشخیص این نوع بیماری‌ها معمولا عواملی چون سن، جنسیت، فشار خون، میزان کلسترول و ... مدنظر قرار می‌گیرند و در نهایت میزان ریسک بیمار در مقابل بیماری‌های قلبی تعیین می‌شود.
در این پژوهش انتظار می‌رود با استفاده از هریک از روش‌های یادگیری ماشین (مثلا دسته‌بندی) به تشخیص این بیماری پرداخته شود.
برای این منظور می‌توان از داده‌های دانشگاه ایرواین که لینک آن در قسمت لینک‌های مفید قرار دارد استفاده کنید.

۱. مقدمه

امروزه با پیشرفت تکنولوژی استفاده از سیستم های هوشمند در پردازش و تحلیل سیگنال های حیاتی و تشخیص بیماری های مختلف از اهمیت ویژه ای برخوردار است تشخیص نهایی بیماری به عهده پزشک می باشد و با مشاهده علایم و انجام آزمایشاتی این تشخیص صورت می گیرد. اما از جمله بیماریهایی که پزشکان را در تشخیص با مشکلاتی مواجه می کند ، بیماری قلبی است. بیماری‌های قلبی یکی از عوامل اصلی مرگ و میر در دنیا، به خصوص ایران، است و بهترین درمان آن تشخیص به موقع و پیشگیری آن است. بیماری قلبی، که معمولا از آن به عنوان بیماری شریان‌های اکلیلی(Coronary Artery Disease) نام برده می‌شود؛ واژه‌ای با دامنه وسیع است که به هر نوع شرایطی که قلب را تحت تأثیر قرار می‌دهد، اطلاق می‌شود. CAD بیماری مزمنی است که طی آن شریان اکلیلی به‌تدریج سفت و باریک می‌شود .
حجم داده های پزشکی روز به روز درحال افزایش است و پزشکان معمولا اطلاعات ارزشمندی را در خصوص بیماری ها و ارتباط آنها با یکدیگر و عوامل ایجاد کننده بیماری ها بدست می آورند (8) . اما این مجموعه داده های خام به خودی خود ارزشی ندارند، برای معنی بخشیدن به این داده ها باید آنها را تحلیل و تبدیل به اطلاعات یا بهتر از آنها دانش کرد (9). با توجه به شیوع بیماریهای قلبی – عروقی در سراسر جهان، استفاده از روش های جدید در تحقیقات زیست پزشکی بسیار مورد توجه قرار گرفته است. داده کاوی می تواند ارتباطات و وابستگی های بدیعی را کشف کند که برای پزشکان بسیار مفید است.
تکنیکهای داده کاوی به طور کلی به دو دسته توصیف کننده و پیش گویی کننده تقسیم می شوند. وظایف توصیفی خواص عمومی داده ها را مشخص می کند و هدف آن پیدا کردن الگوهای قابل تفسیر توسط افراد برای داده هاست. وظایف پیش گویانه، پیش بینی رفتار آینده آنهاست و منظور از آن بکارگیری چند متغیر در پایگاه داده برای پیش گویی مقادیر آینده متغیرهاست(4). داده کاوی گونه ای از تکنیک ها برای شناسایی اطلاعات و یا دانش تصمیم گیری از میان داده ها می باشد، به نحوی که با استخراج آنها در حوزه های تصمیم گیری، پیش بینی، پیش گویی و تخمین بتوان از آنها استفاده کرد. داده کاوی پزشکی دارای پتانسیل زیادی برای کشف الگوهای پنهان موجود در داده ها داراست که این الگوها می تواند برای تشخیص های بالینی مورد استفاده قرار گیرد (5). امروزه استفاده از روش های متنوع داده کاوی و استخراج دانش برای شناسایی الگوها و ارتباطات میان متغیرهای مختلف در تولید مدل های پیش بینی کننده در علوم پزشکی بسیار مورد توجه قرار گرفته است (6). کاربرد روش های داده کاوی در حوزه های مختلف پزشکی مانند تشخیص، پیش گویی و حتی درمان به اثبات رسیده است(7).
هدف اصلی ما در این بحث استفاده از الگوریتم‌های داده‌کاوی(Data Mining) برای پیش‌بینی حملات قلبی است که در ادامه به توضیح آن می پردازیم .
به طور کلی روش‌ها و الگوریتم‌های متعددی برای پیش‌بینی بیماری قلبی مورد ارزیابی قرار گرفته‌اند که این الگوریتم‌ها بر روی مجموعه داده‌های متفاوت و تحت شرایط متنوعی آزمایش شده‌اند.نوار قلبی روشی است که با استفاده از امواج الکتریکی قلب افراد به وضعیت فیزیکی و بیماریهای احتمالی قلبی در فرد پی می بریم . یک نوار قلب یا الکتروکاردیوگرام روش بدون دردی است که فعالیت الکتریکی قلب را ضبط می کند و نموداری است که نشاندهنده فعالیت الکتریکی هر ضربان قلب و نیز ریتم ضربانهای متوالی قلب میباشد. امواج الکتریکی در ECG بصورت اوج و فرودهای متناوب ثبت می شوند . هر دوره فعالیت الکتریکی قلب شامل چندین قطعه است .

۲. کارهای مرتبط

یکی از عملکردهای پیش گویانه در داده کاوی،دسته بندی است. دسته بندی فرایند یافتن مدلی است که با تشخیص دسته ها و یا مفاهیم داده می تواند دسته
ناشناخته اشیا دیگر را پیش گویی کند . یکی از روش های رایج دسته بندی درخت تصمیم است. درخت تصمیم گیری روشی است که به شما در یک انتخاب خوب
کمک می کند. به خصوص تصمیم گیری هایی که دربردارنده هزینه بالا و خطرات زیادی است. درختان تصمیم یک روش گرافیکی برای مقایسه رقابت جایگزین و
اختصاص ارزش به آنها از طریق ترکیب عدم قطعیت ها، هزینه ها و بازپرداخت ها به وسیله ارزش های خاص عدد است .
درخت تصمیم معمولا از چندین گره 3 تشکیل می شود که با نام گره های ورودی و خروجی شناخته می شوند. قوانین ایجاد شده در درخت تصمیم به صورت "اگر" و
"آنگاه بیان می شوند. از میان الگوریتم های مورد استفاده در ساخت درخت تصمیم، مهم ترین آنها الگوریتم C5 است که توسعه یافته ID3 می باشد.شبکه های عصبی مصنوعی با پردازش داده های تجربی،دانش یا قانون نهفته در ورای داده ها را به ساختار شبکه منتقل می کنند، به همین دلیل به این سیستم ها هوشمند می گویند. زیرا بر اساس محاسبات داده های عددی یا مثال ها، قوانین کلی را فرا می گیرند. در واقع شبکه های عصبی تکنیک هایی هستند که می توانند برای مدلهای با ارتباطات پیچیده مورد استفاده قرار گیرند.مدل های شبکه عصبی مصنوعی در طبقه بندی مسائلی نظیر، پیش بینی مشکلات قلبی در بیماران، تشخیص فشار خون و... استفاده شده است . پیش گویی خطر ابتلا به بیماری های قلبی به کمک سیستم های حمایت از تصمیم نقش مهمی در پیشگیری از بیماری ایفا می کند.
الگوریتم k-means یکی از ابزار شناخته شده خوشه بندی است. k-means داده ها را مطابق با مقادیر مشخصه شان به ،K دسته مجزا گروه بندی می کند.بایداز قبل مقدارعدد صحیح و مثبت K داده ها را مطابق با مقادیر مشخصه شان به means که نشان دهنده تعداد خوشه هاست، مشخص شود. شبکه های عصبی از سیستم یادگیری پیچیده ی مغز که متشکل از مجموعه نرون ها می باشد الهام گرفته شده است. هدف از شبکه های عصبی مصنوعی ارائه روشهائی جهت استفاده از سخت افزارها ( مدارات ) و نرم افزارها( الگوریتم ها) برای ایجاد قابلیت های هوشمند به دستگاه ها، روبوت ها، برنامه ها و غیره میباشد که قادر به یادگیری حین فرآیند هستند. نرون مصنوعی کوچکترین واحد پردازشگر اطلاعات است.ورودیهای نرون توسط یک نوع ارتباط به نام وزنبه نرون وارد می شوند .

داده های مورد نیاز :
مجموعه داده مورد استفاده در این پروژه متعلق به قسمت پیوندهای مفید میباشد. پارامترها و محدوده آنهادر زیر آورده شده است:
Age: سن بیمار

Sex: جنسیت بیمار

Chest pain type: بیان کننده درد قفسه سینه که شامل 4 مقدار مشخصه‌ی درد قلبی، بدون درد و بدون علامت است.

Resting blood pressure: فشار خون در زمان استراحت

Serum cholestoral: کلسترول(چربی بد خون)

Fasting blood sugar: قند خون ناشتا

Resting electrocardiographic results: نتایج نوار قلب در حال استراحت که شامل 3 مقدار نرمال، موج غیر قلبی و نشان‌دهنده‌ی افزایش مقطعی یا احتمالی ضخامت بطن چپ است.

Maximum heart rat achieved: ماکزیمم ضربان قلب به دست آمده

Exercise induced angina: آنژین ناشی از ورزش که شامل مقادیر بله و خیر است

St depression induced by exercise relative: st ایجاد شده موقع تست ورزش وابسته به استراحت

The slop of peak exercise at segment: بیان کننده شیب قطعه st در زمان حداکثر ورزش که شامل 3 مقدار بالا رفتن، صاف و پایین آمدن قطعه st است

Number of major vessels colored by fluoroscopy: این صفت بیانگر تعداد رگ‌هایی که در فلوروسکوپی دیده‌ می‌شود

Thal: اسکن تالیوم است که شامل 3 مقدار ضایعه ثابت، نرمال و ضایعه قابل برگشت است

۳. آزمایش‌ها

۴. کارهای آینده

۵. مراجع

[1] Detrano, R., Janosi, A., Steinbrunn, W., Pfisterer, M., Schmid, J., Sandhu, S., Guppy, K., Lee, S., & Froelicher, V. (1989). International application of a new probability algorithm for the diagnosis of coronary artery disease. American Journal of Cardiology, 64,304--310.
[2] David W. Aha & Dennis Kibler. "Instance-based prediction of heart-disease presence with the Cleveland database."
[3] Gennari, J.H., Langley, P, & Fisher, D. (1989). Models of incremental concept formation. Artificial Intelligence, 40, 11--61.
[4]Huanga M, Chenb M, Leea S. [Integrating data mining with case-based reasoning for chronic diseases prognosis and diagnosis]. Expert Systems with Applications 2007; 32(3): 856–867.
[5] Subbalakshmi G, Road Y. [Decision Support in Heart Disease Prediction System using Naive Bayes]. Indian Journal of Computer Science and Engineering 2011; 2(2): 183-195.
[6] Fayyad M, Piatetsky G, Uthurusamy R, Smyth P. [Advances in Knowledge Discovery and Data Mining]. American Association of artificial intelligence 1996; 17(3): 37-54.
[7] Lavrac N. [Selected techniques for data mining in medicine]. Artificial Intelligence in Medicine 1999; 16(1): 3-23.
[8] Soni J, Ansari U, Sharma D, Soni S.[Predictive Data Mining for Medical Diagnoses: An Overview of Heart Disease Prediction].International Journal of Computer Applications 2011; 17(8): 85-93.
[9] Subbalakshmi G, Road Y. [Decision Support in Heart Disease Prediction System using Naive Bayes]. Indian Journal of Computer Science and Engineering 2011; 2(2): 183-195.

  • مورد

پیوندهای مفید

تایید شده

ضمن تشکر از اینکه زحمت کشیدید و فاز اول را انجام دادید ابتدا چند نکته نگارشی و کلی را عرض می‌کنم و سپس به بیان سایر موارد داخل متن می‌پردازم.
در فارسی نویسی درست باید برای بخش‌های اضافی کلمات مانند «ها» از نیم فاصله استفاده کرد. شما در برخی موارد از فاصله استفاده کرده و در برخی موارد دیگر آن‌ها را چسبانده‌اید.
به جای استفاده از کلمات انگلیسی در متن، معادل فارسی آن‌ها را در متنتان آورده و عبارت انگلیسی را در پانویس بیاورید. البته این مورد برای کلماتی مثل K-NN مصداق ندارد.
برای درج منابع و اشاره به آن‌ها در متن شما از پرانتز استفاده کرده‌اید. در markdown نویسی برای درج منابع شماره آن‌ها در متن را به صورت لینک قرار دهید تا زمانی که بر روی آن کلیک می‌شود منبع اشاره شده را در قسمت منابع نشان دهد. همچنین بهتر است با کلیک بر روی منبع در قسمت منابع آن مقاله یا سایت باز شود.
به صورت کلی متن را بسیار ساده نوشته‌اید و هیچ یک از کلمات را bold یا italic نکرده‌اید. همچنین در خیلی از موارد برخی از مفاهیم را که به نظرتان ممکن است نا آشنا برای خواننده باشد، می‌توانید به صورت لینک قرار داده تا خواننده با کلیک بر روی آن‌ها به صفحه ای راهنمایی شود که اطلاعات تکمیلی در آن خصوص وجود دارد.
از هیچ شکل و جدولی برای توضیح کارتان استفاده نکرده‌اید. مثلا بهتر بود پارامترهای دخیل در تشخیص را در یک جدول قرار می‌دادید تا مرتب‌تر و آراسته‌تر شود.
حال به سراغ موارد اختصاصی داخل متن می‌رویم.
بخش مقدمه طبق معماری مستند شما اولین بخش آن است در صورتی که یک پاراگراف قبل از آن دیده می شود. این پاراگراف را یا حذف کنید یا اگر لازم می بینید در مستندتان باشد آن را تحت عنوان تعریف پروژه بیاورید. معمولا در مقالات و ویکی ها تنها قسمتی که قبل از مقدمه می آید چکیده است که محتوای آن با آنچه اینجا آمده است تفاوت دارد. در واقع چکیده باید بعد از پایان کار نوشته شود.
جمله اول مقدمه تان را خودتان مجددا بخوانید و ببینید چیزی متوجه می شوید یا خیر؟! من که چیزی نفهمیدم. قسمت « تشخیص نهایی بیماری به عهده پزشک می باشد و با مشاهده علایم و انجام آزمایشاتی این تشخیص صورت می گیرد» به نظر ارتباطی به قسمت قبل ندارد.
در پاراگراف آخر مقدمه در مورد نوارد قلبی صحبت شده است که به نظر بنده هیچ ارتباطی به قسمت‌های قبل ندارد. کلا آخر مقدمه خوب جمع نشده است و خواننده انتظار دارد ادامه داشته باشد.
در قسمت کارهای مرتبط شما به بیان چند روش برای تشخیص پرداخته‌اید. بهتر بود هریک از این روش‌ها را در یک پاراگراف جداگانه می‌نوشتید. در همان پاراگرافی که درخت تصمیم را توضیح داده‌اید شبکه‌های عصبی را هم شروع کرده‌اید.
در توضیح درخت تصمیم از دو الگوریتم نام برده‌اید بدون اینکه هیچ توضیحی در مورد آن‌ها بدهید و یا آن‌ها را به جایی لینک کنید.
به طور کلی در قسمت کارهای مرتبط انتظار می‌رود بیش از اینکه به توضیح الگوریتم‌های مختلف بپردازید، کارهای مشابه پروژه خودتان را بررسی کنید و به تحلیل مقالات سایرین بپردازید. شما متاسفانه اصلا این کار را انجام نداده‌اید.
انشالله در فاز آینده این اشکالات را برطرف کرده و کارهای مرتبط را کامل کنید.