شاید بتوان تشخیص بیماریها با استفاده از الگوریتمهای هوش مصنوعی را مفیدترین و صلحآمیزترین کاربرد هوش مصنوعی تاکنون دانست. یکی از شایعترین بیماریها و علل مرگ و میر در دنیای امروز بیماریهای قلبی است. در تشخیص این نوع بیماریها معمولا عواملی چون سن، جنسیت، فشار خون، میزان کلسترول و ... مدنظر قرار میگیرند و در نهایت میزان ریسک بیمار در مقابل بیماریهای قلبی تعیین میشود. در این پژوهش انتظار میرود با استفاده از هریک از روشهای یادگیری ماشین (مثلا دستهبندی) به تشخیص این بیماری پرداخته شود. برای این منظور میتوان از دادههای دانشگاه ایرواین که لینک آن در قسمت لینکهای مفید قرار دارد استفاده کنید. # مقدمه امروزه با پیشرفت تکنولوژی استفاده از سیستم های هوشمند در پردازش و تحلیل سیگنال های حیاتی و تشخیص بیماری های مختلف از اهمیت ویژه ای برخوردار است تشخیص نهایی بیماری به عهده پزشک می باشد و با مشاهده علایم و انجام آزمایشاتی این تشخیص صورت می گیرد. اما از جمله بیماریهایی که پزشکان را در تشخیص با مشکلاتی مواجه می کند ، بیماری قلبی است. بیماریهای قلبی یکی از عوامل اصلی مرگ و میر در دنیا، به خصوص ایران، است و بهترین درمان آن تشخیص به موقع و پیشگیری آن است. بیماری قلبی، که معمولا از آن به عنوان بیماری شریانهای اکلیلی(Coronary Artery Disease) نام برده میشود؛ واژهای با دامنه وسیع است که به هر نوع شرایطی که قلب را تحت تأثیر قرار میدهد، اطلاق میشود. CAD بیماری مزمنی است که طی آن شریان اکلیلی بهتدریج سفت و باریک میشود . حجم داده های پزشکی روز به روز درحال افزایش است و پزشکان معمولا اطلاعات ارزشمندی را در خصوص بیماری ها و ارتباط آنها با یکدیگر و عوامل ایجاد کننده بیماری ها بدست می آورند (8) . اما این مجموعه داده های خام به خودی خود ارزشی ندارند، برای معنی بخشیدن به این داده ها باید آنها را تحلیل و تبدیل به اطلاعات یا بهتر از آنها دانش کرد (9). با توجه به شیوع بیماریهای قلبی – عروقی در سراسر جهان، استفاده از روش های جدید در تحقیقات زیست پزشکی بسیار مورد توجه قرار گرفته است. داده کاوی می تواند ارتباطات و وابستگی های بدیعی را کشف کند که برای پزشکان بسیار مفید است. تکنیکهای داده کاوی به طور کلی به دو دسته توصیف کننده و پیش گویی کننده تقسیم می شوند. وظایف توصیفی خواص عمومی داده ها را مشخص می کند و هدف آن پیدا کردن الگوهای قابل تفسیر توسط افراد برای داده هاست. وظایف پیش گویانه، پیش بینی رفتار آینده آنهاست و منظور از آن بکارگیری چند متغیر در پایگاه داده برای پیش گویی مقادیر آینده متغیرهاست(4). داده کاوی گونه ای از تکنیک ها برای شناسایی اطلاعات و یا دانش تصمیم گیری از میان داده ها می باشد، به نحوی که با استخراج آنها در حوزه های تصمیم گیری، پیش بینی، پیش گویی و تخمین بتوان از آنها استفاده کرد. داده کاوی پزشکی دارای پتانسیل زیادی برای کشف الگوهای پنهان موجود در داده ها داراست که این الگوها می تواند برای تشخیص های بالینی مورد استفاده قرار گیرد (5). امروزه استفاده از روش های متنوع داده کاوی و استخراج دانش برای شناسایی الگوها و ارتباطات میان متغیرهای مختلف در تولید مدل های پیش بینی کننده در علوم پزشکی بسیار مورد توجه قرار گرفته است (6). کاربرد روش های داده کاوی در حوزه های مختلف پزشکی مانند تشخیص، پیش گویی و حتی درمان به اثبات رسیده است(7). هدف اصلی ما در این بحث استفاده از الگوریتمهای دادهکاوی(Data Mining) برای پیشبینی حملات قلبی است که در ادامه به توضیح آن می پردازیم . به طور کلی روشها و الگوریتمهای متعددی برای پیشبینی بیماری قلبی مورد ارزیابی قرار گرفتهاند که این الگوریتمها بر روی مجموعه دادههای متفاوت و تحت شرایط متنوعی آزمایش شدهاند.نوار قلبی روشی است که با استفاده از امواج الکتریکی قلب افراد به وضعیت فیزیکی و بیماریهای احتمالی قلبی در فرد پی می بریم . یک نوار قلب یا الکتروکاردیوگرام روش بدون دردی است که فعالیت الکتریکی قلب را ضبط می کند و نموداری است که نشاندهنده فعالیت الکتریکی هر ضربان قلب و نیز ریتم ضربانهای متوالی قلب میباشد. امواج الکتریکی در ECG بصورت اوج و فرودهای متناوب ثبت می شوند . هر دوره فعالیت الکتریکی قلب شامل چندین قطعه است . # کارهای مرتبط یکی از عملکردهای پیش گویانه در داده کاوی،دسته بندی است. دسته بندی فرایند یافتن مدلی است که با تشخیص دسته ها و یا مفاهیم داده می تواند دسته ناشناخته اشیا دیگر را پیش گویی کند . یکی از روش های رایج دسته بندی درخت تصمیم است. درخت تصمیم گیری روشی است که به شما در یک انتخاب خوب کمک می کند. به خصوص تصمیم گیری هایی که دربردارنده هزینه بالا و خطرات زیادی است. درختان تصمیم یک روش گرافیکی برای مقایسه رقابت جایگزین و اختصاص ارزش به آنها از طریق ترکیب عدم قطعیت ها، هزینه ها و بازپرداخت ها به وسیله ارزش های خاص عدد است . درخت تصمیم معمولا از چندین گره 3 تشکیل می شود که با نام گره های ورودی و خروجی شناخته می شوند. قوانین ایجاد شده در درخت تصمیم به صورت "اگر" و "آنگاه بیان می شوند. از میان الگوریتم های مورد استفاده در ساخت درخت تصمیم، مهم ترین آنها الگوریتم C5 است که توسعه یافته ID3 می باشد.شبکه های عصبی مصنوعی با پردازش داده های تجربی،دانش یا قانون نهفته در ورای داده ها را به ساختار شبکه منتقل می کنند، به همین دلیل به این سیستم ها هوشمند می گویند. زیرا بر اساس محاسبات داده های عددی یا مثال ها، قوانین کلی را فرا می گیرند. در واقع شبکه های عصبی تکنیک هایی هستند که می توانند برای مدلهای با ارتباطات پیچیده مورد استفاده قرار گیرند.مدل های شبکه عصبی مصنوعی در طبقه بندی مسائلی نظیر، پیش بینی مشکلات قلبی در بیماران، تشخیص فشار خون و... استفاده شده است . پیش گویی خطر ابتلا به بیماری های قلبی به کمک سیستم های حمایت از تصمیم نقش مهمی در پیشگیری از بیماری ایفا می کند. الگوریتم k-means یکی از ابزار شناخته شده خوشه بندی است. k-means داده ها را مطابق با مقادیر مشخصه شان به ،K دسته مجزا گروه بندی می کند.بایداز قبل مقدارعدد صحیح و مثبت K داده ها را مطابق با مقادیر مشخصه شان به means که نشان دهنده تعداد خوشه هاست، مشخص شود. شبکه های عصبی از سیستم یادگیری پیچیده ی مغز که متشکل از مجموعه نرون ها می باشد الهام گرفته شده است. هدف از شبکه های عصبی مصنوعی ارائه روشهائی جهت استفاده از سخت افزارها ( مدارات ) و نرم افزارها( الگوریتم ها) برای ایجاد قابلیت های هوشمند به دستگاه ها، روبوت ها، برنامه ها و غیره میباشد که قادر به یادگیری حین فرآیند هستند. نرون مصنوعی کوچکترین واحد پردازشگر اطلاعات است.ورودیهای نرون توسط یک نوع ارتباط به نام وزنبه نرون وارد می شوند . داده های مورد نیاز : مجموعه داده مورد استفاده در این پروژه متعلق به قسمت پیوندهای مفید میباشد. پارامترها و محدوده آنهادر زیر آورده شده است: Age: سن بیمار Sex: جنسیت بیمار Chest pain type: بیان کننده درد قفسه سینه که شامل 4 مقدار مشخصهی درد قلبی، بدون درد و بدون علامت است. Resting blood pressure: فشار خون در زمان استراحت Serum cholestoral: کلسترول(چربی بد خون) Fasting blood sugar: قند خون ناشتا Resting electrocardiographic results: نتایج نوار قلب در حال استراحت که شامل 3 مقدار نرمال، موج غیر قلبی و نشاندهندهی افزایش مقطعی یا احتمالی ضخامت بطن چپ است. Maximum heart rat achieved: ماکزیمم ضربان قلب به دست آمده Exercise induced angina: آنژین ناشی از ورزش که شامل مقادیر بله و خیر است St depression induced by exercise relative: st ایجاد شده موقع تست ورزش وابسته به استراحت The slop of peak exercise at segment: بیان کننده شیب قطعه st در زمان حداکثر ورزش که شامل 3 مقدار بالا رفتن، صاف و پایین آمدن قطعه st است Number of major vessels colored by fluoroscopy: این صفت بیانگر تعداد رگهایی که در فلوروسکوپی دیده میشود Thal: اسکن تالیوم است که شامل 3 مقدار ضایعه ثابت، نرمال و ضایعه قابل برگشت است # آزمایشها # کارهای آینده # مراجع [1] Detrano, R., Janosi, A., Steinbrunn, W., Pfisterer, M., Schmid, J., Sandhu, S., Guppy, K., Lee, S., & Froelicher, V. (1989). International application of a new probability algorithm for the diagnosis of coronary artery disease. American Journal of Cardiology, 64,304--310. [2] David W. Aha & Dennis Kibler. "Instance-based prediction of heart-disease presence with the Cleveland database." [3] Gennari, J.H., Langley, P, & Fisher, D. (1989). Models of incremental concept formation. Artificial Intelligence, 40, 11--61. [4]Huanga M, Chenb M, Leea S. [Integrating data mining with case-based reasoning for chronic diseases prognosis and diagnosis]. Expert Systems with Applications 2007; 32(3): 856–867. [5] Subbalakshmi G, Road Y. [Decision Support in Heart Disease Prediction System using Naive Bayes]. Indian Journal of Computer Science and Engineering 2011; 2(2): 183-195. [6] Fayyad M, Piatetsky G, Uthurusamy R, Smyth P. [Advances in Knowledge Discovery and Data Mining]. American Association of artificial intelligence 1996; 17(3): 37-54. [7] Lavrac N. [Selected techniques for data mining in medicine]. Artificial Intelligence in Medicine 1999; 16(1): 3-23. [8] Soni J, Ansari U, Sharma D, Soni S.[Predictive Data Mining for Medical Diagnoses: An Overview of Heart Disease Prediction].International Journal of Computer Applications 2011; 17(8): 85-93. [9] Subbalakshmi G, Road Y. [Decision Support in Heart Disease Prediction System using Naive Bayes]. Indian Journal of Computer Science and Engineering 2011; 2(2): 183-195. + مورد **پیوندهای مفید** + [Heart Disease Data Set ](http://archive.ics.uci.edu/ml/datasets/Heart+Disease)