6 نتیجه برای داده کاوی
طاها صمدسلطانی، مصطفی لنگری زاده ، مریم ذالنوری،
دوره 9، شماره 3 - ( 6-1394 )
چکیده
زمینه و هدف: داده کاوی شاخ هی بسیار مهمی در فهم عمی قتر داد ههای پزشکی است که در صدد حل مسائل در
تشخیص و درمان بیماری ها می باشد. یکی از مهمترین کاربردهای داده کاوی، بررسی الگوهای موجود در داد هها است.
هدف از این پژوهش تعیین الگوهای موجود در داده های بیماران مبتلا به آسم است.
روش بررسی: جامعه ی پژوهش شامل بیماران دارای نشانه های تنفسی و نمونه پژوهش شامل داده های ثبت شده ی 258
فرد مراجعه کننده با علائم تنفسی به بیمارستانهای امام خمینی(ره) و مسیح دانشوری شهر تهران بود. مجموعه داده ی
وارد شد و افزونه داده کاوی این نرم Excel مذکور با استفاده از فرم گردآوری داده جمع آوری گردید و در محیط نرم افزار
افزار مورد استفاده قرار گرفت و سپس تحلیل های اثرگذارهای کلیدی، دسته بندی بیماران و تشخیص استثنائات انجام شد.
یافته ها: فراوان ترین نشانه بالینی مبتلایان به آسم در مجموعه ی حاضر، سرفه های شدید بود و این بیماری تحت تاثیر
شدید هیجانات قرار داشت. داده ها، جهت انجام تحلیل های کلی تر، در پنج خوشه تجمیع شدند و وجه مشترک آنها ارائه
، شد و سوابقی که ویژگی های استثنایی داشتند، شناسایی شدند. سپس با تحلیل هزین هها و تعیین مقدار آستانه برابر 612
پرسش نامه ی تشخیص آسم به روش کارت امتیاز ارائه گردید.
نتیجه گیری: چارچوب ارائه شده برای تحلیل و داده کاوی، ابزاری مناسب جهت استخراج دانش از روی داد هها می باشد
و می تواند هنگام استفاده از راهکارهای بالینی، شکاف موجود در تصمیم گیری را شناسایی و پر کند
سجاد مظاهری، مریم عاشوری، زینب بچاری،
دوره 11، شماره 3 - ( 6-1396 )
چکیده
زمینه و هدف: امروزه بیماری قلبی بسیار معمول و یکی از دلایل اصلی مرگ و میر به شمار می رود. به همین علت تشخیص درست و به موقع این بیماری بسیار مهم است. روش های تشخیصی و درمانی این بیماری عوارض جانبی زیاد و پرهزینه ای دارد. بنابراین محققان به دنبال روش های ارزان و با دقت بالا برای تشخیص این بیماری هستند. پژوهش حاضر با هدف شناسایی الگویی برای تشخیص روش درمان بیماری قلبی صورت گرفته است.
روش بررسی: پژوهش حاضر به روش توصیفی- مقطعی صورت گرفته و نمونه گیری به روش سرشماری بوده است. جامعه ی پژوهش متشکل از داده های بیمارستان های خاتم الانبیاء(ع) و علی ابن ابی طالب(ع) زاهدان است که با مراجعه ی مستقیم پژوهش گر به سازمان حاصل و به صورت فایل اکسل تهیه گردید. جهت تحلیل داده ها از نرم افزار Clementine۱۲.۰ استفاده شده است. در پژوهش حاضر الگوریتم های CHAID ،C&R Tree ،C۵.۰ و QUEST و شبکه عصبی مصنوعی روی مجموعه داده اجرا گردید.
یافته ها: مقدار صحت ۷۶/۰۴ توسط الگوریتم C&R Tree نشان دهنده ی عملکرد بهتر الگوریتم های درخت تصمیم نسبت به شبکه ی عصبی است.
نتیجه گیری: هدف این مطالعه ارایه مدلی برای پیش بینی روش درمانی مناسب بیماری قلبی به منظور کاهش هزینه های درمان و کیفیت ارایه خدمات بهتر به پزشکان می باشد. با توجه به قابل ملاحظه بودن خطرات اجرای روش های تشخیص تهاجمی مانند آنژیوگرافی و نیز حصول تجارب موفقیت آمیز داده کاوی در پزشکی، این مطالعه مدلی مبتنی بر تکنیک های داده کاوی ارایه نموده است. نقطه ی قابل بهبود مدل فوق ارایه سیستمی تصمیم یار جهت کمک به پزشکان برای افزایش صحت تشخیص روش درمان بیماری می باشد.
سید عباس محمودی، کمال میرزائی، سید مصطفی محمودی،
دوره 11، شماره 3 - ( 6-1396 )
چکیده
زمینه و هدف: سرطان معده دومین علت مرگ ناشی از سرطان در جهان است. با توجه به اینکه این بیماری جزو کشنده ترین بیماری ها در کشور ماست بررسی و شناخت عوامل تاثیرگذار در ایجاد این بیماری، بسیار اهمیت دارد. در این پژوهش از دو تکنیک داده کاوی یعنی الگوریتم Apriori و الگوریتم ID۳ به منظور بررسی عوامل موثر در بروز سرطان معده استفاده شده است.
روش بررسی: مجموعه داده های این پژوهش از ۴۹۰ بیمار شامل ۲۲۰ نمونه ی مبتلا به سرطان و۲۷۰ نمونه ی سالم مراجعه کننده به بیمارستان امام رضای تبریز جمع آوری شد. با استفاده از الگوریتم Apriori و پیاده سازی آن در نرم افزار متلب، بهترین قوانین حاکم بر روی این مجموعه داده، استخراج شده است. همچنین از الگوریتم ID۳ نیز جهت بررسی این عوامل استفاده شد.
یافتهها: نتایج داده کاوی نشان می دهد که داشتن سابقه رفلاکس معده بیشترین تأثیر را در بروز این بیماری دارد. با استفاده از الگوریتم Apriori قوانینی به دست آمد که می تواند به عنوان الگویی برای پیش بینی وضعیت بیماران و احتمال بروز این بیماری و بررسی عوامل تاثیرگذار در ایجاد این بیماری استفاده شود. همچنین دقت پیش بینی به دست آمده از الگوریتم ID۳ برابر ۸۵/۵۶ به دست آمد که نتیجه ی بسیار خوبی در پیش بینی سرطان معده است.
نتیجه گیری: استفاده از داده کاوی به خصوص در داده های پزشکی با توجه به حجم بالای داده ها و وجود روابط ناشناخته بین ویژگی های سیستمیک، شخصی و رفتاری بیماران بسیار مفید است. نتایج حاصل از این پژوهش می تواند به پزشکان در شناسایی عوامل موثر در بروز این بیماری و نیز پیش بینی بروز این بیماری کمک فراوانی کند.
رضا صفدری، ملیحه کدیور، پریناز تبری، هالا شاوکی اون،
دوره 11، شماره 5 - ( 10-1396 )
چکیده
زمینه و هدف: زردی در نوزادان مبحثی است که برای متخصصان در سراسر دنیا بسیار مهم تلقی می شود. زیرا این بیماری یکی از عمده ترین وضعیت هایی است که به توجه بالینی نیازمند است. هدف از انجام این پژوهش استفاده از تکنیک های طبقه بندی داده ها برای پیش بینی به موقع نوع زردی نوزادان و در نتیجه پیشگیری از آسیب های جبران ناپذیر به سلامت نوزادان بوده است.
روش بررسی: این پژوهش از نوع توصیفی بوده و با استفاده از مجموعه داده های جمع آوری شده درباره ی زردی نوزادان در شهر قاهره مصر انجام شده است. در این بررسی پس از پیش پردازش داده ها، تکنیک های داده کاوی از قبیل درخت تصمیم، Naïve Bayes و k)kNN نزدیکترین همسایه) در نرم افزار Orange بررسی، مقایسه و تحلیل شده است.
یافته ها: یافته های حاصل از پژوهش نشان داد که الگوریتم درخت تصمیم با دقت ۹۴ درصد، الگوریتم Naïve Bayes با دقت ۹۱ درصد و الگوریتم نزدیک ترین همسایه با دقت ۸۹ درصد نوع زردی در نوزادان را طبقه بندی می کنند. بنابراین بهترین الگوریتم از لحاظ دقت عملکرد در بین روش های طبقه بندی کننده، الگوریتم درخت تصمیم شناخته شد.
نتیجه گیری: استفاده از الگوریتم های طبقه بندی در ساخت سیستم های تصمیم یار می تواند به پزشکان در تصمیم گیری درباره نوع بیماری ها کمک کند و متخصصان می توانند برای رسیدگی به بیماران متناسب با نوع بیماری اقدام کنند که طی آن مخاطرات احتمالی در اثر عدم شناسایی به موقع یا صحیح بیماری کاهش خواهد یافت.
رئوف نوپور، محمد شیرخدا، شراره رستم نیاکان کلهری،
دوره 14، شماره 2 - ( 3-1399 )
چکیده
زمینه و هدف:سرطان کولورکتال از شایعترین سرطانهای دستگاه گوارش در انسان و مهمترین عامل مرگ و میر در جهان محسوب میشود. استفاده از برنامه ی غربالگری مناسب بر اساس میزان خطر ابتلا به سرطان کولورکتال در افراد، میتواند در پیشگیری از این بیماری مناسب باشد. بنابراین، هدف این پژوهش طراحی مدلی برای غربالگری سرطان کولورکتال بر اساس ریسک فاکتورها بود تا بتوان از یک سو میزان بقای این بیماری را در سطح جامعه افزایش داد و از سوی دیگر میزان مرگ و میر کاهش یابد.
روش بررسی: ابتدا با مرور مقالات و بررسی اطلاعات موجود در پرونده بیماران، ۳۸ ریسک فاکتور کشف شدند، برای تعیین مهمترین ریسک فاکتورها از بعد بالینی، ازcontent validity ratio (CVR) و از نظر آماری و با توجه به مجموعه داده گردآوری شده از روشهای آماری ضریب همبستگی اسپیرمن و تحلیل رگرسیون لجیستیک استفاده گردید. سپس از چهار الگوریتم تولید قوانین J-۴۸، J-RIP، PART و REP-Tree برای دادهکاوی استفاده شد و مناسبترین مدل بر اساس مقایسه میزان عملکرد الگوریتمها بهدست آمد.
یافتهها: پس از مقایسه عملکرد الگوریتمها، الگوریتم دادهکاوی J-۴۸ با میزان F-Measure ۰/۸۸۹، عملکرد بالاتری نسبت به سایر الگوریتمها داشته است.
نتیجهگیری: نتایج حاصل از ارزیابی عملکرد الگوریتم دادهکاوی J-۴۸ نشان داد که این الگوریتم میتواند به عنوان مناسبترین مدل تعیین خطر ابتلا به سرطان کولورکتال در نظر گرفته شود.
مصطفی شنبه زاده، هادی کاظمی آرپناهی، رئوف نوپور،
دوره 16، شماره 2 - ( 3-1401 )
چکیده
زمینه و هدف: سرطان پستان یکی از رایجترین و تهاجمیترین بدخیمیها در خانمها میباشد. تشخیص بهموقع سرطان پستان نقش مهمی در جلوگیری از پیشرفت این بیماری، اقدامات درمانی بهموقع و در نتیجه کاهش میزان مرگومیر این بیماران دارد. یادگیری ماشین، قابلیت بالایی در تشخیص سریع و هزینه اثربخش بیماریها دارد. هدف این مطالعه، طراحی سیستم تصمیمیار بالین (CDSS) Clinical Decision Support System بر اساس قوانین استخراجشده از الگوریتم منتخب درخت تصمیم با بهترین عملکرد بهمنظور تشخیص بهموقع و مؤثر سرطان پستان است.
روش بررسی: دادههای ۵۹۷ فرد مشکوک به سرطان پستان(۲۵۵ بیمار مبتلا و ۳۴۲ فرد سالم) بهصورت گذشتهنگر از پایگاه داده الکترونیکی بیمارستان آیتالله طالقانی شهر آبادان در قالب ۲۴ ویژگی عمدتاً سبک زندگی و سوابق پزشکی استخراج شد. پس از انتخاب مهمترین متغیرها از طریق کای دو پیرسون و تحلیل واریانس یکطرفه(۰/۰۵>P)، عملکرد الگوریتمهای منتخب دادهکاوی شامل (Random Forest (RF)، J-۴۸، Decision Stump (DS)، Rep-Tree (RT و XG-Boost برای تشخیص سرطان پستان در بستر نرمافزار ۳.۴ Weka تحلیل شد. در نهایت سیستم تشخیصی سرطان پستان بر اساس بهترین مدل و از طریق زبان برنامهنویسی سی شارپ و چارچوب ۳.۵.۴ Dot Net Framework طراحی گردید.
یافتهها: ۱۴ متغیر شامل سابقهی فردی سرطان پستان، سابقهی نمونهبرداری از سینه، سابقهی رادیوگرافی از قفسهی سینه، سابقهی فشارخون، افزایش کلسترول خون LDL (low-density lipoprotein)، وجود توده در ربع فوقانی داخلی سینه، هورموندرمانی با استروژن، هورموندرمانی با استروژن-پروژسترون، سابقهی خانوادگی سرطان پستان، سن، سابقهی سرطانهای دیگر، نسبت اندازهی دور کمر به دور باسن و مصرف میوه و سبزی ارتباط معناداری را باکلاس خروجی در سطح ۰۵/۰>P نشان دادند. بر اساس نتایج حاصل از ارزیابی عملکرد الگوریتمهای منتخب، مدل RF با میزان حساسیت، ویژگی، صحت و اندازه F بهترتیب برابر با ۰/۹۷، ۰/۹۹، ۰/۹۸ و ۰/۹۷۴ و ۰/۹۳۶ =(Area Under the Receiver Operator Characteristics (ROC) Curve (AUC عملکرد بالاتری نسبت به سایر الگوریتمهای منتخب داشته است و بهعنوان مدل برتر برای تشخیص سرطان پستان پیشنهاد شد.
نتیجهگیری: بهنظر میرسد که استفاده از متغیرهای تعدیلپذیر مانند سبک زندگی و ویژگیهای هورمونی-تولیدمثلی بهعنوان ورودی الگوریتم RF برای طراحی CDSS بتواند با صحت بهینه موارد سرطان پستان را تشخیص دهد. بهعلاوه سیستم پیشنهادی بهطور مؤثر در محیطهای واقعی بالینی برای تشخیص سریع و مؤثر بیماری قابل اقتباس باشد.