فاطمه دکامینی، محمد احسانی فر،
دوره 21، شماره 4 - ( 7-1400 )
چکیده
مقدمه: دیابت یکی از مشکلات اساسی سلامت در ایران بوده و حدود 6/4 میلیون نفر از بزرگسالان به این بیماری مبتلا هستند. ضعف در تشخیص این بیماری سبب شده نیمی از این تعداد از بیماری خود اطلاعی نداشته باشند. در سالیان اخیر همزمان با بهکارگیری رایانه در تحلیل و ذخیرهسازی اطلاعات، حجم و پیچیدگی دادهها بهصورت چشمگیری افزایش یافته است.
روشها: در سازمانهای سلامت دادهها نقش اساسی در ارزش سازمان ایفا میکنند. از اینرو دادهکاوی به یکی از پُرکاربردترین فرآیندها در حوزهی سلامت و تشخیص بیماریها تبدیل شده است. در این پژوهش اطلاعات 768 نفر از مراجعین آزمایشگاهی در تهران با حفظ محرمانگی و برای شناسایی متغیرهای تأثیرگذار در ابتلا به بیماری دیابت از نظرات خبرگان استفاده شده است.
یافتهها: یافتهها حاکی از بررسی 5 الگوریتم مورد نظر بر روی دادههای ارائه شده است که با پیادهسازی 5 الگوریتم دادهکاوی J48، بیز، بگینگ، کوهن و خوشهبندی ساده جهت دستهبندی دادهها، کارایی این الگوریتمها از نظر سرعت و دقت در محاسبات بررسی گردید.
نتیجهگیری: مجموعه دادهها جهت دسته بندی، بانک دادههای یک آزمایشگاه است که این مجموعه شامل 768 نمونه با 9 مشخصه است. نهایتاً الگوریتم J48 بهدلیل سرعت بالا، دقت مورد قبول و عدم وجود حساسیت به دادههای اولیه، جهت دادهکاوی دادههای بیماری دیابت پیشنهاد میشود.