مصطفی بسکاآبادی، نجمه مهاجری، علی تقی پور، حبیب الله اسماعیلی، سید جواد حسینی، احسان موسی فرخانی،
دوره 22، شماره 6 - ( 12-1401 )
چکیده
مقدمه: در ایران با پیشرفت فناوری و توسعهی آمارهای ثبتی لزوم استفاده از روشهای داده کاوی بیشتر مورد توجه محققین قرار گرفته است. درخت رگرسیون و طبقهبندی یکی از روشهای مهم در مُدلبندی دادههای حجیم است که برای کنترل جامعه و پیشبینی مورد توجه محققین زیادی قرار گرفته است. هدف این مطالعه تعیین متغیرهای تأثیرگذار بر فراوانی رخداد عوارض ناشی از دیابت است.
روشها: این پژوهش از نوع مقطعی-تحلیلی است. در این پژوهش، اطلاعات تمام افراد مراجعه کنندهی دیابتی تحت پوشش دانشگاه علوم پزشکی مشهد در سال 1397 از سامانهی سینا استخراج گردید. 5016 نفر از افراد وارد شده به مطالعه دارای عارضهی دیابت و 53613 نفر نیز بدون عارضه بودند. روش برازش مدل درخت رگرسیون و طبقهبندی و معیار سنجش مدل ضریب تعیین و مساحت منحنی راک و نمودار Lift است.
یافتهها: منحنی راک برای مدل درختی برازش داده شده 8/73 درصد که نشان دهندهی توان نسبتاً بالای مدل است. براساس نمودار Lift قدرت تصمیمگیری بروز عارضهی دیابت برای فردی که مراجعه میکند 5/3 برابر افزایش مییابد.
نتیجهگیری: نتایج مدل رگرسیون و طبقهبندی درختی نشان داد که از متغیرهای کمی بهترتیب نزولی سن، عامل خطرسنجی، FBS، HbA1C، مجموع زمان فعالیت، کلسترول، FBS وHDL، بیماری قلبی و عروقی، سابقهی سکته، فشار خون، کلسترول، تجویز استاتین، شغل با فعالیت فیزیکی سخت، منطقهی زندگی، روغن مصرفی، پیادهروی، مصرف سبزیها و جنسیت در فراوانی رخداد عارضهی دیابت مؤثرتر از عوامل دیگر هستند.