مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی

افشاری‌صفوی, علیرضا; کاظم‌زاده قره‌چبق, حسین; رضایی, منصور

دوره 11، شماره 3 - ( دوره 11 شماره 3 1394 ) جلد 11 شماره 3 صفحات 51-43 | برگشت به فهرست نسخه ها

Mendeley

Zotero

RefWorks

Afshari Safavi A, Kazemzadeh Gharechobogh H, Rezaei M. Comparison Of EM Algorithm and Standard Imputation Methods For Missing Data: A Questionnaire Study On Diabetic Patients. irje 2015; 11 (3) :43-51
URL: http://irje.tums.ac.ir/article-1-5441-fa.html

افشاری‌صفوی علیرضا، کاظم‌زاده قره‌چبق حسین، رضایی منصور. مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی. مجله اپیدمیولوژی ایران. 1394; 11 (3) :43-51

URL: http://irje.tums.ac.ir/article-1-5441-fa.html

مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی

علیرضا افشاری‌صفوی¹

، حسین کاظم‌زاده قره‌چبق^*²

، منصور رضایی³

1- گروه آمار و اپیدمیولوژی، دانشکده بهداشت، دانشگاه علوم پزشکی اصفهان
2- اداره کل آمار، اداره کل شرق تهران بزرگ ، سازمان تأمین اجتماعی ، kazemzadeh_hk@yahoo.com
3- گروه آمار و اپیدمیولوژی، دانشکده بهداشت، مرکز تحقیقات توسعه اجتماعی و ارتقاء سلامت دانشگاه علوم پزشکی کرمانشاه

چکیده: (14395 مشاهده)

مقدمه و اهداف: داده‌های گمشده، چالش بزرگی در پژوهش‌ها به‌شمار می‌آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش‌های گوناگونی برای کار با این داده‌ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده‌های پرسشنامه‌ای بود.

روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده‌ها به‌صورت تصنعی و با انتخاب تصادفی سؤالاتسؤالات و سپس حذف آن‌ها تولید شد. پنج روش جانهی عبارت بودند از: 1- میانگین سؤالاتسؤالات؛ 2- میانگین فردی؛ 3- نمای فردی؛ 4- رگرسیون خطی؛ و 5- الگوریتم EM. برای هر روش میانگین و انحراف معیار نمرات جانهی شده با مقادیر اصلی مقایسه گردید. هم‌چنین ضریب همبستگی اسپیرمن، درصد دسته‌بندی اشتباه و آماره کاپا نیز محاسبه شد.

یافته ها: مقدار آماره کاپای بالاتر از 81/0 برای سطح گمشدگی 10 درصد بیانگر توافق تقریباً کامل در این سطح از گمشدگی بود. الگوریتم EM بالاترین میزان توافق با نتایج داده‌های واقعی را با مقدار آماره کاپای 886/0 نشان داد. هم‌چنین با افزایش میزان گمشدگی اطلاعات به 30 درصد، الگوریتم EM و روش میانگین فردی با مقدار کاپای 697/0 و 687/0از توافق نسبتاً مشابهی برخوردار بودند.

نتیجه‏ گیری: در این مطالعه الگوریتم EM دقیق‌ترین روش برای کار با داده‌های گمشده در تمام الگوهای مورد ارزیابی شناخته شد. روش میانگین فردی به دلیل سادگی کار با داده‌های گمشده به‌ویژه برای بیش‌تر خوانندگان غیرآماری می‌تواند مورد توجه قرار گیرد.

واژه‌های کلیدی: الگوریتم EM، داده‌های گمشده، دیابت، خوددرمانی، آماره کاپا، رگرسیون

متن کامل [PDF 1632 kb] (3812 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: عمومى

ارسال پیام به نویسنده مسئول

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.