دوره 11، شماره 3 - ( دوره 11 شماره 3 1394 )                   جلد 11 شماره 3 صفحات 51-43 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Afshari Safavi A, Kazemzadeh Gharechobogh H, Rezaei M. Comparison Of EM Algorithm and Standard Imputation Methods For Missing Data: A Questionnaire Study On Diabetic Patients. irje 2015; 11 (3) :43-51
URL: http://irje.tums.ac.ir/article-1-5441-fa.html
افشاری‌صفوی علیرضا، کاظم‌زاده قره‌چبق حسین، رضایی منصور. مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی. مجله اپیدمیولوژی ایران. 1394; 11 (3) :43-51

URL: http://irje.tums.ac.ir/article-1-5441-fa.html


1- گروه آمار و اپیدمیولوژی، دانشکده بهداشت، دانشگاه علوم پزشکی اصفهان
2- اداره کل آمار، اداره کل شرق تهران بزرگ ، سازمان تأمین اجتماعی ، kazemzadeh_hk@yahoo.com
3- گروه آمار و اپیدمیولوژی، دانشکده بهداشت، مرکز تحقیقات توسعه اجتماعی و ارتقاء سلامت دانشگاه علوم پزشکی کرمانشاه
چکیده:   (12179 مشاهده)

مقدمه و اهداف: داده‌های گمشده، چالش بزرگی در پژوهش‌ها به‌شمار می‌آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش‌های گوناگونی برای کار با این داده‌ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده‌های پرسشنامه‌ای بود.

روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده‌ها به‌صورت تصنعی و با انتخاب تصادفی سؤالاتسؤالات و سپس حذف آن‌ها تولید شد. پنج روش جانهی عبارت بودند از: 1- میانگین سؤالاتسؤالات؛ 2- میانگین فردی؛ 3- نمای فردی؛ 4- رگرسیون خطی؛ و 5- الگوریتم EM. برای هر روش میانگین و انحراف معیار نمرات جانهی شده با مقادیر اصلی مقایسه گردید. هم‌چنین ضریب همبستگی اسپیرمن، درصد دسته‌بندی اشتباه و آماره کاپا نیز محاسبه شد.

یافته ها: مقدار آماره کاپای بالاتر از 81/0 برای سطح گمشدگی 10 درصد بیانگر توافق تقریباً کامل در این سطح از گمشدگی بود. الگوریتم EM بالاترین میزان توافق با نتایج داده‌های واقعی را با مقدار آماره کاپای 886/0 نشان داد. هم‌چنین با افزایش میزان گمشدگی اطلاعات به 30 درصد، الگوریتم EM و روش میانگین فردی با مقدار کاپای 697/0 و 687/0از توافق نسبتاً مشابهی برخوردار بودند.

نتیجه‏ گیری: در این مطالعه الگوریتم EM دقیق‌ترین روش برای کار با داده‌های گمشده در تمام الگوهای مورد ارزیابی شناخته شد. روش میانگین فردی به دلیل سادگی کار با داده‌های گمشده به‌ویژه برای بیش‌تر خوانندگان غیرآماری می‌تواند مورد توجه قرار گیرد.

متن کامل [PDF 1632 kb]   (3129 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: عمومى
دریافت: 1394/12/9 | پذیرش: 1394/12/9 | انتشار: 1394/12/9

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این وب سایت متعلق به مجله اپیدمیولوژی ایران می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2024 , Tehran University of Medical Sciences, CC BY-NC 4.0

Designed & Developed by : Yektaweb