مقدمه و اهداف: دادههای گمشده، چالش بزرگی در پژوهشها بهشمار میآیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روشهای گوناگونی برای کار با این دادهها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در دادههای پرسشنامهای بود.
روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهدهها بهصورت تصنعی و با انتخاب تصادفی سؤالاتسؤالات و سپس حذف آنها تولید شد. پنج روش جانهی عبارت بودند از: 1- میانگین سؤالاتسؤالات؛ 2- میانگین فردی؛ 3- نمای فردی؛ 4- رگرسیون خطی؛ و 5- الگوریتم EM. برای هر روش میانگین و انحراف معیار نمرات جانهی شده با مقادیر اصلی مقایسه گردید. همچنین ضریب همبستگی اسپیرمن، درصد دستهبندی اشتباه و آماره کاپا نیز محاسبه شد.
یافته ها: مقدار آماره کاپای بالاتر از 81/0 برای سطح گمشدگی 10 درصد بیانگر توافق تقریباً کامل در این سطح از گمشدگی بود. الگوریتم EM بالاترین میزان توافق با نتایج دادههای واقعی را با مقدار آماره کاپای 886/0 نشان داد. همچنین با افزایش میزان گمشدگی اطلاعات به 30 درصد، الگوریتم EM و روش میانگین فردی با مقدار کاپای 697/0 و 687/0از توافق نسبتاً مشابهی برخوردار بودند.
نتیجه گیری: در این مطالعه الگوریتم EM دقیقترین روش برای کار با دادههای گمشده در تمام الگوهای مورد ارزیابی شناخته شد. روش میانگین فردی به دلیل سادگی کار با دادههای گمشده بهویژه برای بیشتر خوانندگان غیرآماری میتواند مورد توجه قرار گیرد.