مقدمه و هدف: داده های گمشده در بسیاری از مطالعات آماری از جمله مدلهای رگرسیونی وجود دارند و باعث کاهش دقت برآورد می شوند. تا کنون روشهای گوناگونی برای مقابله با مشکل داده های گمشده ابداع شده که عموما بر داده های گمشده متغیر پاسخ متمرکز بوده است حال آنکه متغیرهای پیشگو نیز می توانند دستخوش تغییر و از دست رفتن اطلاعات شوند.
مواد و روشها: در این تحقیق ضمن بررسِی روش جانهِی داده هاِی گمشده با استفاده از الگوریتم EM و متغیر کمکی, نتایج حاصل از این روش را با روش تحلیل مورد کامل در یک مدل رگرسیون لجستیک پیرامون عوامل مؤثر بر انتخاب نوع زایمان مقایسه می کنیم.
یافته ها: داده هاِی مورد استفاده در این مقاله از یک مطالعه توصیفِی پیرامون عوامل مرتبط با انتخاب نوع زایمان در زنان مراجعه کننده به مراکز بهداشتِی و درمانِی شهر تهران بدست آمده است. حجم نمونه دراِین تحقِیق ۳۸۵ نفر بوده و از روش نمونه گِیرِی چند مرحله اِی انتخاب شدندو مشخصات فردِی، سوابق ماماِیِی، نوع نگرش و عوامل اجتماعِی نمونه ها از طرِیق پرسشنامه ثبت شدند. براِی مقایسه میزان کارایِی دو روش، برآورد انحراف معیار پارامترها مورد استناد قرار گرفت.
بحث و نتیجه گیری : نتایج حاصل نشان می دهد روش تحلیل درستنمایی با الگوریتم EM در مقایسه با روش مورد کامل کارایی بهترِی دارد. مشکل داده هاِی گمشده در بسیارِی از مطالعات آمارِی وجود دارد و موجب اریبی و کاهش کارایی می شوند. در این بررسِی نشان داده ایم استفاده از الگوریتم EM براِی جانهِی گمشده هادر یک مدل رگرسیون لجستیک با متغیرهاِی توضیحِی گسسته و سپس تحلیل مدل، از روش مورد کامل که مستلزم حذف گمشده ها به همراه قسمتهایی از اطلاعات است کاراتر است. از سوی دیگر اگر متغیر توضیحِی ناکامل پیوسته باشد بدست آوردن مدل، روشی متفاوت می طلبد و یا می توان با تبدیل آن به متغیری گسسته از روش قبل استفاده کرد.