مشاهدهای که معمولا˝ نسبت به مقادیر دیگر در بین مجموعه دادهها بزرگتر یا کوچکتر است، داده پرت نامیده میشود. وجود دادههای پرت در اکثر موارد منجر به اختلال در نتـیجهگیری از اطلاعات خواهد شد. شناسایی دادههای پرت توسط پژوهشگران و کلیه کسانیکه به نوعی با اطلاعات جمعآوری شده سر و کار دارند، حائز اهمیت است باید از وجود یا عدم وجود دادههای پرت، چگونگی تاثیرگذاری و نحوه رفع دادههای پرت اطلاع حاصل نموده و دادهها را کنترل کنند. در این مقاله سعی شده با ارائه تکنیکهای شناسایی دادههای پرت و نحوه برخورد با این نوع از دادهها، خطای ناشی از وجود چنین دادههایی را به حداقل برسانیم.
روش بررسی: در این مقاله تکنیکهای مختلف تعیین دادههای پرت بر روی قد 30 نفر از دانشجویان دانشکده پزشکی دانشگاه تربیت مدرس تهران که توسط متر خیاطی و با قرار دادن فرد در روی یک سطح صاف، اندازهگیری شدند مورد بررسی قرار گرفتند. از جمله این تکنیکها میتوان به آزمون Z، آزمون گراب و روشهای گرافیکی اشاره نمود.
یافتهها: تکنیکهای فوق بیانگر وجود دادههای پرت در مشاهدات 153 و 110 مربوط به قد افراد، بودند که با استفاده از جدول و نمودار نشان داده شد.
نتیجهگیری: نتایج پژوهش نشان داد که همه تکنیکها در تعیین دادههای پرت مفید بودند و از این میان استفاده از چارکها در شناسایی دادههای پرت خفیف و شدید از اهمیت بالایی برخوردار هستند. همچنین آزمون گراب با در اختیار گذاشتن سطح معنیداری (p-value)، در شناسایی دادههای پرت بسیار مفید است.
بازنشر اطلاعات | |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |