نرمال‌سازی (آمار)

نرمال‌سازی (به انگلیسی: normalization) در آمار معانی متفاوتی دارد که ساده‌ترین کاربرد آن نرمال‌سازی داده‌ها یا نرمال‌سازی متغیرها است و عبارت است از روشی که داده‌ها را در زمانی که در یک دامنه نیستند را در دامنه مشابه قرار می‌دهد. به بیان دیگر ممکن است یک داده‌کاو با موقعیت‌هایی مواجه گردد که ویژگیهای در داده شامل مقادیری باشند که در محدوده یا دامنه متفاوتی قرار داشته باشند. این ویژگی‌های با مقادیر بزرگ ممکن است اثر بسیار زیادتری در تابع هزینه نسبت به ویژگی‌های با مقادیر کم داشته باشند. این مشکل با نرمالیزه نمودن ویژگی‌ها طوری که مقادیرشان در دامنه‌های مشابه قرار گیرند برطرف خواهد شد.[1]

نرمال‌سازی در ساخت مدل

در ساخت مدل داده‌ها (به انگلیسی: meta model) از روی داده‌ها پیش از شروع آموزش مدل‌ها، داده‌ها را به بزرگترین مقدار متناظرشان تقسیم می‌کنند تا به مقدارهای بین صفر و یک مقیاس (نرمالیزه) شوند این کار باعث می‌شود که اثر مقیاس واقعی (به انگلیسی: Absolute Scale) کمینه شود و همه ورودی‌ها تقریباً در یک دامنه باشند.[2]

مثال

در زیر چند روش نرمال‌سازی داده‌ها ارائه می‌گردد.

نامفرمولاستفاده
Standard scoreنرمال‌سازی خطاها در زمانی که پارامترهای جمعیت شناخته‌شده باشند.
Student's t-statisticنرمال‌سازی residuals زماین که پارامترهای جمعیت ناشناخته باشند (تخمین)
Studentized residualنرمال‌سازی در زمانی که متغییرها تخمین زده می‌شوند به خصوص در زمان تحلیل رگرسیون.
Standardized momentنرمال‌سازی لحظه‌ای به کمک انحراف معیار به عنوان ابزار اندازه‌گیری مقیاس
ضریب تغییراتنرمال‌سازی پراکندگی به کمک استفاده از میانگین به عنوان ابزار اندازه‌گیری مقیاس توزیع نمایی و توزیع پواسون.

منابع

  1. «پیش‌پردازش داده» (PDF). بایگانی‌شده از اصلی (PDF) در ۲۸ فوریه ۲۰۱۳. دریافت‌شده در ۲۷ نوامبر ۲۰۱۲.
  2. پیش‌بنی ظرفیت باربری شمع‌های تحت اثر بار محوری به کمک ماشین بردار پشتیبان، علیرضا کردجزی، فریدون پویانژاد
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.