هوش مصنوعی با پایتون، بخش چهارم – آمادهسازی دادهها (قسمت دوم)
حذف میانه[1]
این یکی دیگر از تکنیکهای پیشپردازش رایج است که در یادگیری ماشین استفاده میشود. در اصل از آن برای از بین بردن میانه از بردار ویژگی استفاده میشود بهطوریکه هر ویژگی روی محور صفر قرار گیرد. ما همچنین میتوانیم بایاس[2] (دادهای که از تخمینِ زده شده دور باشد) را از ویژگیهای بردار ویژگی حذف کنیم. برای اعمال تکنیک پردازش حذف میانه برروی دادههای نمونه، میتوانیم کد پایتون زیر را بنویسیم:
print(“Mean = “, input_data.mean(axis = 0))
print(“Std deviation = “, input_data.std(axis = 0))
بعد از اجرای کدهای بالا، خروجی زیر را خواهیم داشت:
Mean = [1.75-1.275 2.2]
Std deviation = [2.71431391 4.20022321 4.69414529]
حالا کد زیر میانه و انحراف معیار استاندارد را از داده ورودی حذف میکند:
data_scaled = preprocessing.scale(input_data)
print(“Mean =”, data_scaled.mean(axis=0))
print(“Std deviation =”, data_scaled.std(axis = 0))
ما بعد از اجرای کدهای بالا خروجی زیر را خواهیم داشت:
Mean = [1.11022302e-16 0.00000000e+00 0.00000000e+00]
Std deviation = [1. 1. 1.]
مقیاسگذاری
این یگی دیگر آر تکنیکهای پردازش داده است که برای مقیاسبندی بردارهای ویژگی استفاده میشود. مقیاس بندی بردارهای ویژگی موردنیاز است زیرا مقادیر هر ویژگی میتواند بین بسیاری از مقادیر تصادفی متفاوت باشد. به عبارت دیگر میتوان گفت مقیاسبندی مهم است زیرا نمیخواهیم هیچکدام از ویژگیها از نظر مصنوعی بزرگ یا کوچک باشند. با کمک کد پایتون زیر میتوانیم مقیاسگذاری دادههای ورودی خود را انجام دهیم، یعنی بردار ویژگی.
مقیاسگذاری MinMax
data_scaler_minmax = preprocessing.MinMaxScaler(feature_range=(0,1))
data_scaled_minmax = data_scaler_minmax.fit_transform(input_data)
print (“\nMin max scaled data:\n”, data_scaled_minmax)
ما خروجی زیر را بعد از اجرای کدهای بالا خواهیم داشت:
دادههای مقیاسشده MinMax
[[0.48648649 0.58252427 0.99122807]
[0. 1. 0.81578947]
[0.27027027 0. 1.]
[1. 0. 99029126 0.]]
بخشهای دیگر مقاله را از لینکهای زیر بخوانید:
هوش مصنوعی با پایتون، بخش چهارم – آمادهسازی دادهها (قسمت اول)
هوش مصنوعی با پایتون، بخش چهارم – آمادهسازی دادهها (قسمت سوم)
هوش مصنوعی با پایتون، بخش چهارم – آمادهسازی دادهها (قسمت آخر)
[1] Mean Removal
[2] Bias