আপনার ঠিক এটি বোঝা গেছে কিনা তা আমি জানি না তবে আমি প্রচুর লোককে নরমালাইজেশন অর্থ ডেটা স্ট্যান্ডার্ডাইজেশন হিসাবে উল্লেখ করে দেখছি। মানককরণ আপনার ডেটা রুপান্তর করছে তাই এর অর্থ 0 এবং স্ট্যান্ডার্ড বিচ্যুতি 1:
x <- (x - mean(x)) / sd(x)
আমি ডেটা স্কেলিংয়ের জন্য নরমালাইজেশন শব্দটি ব্যবহার করে এমন লোককেও দেখতে পাই, যেমন আপনার ডেটা 0-1 রেঞ্জে রূপান্তরিত করে:
x <- (x - min(x)) / (max(x) - min(x))
এটা বিভ্রান্তিকর হতে পারে!
উভয় কৌশল তাদের উপকারিতা এবং কনস আছে। অনেক বেশি আউটলিয়ারের সাথে একটি ডেটাসেট স্কেল করার সময়, আপনার অ-আউটিলারের ডেটা খুব ছোট ব্যবধানে শেষ হতে পারে। সুতরাং যদি আপনার ডেটাসেটের অনেক বেশি বিদেশী থাকে, আপনি এটি মানক হিসাবে বিবেচনা করতে চাইতে পারেন। তবুও, যখন আপনি এটি করেন তখন আপনি নেতিবাচক ডেটা (কখনও কখনও আপনি এটি চান না) এবং আনবাউন্ডেড ডেটা (আপনি এটিও নাও চাইতে পারেন) দিয়ে শেষ করবেন।