কে-এনএন-এর জন্য আমি এবং মধ্যে ডেটা স্বাভাবিক করার পরামর্শ দেব ।01
কে-এনএন উদাহরণগুলির তুলনা করার মাধ্যম হিসাবে ইউক্লিডিয়ান দূরত্ব ব্যবহার করে । দুটি পয়েন্টের মধ্যে দূরত্ব গণনা করতে এবং , যেখানে এর তম বৈশিষ্ট্যের মান :x1=(f11,f21,...,fM1)x2=(f12,f22,...,fM2)fi1ix1
d(x1,x2)=(f11−f12)2+(f21−f22)2+...+(fM1−fM2)2−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√
আদেশের জন্য এ সব বৈশিষ্ট্য হতে সমান যখন দূরত্ব গণক গুরুত্ব, বৈশিষ্ট্য আবশ্যক মান একই পরিসীমা আছে। এটি কেবলমাত্র সাধারণীকরণের মাধ্যমেই অর্জনযোগ্য।
যদি সেগুলি স্বাভাবিক না করা হয় এবং উদাহরণস্বরূপ বৈশিষ্ট্যটি এর ) এর মানগুলির একটি ব্যাপ্তি ছিল , যখন এর এর মানগুলির একটি সীমা ছিল । দূরত্ব গণনা করার সময়, দ্বিতীয় শব্দটি প্রথমটির চেয়ে গুণ গুরুত্বপূর্ণ হবে, কে-এনএন প্রথমের চেয়ে দ্বিতীয় বৈশিষ্ট্যের উপর বেশি নির্ভর করবে। সাধারনকরণ নিশ্চিত করে যে সমস্ত বৈশিষ্ট্য একই মানের সীমাতে ম্যাপ করা আছে ।f1[0,1f2[1,10)10
অন্যদিকে, মানককরণের অনেকগুলি দরকারী বৈশিষ্ট্য রয়েছে তবে বৈশিষ্ট্যগুলি একই পরিসরে ম্যাপ করা হয়েছে তা নিশ্চিত করতে পারে না । মানককরণ অন্যান্য শ্রেণিবদ্ধদের জন্য সবচেয়ে উপযুক্ত হতে পারে তবে কে-এনএন বা অন্য কোনও দূরত্ব-ভিত্তিক শ্রেণিবদ্ধের ক্ষেত্রে এটি নয়।