টি-এসএনই প্রয়োগের আগে ডেটা কেন্দ্রীকরণ + স্কেল করা উচিত?


18

আমার ডেটাগুলির কয়েকটি বৈশিষ্ট্যের বড় মান রয়েছে, অন্য বৈশিষ্ট্যগুলির মধ্যে খুব ছোট মান রয়েছে।

বৃহত্তর মানগুলির প্রতি পক্ষপাতিত্ব রোধ করতে টি-এসএনই প্রয়োগ করার আগে কি + স্কেল ডেটা কেন্দ্র করা প্রয়োজন?

আমি পাইথনের sklearn.manifold.TSNE বাস্তবায়ন ডিফল্ট ইউক্লিডিয়ান দূরত্বের মেট্রিকের সাথে ব্যবহার করি।

উত্তর:


18

কেন্দ্রীভূত হওয়া উচিত নয় যেহেতু অ্যালগরিদম কেবলমাত্র পয়েন্টগুলির মধ্যে দূরত্বের উপর নির্ভর করে, তবে আপনি যদি বিভিন্ন মাত্রাকে সমান গুরুত্ব সহকারে বিবেচনা করতে চান তবে উদ্ধার করা জরুরি, যেহেতু 2-আদর্শ আরও বড় আকারের প্রকরণের সাথে মাত্রা দ্বারা আরও বেশি প্রভাবিত হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.