আমি ভাবছিলাম যে কেউ আমাকে কুর্তোসিস সম্পর্কে তথ্য সাহায্য করতে পারে (অর্থাত আপনার ডেটা হ্রাস করার জন্য এটি রূপান্তর করার কোনও উপায় আছে?)
আমার কাছে একটি প্রশ্নপত্র ডেটাসেট রয়েছে যাতে প্রচুর পরিমাণে কেস এবং ভেরিয়েবল থাকে। আমার কয়েকটি ভেরিয়েবলের জন্য, ডেটাগুলি বেশ উচ্চ কুর্তোসিস মানগুলি (অর্থাত্ একটি লেপটোকুর্টিক বিতরণ) দেখায় যা অংশগ্রহণকারীদের মধ্যে অনেকগুলি ভেরিয়েবলের জন্য ঠিক একই স্কোর দেয় তা থেকে প্রাপ্ত। আমার একটি বিশেষত বড় আকারের নমুনা আকার রয়েছে, তাই কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্য অনুসারে, স্বাভাবিকতার লঙ্ঘনগুলি এখনও ঠিক হওয়া উচিত।
তবে সমস্যাটি হ'ল সত্য যে উচ্চতর স্তরের কুর্তোসিস আমার ডেটাসেটে অবিচ্ছিন্ন বহিরাগতদের একটি সংখ্যা তৈরি করে। যেমন, আমি যদি ডেটাটি রূপান্তর করি, বা আউটলিয়ারগুলি অপসারণ / সামঞ্জস্য করি তবে কুর্তোসিসের উচ্চ স্তরের অর্থ হ'ল পরবর্তী চরম স্কোরগুলি স্বয়ংক্রিয়ভাবে আউটলিয়ার হয়ে যায়। আমি ব্যবহার (লক্ষ্যভেদ ফাংশন বিশ্লেষণ) লক্ষ্য। বলা হয় যে ডিএফএ স্বাভাবিকতা থেকে বিদায় নেওয়ার পক্ষে শক্তিশালী, তবে শর্ত হয় যে লঙ্ঘনটি স্কিউনেসের কারণে হয়েছে এবং বিদেশী না হয়ে। তদ্ব্যতীত, ডিএফএ এছাড়াও ডেটা (ট্যাবচনিক এবং ফিদেল) এর outliers দ্বারা বিশেষত প্রভাবিত বলে বলা হয়।
এই কাছাকাছি পেতে কোন ধারণা? (আমার প্রাথমিক চিন্তাটি কুর্তোসিস নিয়ন্ত্রণের কিছু উপায় ছিল, তবে আমার নমুনার বেশিরভাগ ক্ষেত্রে একই রকম রেটিং দিলে কি এটি কোনও ভাল জিনিস নয়?)