আমি একটি দ্বৈত এবং একটি অবিচ্ছিন্ন পরিবর্তনশীল মধ্যে পারস্পরিক সম্পর্ক সন্ধান করার চেষ্টা করছি।
এটি সম্পর্কে আমার স্থল কাজ থেকে আমি জানতে পেরেছি যে আমাকে স্বাধীন টি-টেস্ট ব্যবহার করতে হবে এবং এর পূর্বশর্ত হ'ল ভেরিয়েবলের বিতরণ স্বাভাবিক হতে হবে।
আমি স্বাভাবিকতা পরীক্ষা করার জন্য কোলমোগোরভ-স্মারনভ পরীক্ষা করেছিলাম এবং দেখতে পেলাম যে অবিচ্ছিন্ন পরিবর্তনশীলটি নরমাল এবং স্কিউড (প্রায় 4,000 ডেটা পয়েন্টের জন্য)।
আমি ভেরিয়েবলের পুরো পরিসীমা জন্য কোলমোগোরভ-স্মারনভ পরীক্ষা করেছিলাম। আমি কি তাদের গ্রুপে বিভক্ত করে পরীক্ষা করব? অর্থাৎ, বলুন যদি আমার risk level
( 0
= ঝুঁকিপূর্ণ নয়, 1
= ঝুঁকিপূর্ণ) এবং কোলেস্টেরলের মাত্রা থাকে তবে আমার উচিত:
তাদের দুটি গ্রুপে ভাগ করুন, যেমন
Risk level =0 (Cholestrol level) -> Apply KS Risk level =1 (Cholestrol level) -> Apply KS
তাদের একসাথে নিয়ে পরীক্ষা প্রয়োগ করবেন? (আমি এটি কেবল পুরো ডেটাसेटে সঞ্চালন করেছি))
তারপরে, এটি এখনও স্বাভাবিক অবস্থায় না থাকলে আমার কোন পরীক্ষা করা উচিত?
সম্পাদনা: উপরের দৃশ্যপটটি আমি আমার সমস্যার জন্য সরবরাহ করার চেষ্টা করেছি এমন একটি বিবরণ ছিল। আমার কাছে একটি ডেটাসেট রয়েছে যাতে 1000 এরও বেশি ভেরিয়েবল এবং প্রায় 4000 নমুনা রয়েছে। এগুলি হয় নিরন্তর বা স্বভাবগত প্রকৃতির। আমার কাজটি হ'ল এই ভেরিয়েবলগুলির উপর ভিত্তি করে একটি দ্বিধাত্বক ভেরিয়েবলের পূর্বাভাস দেওয়া (সম্ভবত একটি লজিস্টিক রিগ্রেশন মডেল নিয়ে আসা)। সুতরাং আমি ভেবেছিলাম প্রাথমিক তদন্তে দ্বৈত এবং একটি অবিচ্ছিন্ন পরিবর্তনশীল মধ্যে পারস্পরিক সম্পর্ক খুঁজে পাওয়া জড়িত।
আমি ভেরিয়েবলগুলির বিতরণ কীভাবে তা দেখার চেষ্টা করছিলাম এবং তাই টি-টেস্টে যাওয়ার চেষ্টা করছিলাম। এখানে আমি একটি সমস্যা হিসাবে স্বাভাবিকতা খুঁজে পেয়েছি। কোলমোগোরভ-স্মারনভ পরীক্ষা এর বেশিরভাগ চলকগুলিতে 0.00 এর তাত্পর্যপূর্ণ মূল্য দেয়।
আমার কি এখানে স্বাভাবিকতা অনুমান করা উচিত? এই ভেরিয়েবলগুলির স্কিউনেস এবং কুর্তোসিসও দেখায় যে প্রায় সমস্ত ক্ষেত্রে ডেটা স্কিউড (> 0) হয়।
নীচে প্রদত্ত নোট অনুসারে আমি আরও বিন্দু-দ্বিপাক্ষিক সম্পর্কটি তদন্ত করব। তবে ভেরিয়েবল বিতরণ সম্পর্কে আমি এখনও অনিশ্চিত।