যদি কেউ সম্ভব হয় তবে আমাকে রিগ্রেশন বিশ্লেষণ এবং বক্ররেখা ফিটিং (লিনিয়ার এবং ননলাইনার) এর মধ্যে বাস্তব পার্থক্য (গুলি) ব্যাখ্যা করতে পারেন, যদি সম্ভব হয় তবে একটি উদাহরণ দিয়ে?
দেখে মনে হচ্ছে যে উভয়ই দুটি ভেরিয়েবলের মধ্যে সম্পর্ক নির্ধারণের চেষ্টা করে (নির্ভর করে বনাম স্বতন্ত্র) এবং তারপরে মডেলগুলির সাথে সম্পর্কিত পরামিতি (বা সহগ) নির্ধারিত হয়। উদাহরণস্বরূপ, যদি আমার কাছে ডেটার সেট থাকে যেমন:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
কেউ কি এই দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক সূত্রের পরামর্শ দিতে পারেন? এই দুটি পদ্ধতির মধ্যে পার্থক্য বুঝতে আমার অসুবিধা হচ্ছে। আপনি যদি নিজের উত্তরটিকে অন্য ডেটা সেটগুলির সাথে সমর্থন করতে পছন্দ করেন তবে এটি ঠিক আছে যেহেতু এটি ফিট করা শক্ত বলে মনে হয় (সম্ভবত কেবল আমার জন্য)।
উপরে ডেটা সেট প্রতিনিধিত্ব করে এবং ওয়াই একটি এর অক্ষ রিসিভার অপারেটিং চরিত্রগত (আরওসি) বক্ররেখা, যেখানে Y হল সত্য ইতিবাচক হার (TPR) এবং এক্স হয় মিথ্যা ইতিবাচক হার (FPR)।
আমি কোনও নির্দিষ্ট এফপিআর (বা তদ্বিপরীত) এর জন্য টিপিআর অনুমান করার জন্য এই মূল বিষয়গুলির মধ্যে এখনও আমার মূল প্রশ্ন অনুসারে একটি বাঁকানো ফিট করার চেষ্টা করছি, বা একটি রিগ্রেশন বিশ্লেষণ করব, এখনও নিশ্চিত নই।
প্রথমত, দুটি স্বতন্ত্র ভেরিয়েবল (টিপিআর এবং এফপিআর) এর মধ্যে এমন বক্ররেখা ফিটিংয়ের কাজটি কী বৈজ্ঞানিকভাবে গ্রহণযোগ্য?
দ্বিতীয়ত, আমি যদি জানি যে প্রকৃত নেতিবাচক এবং প্রকৃত ইতিবাচক মামলার বিতরণগুলি স্বাভাবিক নয় তবে এই জাতীয় কোনও ক্রিয়াকলাপ বৈজ্ঞানিকভাবে গ্রহণযোগ্য?