একা আর 2 ফিটের ধার্মিকতার জন্য একটি ভাল পরিমাপ নয়, তবে এখানেমডেলিংয়ের ক্ষেত্রেপার্সিমনিমূল্যবানobserveআর2
তা করার জন্য, দয়া করে মনে রাখবেন মান কৌশল অনুসন্ধানমূলক তথ্য বিশ্লেষণ (EDA) এবং রিগ্রেশন (কিন্তু না ধাপে ধাপে বা অন্যান্য স্বয়ংক্রিয় পদ্ধতি) আকারে একটি রৈখিক মডেল ব্যবহার করার পরামর্শ দিই
চ--√= a + b ∗ c + a ∗ b ∗ c + ধ্রুবক + ত্রুটি
ওএলএস ব্যবহার করে এটি 0.99 এর উপরে একটি অর্জন করবে । যেমন একটি ফলাফলের দ্বারা Heartened, এক উভয় পক্ষের এবং regress স্কয়ার করতে প্রলুব্ধ করা হয় চ উপর একটি , , , এবং তাদের সব স্কোয়ার এবং পণ্য। এটি অবিলম্বে একটি মডেল উত্পাদন করেআর2চএকটিa ∗ b ∗ cখ ∗ সিa ∗ b ∗ c
চ= ক2+ বি ∗ সি + ধ্রুবক + ত্রুটি
34 এর কম বয়সী মূলের এমএসই এবং 0.9999 এর অ্যাডজাস্টেডআর2 with সহ । 1.0112 এবং 0.988 এর আনুমানিক সহগগুলি সূত্রের সাহায্যে ডেটা কৃত্রিমভাবে উত্পন্ন হতে পারে suggest
চ= ক2+ বি ∗ সি + 50
প্লাস্টিকের প্রায় 50 এর সমান এসডি-র সামান্য বিতরণ ত্রুটি।
সম্পাদন করা
@ নর্ভের ইঙ্গিতের জবাবে, আমি বিশ্লেষণ চালিয়েছি। এটি করার জন্য আমি সেই কৌশলগুলি ব্যবহার করেছি যা এখন পর্যন্ত সফল হয়েছিল, মূল ভেরিয়েবলগুলির বিপরীতে অবশিষ্টাংশগুলির স্ক্যাটারপ্লোট ম্যাট্রিকেস পরীক্ষা করে শুরু করেছিলাম। নিশ্চিত যথেষ্ট, তার মাঝে পারস্পরিক সম্পর্ক একটি স্পষ্ট ইঙ্গিত ছিল এবং অবশিষ্টাংশ (যদিও এর OLS ঔজ্জ্বল্যের প্রেক্ষাপটে রিগ্রেশন বিরুদ্ধে , , এবং হয়নি না ইঙ্গিত "উল্লেখযোগ্য" ছিল)। এই শিরায় অবিরত রেখে আমি চতুর্ভুজ শর্তগুলির মধ্যে এবং নতুন অবশিষ্টাংশগুলির মধ্যে সমস্ত পারস্পরিক সম্পর্ক সন্ধান করেছি এবং এর সাথে একটি ছোট কিন্তু অত্যন্ত গুরুত্বপূর্ণ সম্পর্ক খুঁজে পেয়েছিf a a 2 b ∗ c a a 2 , … , e 2 , a ∗ b , a ∗ c , … , d ∗ e b 2একটিচএকটিএকটি2খ ∗ সিএকটিএকটি2, … , ই2, a ∗ b , a ∗ c , … , d∗ ইখ2। "অত্যন্ত তাত্পর্যপূর্ণ" এর অর্থ এই সমস্ত স্নুপিং প্রায় 20 টি বিভিন্ন ভেরিয়েবলের দিকে তাকানো জড়িত, সুতরাং এই মাছ ধরার অভিযানের তাত্পর্যটির জন্য আমার মাপদণ্ডটি ছিল প্রায় 0.05 / 20 = 0.0025: এর চেয়ে কম কড়া কিছু সহজেই ফিটগুলির জন্য অনুসন্ধানের নিদর্শন হতে পারে।
এটি আমাদের প্রত্যাশায় একটি শারীরিক মডেলের স্বাদের কিছু রয়েছে এবং তাই "আকর্ষণীয়" এবং "সাধারণ" সহগের সাথে সম্পর্কগুলি অনুসন্ধান করে। সুতরাং, উদাহরণস্বরূপ, that এর আনুমানিক সহগ ছিল -0.0092 (95% আত্মবিশ্বাসের সাথে -0.005 এবং -0.013 এর মধ্যে), আমি এটির জন্য -1/100 ব্যবহার করতে নির্বাচিত হয়েছি। যদি এটি সামাজিক বা রাজনৈতিক ব্যবস্থার পর্যবেক্ষণের মতো অন্য কিছু ডেটাসেট হয় তবে আমি এ জাতীয় কোনও পরিবর্তন না করে কেবল ওএলএসের অনুমানগুলি ঠিক তেমন ব্যবহার করি।খ2
যাইহোক, একটি উন্নত ফিট দ্বারা দেওয়া হয়
চ= a + a2+ বি ∗ সি - বি2/ 100+30.5+ত্রুটি
গড় অবশিষ্ট অবধি , স্ট্যান্ডার্ড বিচ্যুতি 26.8, -50 এবং +43 এর মধ্যে সমস্ত অবশিষ্টাংশ এবং অ-স্বাভাবিকতার কোনও প্রমাণ নেই (যদিও এইরকম একটি ছোট ডেটাসেটের সাথে ত্রুটিগুলিও সমানভাবে বিতরণ করা যেতে পারে এবং সত্যই কোনও পার্থক্য বলতে পারে না)। প্রায় 50 থেকে 25 এর কাছাকাছি স্থিতিশীল স্ট্যান্ডার্ড বিচ্যুতি হ্রাস প্রায়শই "" অবশিষ্ট অবকাশের 75% ব্যাখ্যা করে "হিসাবে প্রকাশিত হবে।0
আমি কোন দাবি যে এই হয় ডেটা থেকে তৈরী করা সূত্র । অবশিষ্টাংশগুলি সহগের কয়েকটিতে মোটামুটি বড় পরিবর্তন আনতে যথেষ্ট বড়। উদাহরণস্বরূপ, , , এবং ধ্রুবকের সহগের জন্য 95% সিআই যথাক্রমে [-0.4, 2.7], [-0.013, -0.003] এবং [-7, 61]। মুল বক্তব্যটি হ'ল যদি ডেটা জেনারেশন পদ্ধতিতে কোনও এলোমেলো ত্রুটি আসলেই চালু করা হয় (এবং এটি বাস্তবের সমস্ত তথ্যের ক্ষেত্রে সত্য ) তবে এটি সহগের (এবং এমনকি যে সমস্ত ভেরিয়েবলগুলির সাথে জড়িত থাকতে পারে) এর যথাযথ সনাক্তকরণকে বাধা দেবে would )। এটি পরিসংখ্যান পদ্ধতির সীমাবদ্ধতা নয়: এটি কেবল একটি গাণিতিক সত্য।একটিখ2
বিটিডাব্লু, শক্তিশালী রিগ্রেশন ব্যবহার করে আমি মডেলটি ফিট করতে পারি
চ= 1.0103 এ2+ 0.99493 বি ∗ সি - 0.007 খ2+ 46.78 + ত্রুটি
২.4.৪ এর অবশেষ এসডি সহ এবং -51 এবং + 47 এর মধ্যে থাকা সমস্ত অবশিষ্টাংশ: মূলত আগের ফিটের মতোই তবে একটি কম ভেরিয়েবল সহ। এটি সেই অর্থে আরও পার্সোনিমিয়াস, তবে এই গুণে কম পার্সোনিমিয়াস যে আমি সহগকে "সুন্দর" মান হিসাবে গোল করিনি। তবুও, এই ফর্মটি আমি সাধারণত সহনশীলদের কী ধরণের মূল্যবোধ থাকা উচিত এবং কোন ভেরিয়েবলগুলি অন্তর্ভুক্ত করা উচিত সে সম্পর্কে কঠোর তত্ত্বগুলি অনুপস্থিতি কোনও রিগ্রেশন বিশ্লেষণে সমর্থন করব।
সম্ভবত অতিরিক্ত দৃ strong় সম্পর্কগুলি এখানে লুকিয়ে রয়েছে , তবে এগুলি মোটামুটি জটিল হতে হবে। ঘটনাক্রমে, যার মূল এসডি 3410 এর ডেটা নেওয়া এবং 27 এর এসডি সহ অবশিষ্টাংশগুলিতে তাদের প্রকরণ হ্রাস করা 99.99384% হ্রাস হয় ( এই নতুন ফিটের )। কেউ কেবলমাত্র অতিরিক্ত প্রভাবগুলির সন্ধান চালিয়ে যেতে পারে যদি উদ্দেশ্য অনুসারে অবশিষ্টাংশ এসডি খুব বেশি থাকে। ওপিকে দ্বিতীয় অনুমান করা ছাড়া কোনও উদ্দেশ্য অনুপস্থিতিতে, এটি বন্ধ করার সময়।আর2
FF
"জ্বলন ফলন"AA
ছিল এবং জ্বালানীBB
পরিমাণ ছিল , এবং অক্সিজেনের পরিমাণ ছিল, আপনি একটি ইন্টারঅ্যাক্টিং শব্দটিAA
BB