এই ধরণের মডেলটি বিজ্ঞানের নির্দিষ্ট শাখাগুলিতে (যেমন পদার্থবিজ্ঞান) এবং ইঞ্জিনিয়ারিংয়ে "সাধারণ" লিনিয়ার রিগ্রেশনের চেয়ে অনেক বেশি সাধারণ। সুতরাং, পদার্থবিজ্ঞানের সরঞ্জামগুলিতে যেমন ROOT
এই ধরণের ফিট করা তুচ্ছ, তবে লিনিয়ার রিগ্রেশন স্থানীয়ভাবে প্রয়োগ হয় না! পদার্থবিজ্ঞানীরা এটিকে কেবল "ফিট" বা চি-স্কোয়ার মিনিমাইজিং ফিট হিসাবে অভিহিত করেন।
সাধারণ লিনিয়ার রিগ্রেশন মডেল ধরে নেয় যে প্রতিটি পরিমাপের সাথে একটি সামগ্রিক বৈচিত্র রয়েছে । এরপরে এটি
বা সমতুল্যভাবে এর লগারিদম
সম্ভাবনা সর্বাধিক করে তোলে
অতএব নামটি সর্বনিম্ন-বর্গ - সম্ভাবনা সর্বাধিক করে তোলা বর্গের সমষ্টি কমানোর হিসাবে একই, এবং একটি গুরুত্বহীন ধ্রুবক, যতদিন এটা হয় ধ্রুবক। বিভিন্ন পরিচিত অনিশ্চয়তা রয়েছে এমন পরিমাপের সাহায্যে আপনি
σ
এল αΠআমিই-12(Yআমি- ( কএক্সআমি+ খ )σ)2
লগ( এল ) = গ ণ এন গুলি টন একটি এন টি -12σ2Σআমি(Yআমি- ( কএক্সআমি+ খ ))2
σএল ∝ ∏ই-12(Y- ( একটি এক্স + বি )σআমি)2
বা সমতুল্যভাবে এর লোগারিদম
So সুতরাং , আপনি প্রকৃতপক্ষে বিপরীত নয়, বিপরীত দ্বারা পরিমাপটি ওজন করতে চান । এটি উপলব্ধি করে - একটি আরও সঠিক পরিমাপের ক্ষেত্রে ছোট অনিশ্চয়তা থাকে এবং আরও ওজন দেওয়া উচিত। মনে রাখবেন যে এই ওজন যদি স্থির থাকে তবে তা যোগফলের বাইরে থেকে যায়। সুতরাং, এটা অনুমান করা মান প্রভাবিত করে না, কিন্তু এটা
করা উচিত মান ত্রুটি, দ্বিতীয় ব্যুৎপন্ন থেকে নেওয়া প্রভাবিত ।
log(L)=constant−12∑(yi−(axi+b)σi)2
1/σ2ilog(L)
তবে, এখানে আমরা পদার্থবিজ্ঞান / বিজ্ঞান এবং পরিসংখ্যানের মধ্যে আরও একটি পার্থক্য নিয়ে এসেছি। সাধারণত পরিসংখ্যানগুলিতে, আপনি আশা করেন যে দুটি ভেরিয়েবলের মধ্যে একটি পারস্পরিক সম্পর্ক থাকতে পারে তবে খুব কমই এটি সঠিক হবে exact অন্যদিকে পদার্থবিজ্ঞান এবং অন্যান্য বিজ্ঞানের ক্ষেত্রে, আপনি প্রায়শই একটি পারস্পরিক সম্পর্ক বা সম্পর্ক সঠিক হওয়ার প্রত্যাশা করেন, যদি এটি কেবল পেস্কি পরিমাপের ত্রুটির জন্য না হয় (যেমন, , ) না। আপনার সমস্যাটি ফিজিক্স / ইঞ্জিনিয়ারিংয়ের ক্ষেত্রে আরও পড়েছে বলে মনে হচ্ছে। ফলস্বরূপ, আপনার পরিমাপ এবং ওজনগুলির সাথে সংযুক্ত অনিশ্চয়তার ব্যাখ্যা আপনি যা চান তা ঠিক একই নয়। এটি ওজন নেবে, তবে এটি এখনও সামগ্রিকভাবে thinks রয়েছে বলে মনে করেF=maF=ma+ϵlm
σ2রিগ্রেশন ত্রুটির জন্য অ্যাকাউন্টে যা আপনি যা চান তা নয় - আপনি চান যে আপনার পরিমাপ ত্রুটি কেবল এক ধরণের ত্রুটিই হোক। ( lm
এর ব্যাখ্যার শেষ ফলাফলটি হ'ল কেবল ওজনগুলির আপেক্ষিক মূল্যবোধই আসে, এজন্য আপনি পরীক্ষা হিসাবে যুক্ত ধ্রুবক ওজনের কোনও প্রভাব পড়েনি)। এখানে প্রশ্নোত্তরের আরও বিশদ রয়েছে:
এলএম ওজন এবং মান ত্রুটি
উত্তরগুলিতে দেওয়া কয়েকটি সম্ভাব্য সমাধান রয়েছে। বিশেষত, সেখানে একটি বেনামি উত্তর ব্যবহার করার পরামর্শ দেয়
vcov(mod)/summary(mod)$sigma^2
মূলত, lm
কোভারিয়েন্স ম্যাট্রিক্স এর আনুমানিকের ভিত্তিতে স্কেল করেσ, এবং আপনি এটিকে পূর্বাবস্থায় ফিরিয়ে আনতে চান। তারপরে আপনি সংশোধিত কোভেরিয়েন্স ম্যাট্রিক্স থেকে আপনার পছন্দের তথ্যটি পেতে পারেন। এটি চেষ্টা করে দেখুন, তবে আপনি যদি ম্যানুয়াল লিনিয়ার বীজগণিতটি দিয়ে পারেন তবে এটি ডাবল-চেক করার চেষ্টা করুন। এবং মনে রাখবেন যে ওজনগুলির বিপরীত বৈকল্পিক হওয়া উচিত।
সম্পাদনা
আপনি যদি এই ধরণের জিনিসটি ব্যবহার করে থাকেন তবে আপনি ব্যবহার করার বিষয়টি বিবেচনা করতে পারেন ROOT
(যা মনে হয় এটি এই স্থানীয়ভাবে করার সময় হয় lm
এবং glm
না)। এটি কীভাবে করা যায় তার একটি সংক্ষিপ্ত উদাহরণ এখানে ROOT
। প্রথমে, ROOT
সি ++ বা পাইথনের মাধ্যমে ব্যবহার করা যেতে পারে এবং এটি একটি বিশাল ডাউনলোড এবং ইনস্টলেশন। আপনি ব্রাউজারে এটি বৃহস্পতি নোটবুক ব্যবহার করে এখানে লিঙ্কটি অনুসরণ করে ডানদিকে "বাইন্ডার" এবং বামদিকে "পাইথন" বেছে নিতে পারেন।
import ROOT
from array import array
import math
x = range(1,11)
xerrs = [0]*10
y = [131.4,227.1,245,331.2,386.9,464.9,476.3,512.2,510.8,532.9]
yerrs = [math.sqrt(i) for i in y]
graph = ROOT.TGraphErrors(len(x),array('d',x),array('d',y),array('d',xerrs),array('d',yerrs))
graph.Fit("pol2","S")
c = ROOT.TCanvas("test","test",800,600)
graph.Draw("AP")
c.Draw()
আমি অনিশ্চয়তা হিসাবে স্কোয়ার শিকড় স্থাপন করেছি yমান। ফিট আউটপুট হয়
Welcome to JupyROOT 6.07/03
****************************************
Minimizer is Linear
Chi2 = 8.2817
NDf = 7
p0 = 46.6629 +/- 16.0838
p1 = 88.194 +/- 8.09565
p2 = -3.91398 +/- 0.78028
এবং একটি দুর্দান্ত প্লট তৈরি করা হয়েছে:
রুট ফিটার এছাড়াও অনিশ্চয়তা পরিচালনা করতে পারে xমানগুলি, যার সম্ভবত আরও বেশি হ্যাকিংয়ের প্রয়োজন হবে lm
। যদি আর-তে এটি করার কোনও স্থানীয় উপায় জেনে থাকে তবে আমি এটি জানতে আগ্রহী।
দ্বিতীয় সম্পাদনা
@ ওল্ফগ্যাং দ্বারা পূর্ববর্তী একই প্রশ্নের অন্য উত্তরটি আরও ভাল সমাধান দেয়: প্যাকেজটি rma
থেকে প্রাপ্ত সরঞ্জাম metafor
(আমি মূলত উত্তরটির পাঠ্যটির অর্থ এটি বোঝাতে চাইছি যে এটি বিরতি গণনা করে নি, তবে এটি ক্ষেত্রে নেই)। Y পরিমাপের বিভিন্ন রূপ গ্রহণ করা সহজভাবে y হতে:
> rma(y~x+I(x^2),y,method="FE")
Fixed-Effects with Moderators Model (k = 10)
Test for Residual Heterogeneity:
QE(df = 7) = 8.2817, p-val = 0.3084
Test of Moderators (coefficient(s) 2,3):
QM(df = 2) = 659.4641, p-val < .0001
Model Results:
estimate se zval pval ci.lb ci.ub
intrcpt 46.6629 16.0838 2.9012 0.0037 15.1393 78.1866 **
x 88.1940 8.0956 10.8940 <.0001 72.3268 104.0612 ***
I(x^2) -3.9140 0.7803 -5.0161 <.0001 -5.4433 -2.3847 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
এই ধরণের রিগ্রেশনের জন্য এটি অবশ্যই সেরা খাঁটি আর সরঞ্জাম found
boot
আপনি আর এ প্যাকেজটি ব্যবহার করে এটি বুটস্ট্র্যাপ করতে পারেন wards এর পরে আপনি বুটস্ট্র্যাপড ডেটা সেটটিতে লিনিয়ার রিগ্রেশন চালাতে পারেন।