পরিসংখ্যানবিদরা কি ধরে নিয়েছেন যে কেউ একটি গাছের অতিরিক্ত জল ফেলতে পারে না, বা আমি কেবল বক্ররেখার প্রতিরোধের জন্য ভুল অনুসন্ধান শব্দ ব্যবহার করছি?


18

লিনিয়ার রিগ্রেশন এবং জিএলএম সম্পর্কে আমি যা পড়েছি তার প্রায় প্রতিটি এটিই এখানে সিদ্ধ হয়: যেখানে এক্স এবং \ বিটা একটি ক্রমবর্ধমান বা অ-ক্রমযুক্ত ফাংশন হ'ল আপনি প্যারামিটার সম্পর্কে অনুমান এবং পরীক্ষা অনুমান। Y কে x এর f (x, \ বিটা) এর লিনিয়ার ফাংশন তৈরি করতে y এবং x এর কয়েক ডজন লিঙ্ক ফাংশন এবং রূপান্তর রয়েছে ।f ( x , β ) x β yY=(এক্স,β)(এক্স,β)এক্সβYy f ( x , β )এক্সY(এক্স,β)

এখন, যদি আপনি f (x, \ বিটা) এর জন্য ক্রমবর্ধমান / অ-হ্রাসমান প্রয়োজনীয়তা সরিয়ে ফেলেন তবে (এক্স,β)আমি প্যারামেট্রিক লিনিয়ারাইজড মডেল লাগানোর জন্য কেবল দুটি পছন্দ জানি: ট্রিগ ফাংশন এবং বহুবচন। উভয়ই প্রতিটি পূর্বাভাসযুক্ত Y এবং সম্পূর্ণ এক্স এর মধ্যে কৃত্রিম নির্ভরতা তৈরি করে এক্স, এগুলিকে একটি খুব অ-দৃust় ফিট করে তোলে যদি না যে বিশ্বাসের পূর্ববর্তী কারণ না থাকে যে আপনার ডেটা আসলে একটি চক্রীয় বা বহুবিক প্রক্রিয়া দ্বারা উত্পন্ন হয়েছে।

এটি কোনও ধরণের রহস্যজনক প্রবণতা নয়। এটি জল এবং ফসলের ফলনের মধ্যে প্রকৃত, সাধারণ জ্ঞানের সম্পর্ক (একবার প্লটগুলি পানির নিচে যথেষ্ট গভীর হয়ে গেলে, ফসলের ফলন হ্রাস শুরু হবে), বা প্রাতঃরাশে এবং ক্যালিরির মধ্যে গণিতের কুইজে পারফরম্যান্স বা কারখানার শ্রমিকের সংখ্যা between এবং তারা যে পরিমাণ উইজেট উত্পাদন করে ... সংক্ষেপে, প্রায় কোনও বাস্তব জীবনের ক্ষেত্রে যার জন্য রৈখিক মডেলগুলি ব্যবহৃত হয় তবে ডেটা সহ এমন বিস্তৃত পরিসীমা জুড়ে থাকে যা আপনি নেতিবাচক রিটার্নগুলিতে হ্রাসকারী অতীতের পিছনে যান।

আমি 'অবতল', 'উত্তল', 'কার্ভিলাইনার', 'নন-একজাতীয়', 'বাথটব' শব্দটি সন্ধান করার চেষ্টা করেছি এবং আরও কতগুলি আমি ভুলে গিয়েছি। কয়েকটি প্রাসঙ্গিক প্রশ্ন এবং এর চেয়ে কম ব্যবহারযোগ্য উত্তর। সুতরাং, ব্যবহারিক ভাষায়, আপনার যদি নিম্নলিখিত তথ্য থাকে (আর কোড, ওয়াই অবিচ্ছিন্ন ভেরিয়েবল এক্স এবং বিচ্ছিন্ন ভেরিয়েবল গ্রুপের কাজ):

updown<-data.frame(y=c(46.98,38.39,44.21,46.28,41.67,41.8,44.8,45.22,43.89,45.71,46.09,45.46,40.54,44.94,42.3,43.01,45.17,44.94,36.27,43.07,41.85,40.5,41.14,43.45,33.52,30.39,27.92,19.67,43.64,43.39,42.07,41.66,43.25,42.79,44.11,40.27,40.35,44.34,40.31,49.88,46.49,43.93,50.87,45.2,43.04,42.18,44.97,44.69,44.58,33.72,44.76,41.55,34.46,32.89,20.24,22,17.34,20.14,20.36,24.39,22.05,24.21,26.11,28.48,29.09,31.98,32.97,31.32,40.44,33.82,34.46,42.7,43.03,41.07,41.02,42.85,44.5,44.15,52.58,47.72,44.1,21.49,19.39,26.59,29.38,25.64,28.06,29.23,31.15,34.81,34.25,36,42.91,38.58,42.65,45.33,47.34,50.48,49.2,55.67,54.65,58.04,59.54,65.81,61.43,67.48,69.5,69.72,67.95,67.25,66.56,70.69,70.15,71.08,67.6,71.07,72.73,72.73,81.24,73.37,72.67,74.96,76.34,73.65,76.44,72.09,67.62,70.24,69.85,63.68,64.14,52.91,57.11,48.54,56.29,47.54,19.53,20.92,22.76,29.34,21.34,26.77,29.72,34.36,34.8,33.63,37.56,42.01,40.77,44.74,40.72,46.43,46.26,46.42,51.55,49.78,52.12,60.3,58.17,57,65.81,72.92,72.94,71.56,66.63,68.3,72.44,75.09,73.97,68.34,73.07,74.25,74.12,75.6,73.66,72.63,73.86,76.26,74.59,74.42,74.2,65,64.72,66.98,64.27,59.77,56.36,57.24,48.72,53.09,46.53),
                   x=c(216.37,226.13,237.03,255.17,270.86,287.45,300.52,314.44,325.61,341.12,354.88,365.68,379.77,393.5,410.02,420.88,436.31,450.84,466.95,477,491.89,509.27,521.86,531.53,548.11,563.43,575.43,590.34,213.33,228.99,240.07,250.4,269.75,283.33,294.67,310.44,325.36,340.48,355.66,370.43,377.58,394.32,413.22,428.23,436.41,455.58,465.63,475.51,493.44,505.4,521.42,536.82,550.57,563.17,575.2,592.27,86.15,91.09,97.83,103.39,107.37,114.78,119.9,124.39,131.63,134.49,142.83,147.26,152.2,160.9,163.75,172.29,173.62,179.3,184.82,191.46,197.53,201.89,204.71,214.12,215.06,88.34,109.18,122.12,133.19,148.02,158.72,172.93,189.23,204.04,219.36,229.58,247.49,258.23,273.3,292.69,300.47,314.36,325.65,345.21,356.19,367.29,389.87,397.74,411.46,423.04,444.23,452.41,465.43,484.51,497.33,507.98,522.96,537.37,553.79,566.08,581.91,595.84,610.7,624.04,637.53,649.98,663.43,681.67,698.1,709.79,718.33,734.81,751.93,761.37,775.12,790.15,803.39,818.64,833.71,847.81,88.09,105.72,123.35,132.19,151.87,161.5,177.34,186.92,201.35,216.09,230.12,245.47,255.85,273.45,285.91,303.99,315.98,325.48,343.01,360.05,373.17,381.7,398.41,412.66,423.66,443.67,450.39,468.86,483.93,499.91,511.59,529.34,541.35,550.28,568.31,584.7,592.33,615.74,622.45,639.1,651.41,668.08,679.75,692.94,708.83,720.98,734.42,747.83,762.27,778.74,790.97,806.99,820.03,831.55,844.23),
                   group=factor(rep(c('A','B'),c(81,110))));

plot(y~x,updown,subset=x<500,col=group);

Scatterplot

আপনি প্রথমে একটি বক্স-কক্স রূপান্তর চেষ্টা করতে পারেন এবং দেখুন যে এটি যান্ত্রিক ধারণা তৈরি করেছে কিনা এবং এটি ব্যর্থ হয়ে আপনি লজিস্টিক বা অ্যাসিম্পটোটিক লিঙ্ক ফাংশন সহ একটি ননলাইনারে সর্বনিম্ন স্কোয়ার মডেল ফিট করতে পারেন।

সুতরাং, আপনার কেন সম্পূর্ণ প্যারামেট্রিক মডেলগুলি ছেড়ে দেওয়া উচিত এবং স্প্লাইচের মতো একটি কালো-বাক্সের পদ্ধতিতে ফিরে আসা উচিত যখন আপনি যখন জানতে পারবেন যে পুরো ডেটাসেটটি এমন দেখাচ্ছে ...

plot(y~x,updown,col=group);

আমার প্রশ্নগুলি হ'ল:

  • এই শ্রেণীর ক্রিয়ামূলক সম্পর্কের প্রতিনিধিত্বকারী লিঙ্ক ফাংশনগুলি সন্ধান করার জন্য আমার কী পদগুলির সন্ধান করা উচিত?

অথবা

  • এই শ্রেণীর ক্রিয়ামূলক সম্পর্কের সাথে কীভাবে লিংক ফাংশনগুলি ডিজাইন করবেন বা বর্তমানে কেবল একঘেয়ে প্রতিবেদনের জন্য বিদ্যমান বিদ্যমানগুলি প্রসারিত করবেন তা শেখানোর জন্য আমার কী পড়তে এবং / অথবা অনুসন্ধান করা উচিত?

অথবা

  • হেক, এমন কি প্রশ্নের জন্য স্ট্যাকএক্সচেঞ্জ ট্যাগ সবচেয়ে উপযুক্ত!

4
তুমি কি জিজ্ঞাসা করছ আমার কোন ধারণা নেই আপনি একটি নন-মনোটোনিক ফাংশন ফিট করতে চান ... আবার বহুবর্ষীয় রিগ্রেশন বা সাইন রিগ্রেশন আপনার সমস্যাটি ঠিক কী ?? এছাড়াও ... "লিঙ্ক ফাংশন" ... আপনি এই শব্দটি ব্যবহার করে চলেছেন ... আমি মনে করি না এটির অর্থ যা বোঝায় এটির অর্থ means এক্স
জেক ওয়েস্টফল

5
(1) আপনার Rকোডটিতে সিনট্যাক্স ত্রুটি রয়েছে: groupউদ্ধৃত করা উচিত নয়। (২) প্লটটি সুন্দর: লাল বিন্দুগুলি একটি রৈখিক সম্পর্কের চিত্র প্রদর্শন করে এবং কালোগুলি টুকরোচক লিনিয়ার রিগ্রেশন (একটি পরিবর্তন পয়েন্ট মডেল সহ প্রাপ্ত) সহ এবং এমনকি সম্ভবত একটি ক্ষতিকারক হিসাবেও বেশ কয়েকটি উপায়ে ফিট হতে পারে। তবে আমি এগুলি সুপারিশ করছি না , কারণ মডেলিংয়ের পছন্দগুলি সম্পর্কিত তথ্যগুলি সম্পর্কিত তথ্যগুলি তৈরি করে এবং সম্পর্কিত তত্ত্বগুলিতে তত্ত্ব দ্বারা অনুপ্রাণিত হয় তা বোঝার মাধ্যমে অবহিত করা উচিত। তারা আপনার গবেষণার জন্য আরও ভাল শুরু হতে পারে।
শুক্র

1
@ শুভ ধন্যবাদ! কোড স্থির। তাত্ত্বিক প্রেরণার বিষয়ে: এগুলি কোথা থেকে আসে? আমার বেঞ্চ বিজ্ঞানী সহযোগীরা আনন্দের সাথে ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি পৃথক করে দেবেন এবং তাদের উপর টি-টেস্ট করবেন। সুতরাং আমার কাছে এমন একটি গাণিতিক সম্পর্ক সন্ধানের মাধ্যমে ডেটা নষ্ট করা বন্ধ করার উপায় খুঁজে পাওয়া যায় যা "y" থেকে "y" এর সাথে "y" এর সাথে সংক্রমণটি ধীরে ধীরে রূপান্তর করে তবে x এর সাথে "y" এর সাথে নেতিবাচকভাবে x এর সাথে সংযোগ দেয়। এই ব্যর্থতায়, এনজাইম, সাবস্ট্রেট এবং পণ্যগুলির মধ্যে কোনও সম্পর্ক খুঁজে পাওয়ার পরে মাইকেলিস এবং মেন্টেন কী করেছিলেন, তা আমাকে পুনরায় রচনা করতে হবে।
f1r3br4nd

1
সেই বিষয়গুলি যেখানে "কিঙ্ক" আগে থেকেই জানা ছিল?
গ্লেন_বি -রিনস্টেট মনিকা

3
উত্তেজক শিরোনাম এবং ফলোআপের জন্য +1 যা আসলে বোঝায়
স্টম্পি জো পিট

উত্তর:


45

লিঙ্ক ফাংশন এবং একঘেয়েমি সম্পর্কে প্রশ্নে মন্তব্যগুলি একটি লাল রঙের হেরিং। তাদের অন্তর্নিহিত একটি অন্তর্নিহিত ধৃষ্টতা মনে করা হয় যে একটি সাধারণ রৈখিক মডেল (GLM), একটি প্রতিক্রিয়া প্রত্যাশা প্রকাশ দ্বারা একটি একঘেয়ে ফাংশন হিসাবে একটি রৈখিক সমন্বয় এক্স β ব্যাখ্যামূলক ভেরিয়েবল এক্স , অ্যাকাউন্টে নমনীয় যথেষ্ট অ- জন্য নয় একঘেয়ে জবাব এটা ঠিক তাই না।Yএক্সβএক্স


সম্ভবত একটি কাজের উদাহরণ এই বিষয়টি আলোকিত করবে। ১৯৪৮ সালের এক গবেষণায় (১৯ 1977 সালে মরণোত্তর প্রকাশিত এবং কখনও পিয়ার-পর্যালোচনা করা হয়নি) জে। টলকিয়েন একটি উদ্ভিদ জলের পরীক্ষার ফলাফলের কথা জানিয়েছিলেন যে ২৪ টি সূর্যমুখী ( হেলিয়ান্থাস গন্ডোরেন্সিস ) এর ১৩ টি দলকে তিন মাসের মধ্যে অঙ্কুরোদগম হতে শুরু করে নিয়ন্ত্রিত পরিমাণে জল দেওয়া হয়েছিল বৃদ্ধি। প্রয়োগকৃত মোট পরিমাণগুলি দুই ইঞ্চি ইনক্রিমেন্টে এক ইঞ্চি থেকে 25 ইঞ্চি পর্যন্ত পরিবর্তিত হয়।

চিত্র 1

জল সরবরাহের জন্য একটি স্পষ্ট ইতিবাচক প্রতিক্রিয়া এবং অতিরিক্ত জল দেওয়ার জন্য একটি দৃ strong় নেতিবাচক প্রতিক্রিয়া রয়েছে। আয়ন পরিবহনের অনুমানমূলক গতিশীল মডেলের উপর ভিত্তি করে পূর্ববর্তী কাজটি অনুমান করেছিল যে দুটি প্রতিযোগী ব্যবস্থা এই আচরণের জন্য দায়বদ্ধ হতে পারে: একটির ফলে স্বল্প পরিমাণে জলের লিনিয়ার প্রতিক্রিয়া ঘটেছিল (যেমন বেঁচে থাকার লগের প্রতিকৃতিতে পরিমাপ করা হয়), অন্যটি- - বাধা ফ্যাক্টর - তাত্ক্ষণিকভাবে অভিনয় (যা একটি দৃ strongly়ভাবে অ-রৈখিক প্রভাব)। প্রচুর পরিমাণে জলের সাথে, বাধা ফ্যাক্টর পানির ইতিবাচক প্রভাবগুলিকে ছাপিয়ে যায় এবং প্রশংসনীয়ভাবে মৃত্যুহার বাড়িয়ে তোলে।

κওয়াইএনএক্স

দ্বিপদ(এন,(β0+ +β1এক্স-β2মেপুঃ(κএক্স)))
এক্সκβ0β1β2-1([ওয়াই])এক্স1β0এক্সβ1-মেপুঃ(κএক্স)β2

κκR

water <- seq(1, 25, length.out=13)
n.survived <- c(0, 3, 4, 12, 18, 21, 23, 24, 22, 23, 18, 3, 2)
pop <- 24
counts <- cbind(n.survived, n.died=pop-n.survived)
f <- function(k) {
  fit <- glm(counts ~ water + I(-exp(water * k)), family=binomial)
  list(AIC=AIC(fit), fit=fit)
}
k.est <- optim(0.1, function(k) f(k)$AIC, method="Brent", lower=0, upper=1)$par
fit <- f(k.est)$fit

কোন প্রযুক্তিগত অসুবিধা নেই; গণনাটি নেয় মাত্র 1/30 সেকেন্ড।

চিত্র ২

[ওয়াই]

[ওয়াই]এক্সR

x.0 <- seq(min(water), max(water), length.out=100)
p.0 <- cbind(rep(1, length(x.0)), x.0, -exp(k.est * x.0))
logistic <- function(x) 1 - 1/(1 + exp(x))
predicted <- pop * logistic(p.0 %*% coef(fit))

plot(water, n.survived / pop, main="Data and Fit",
     xlab="Total water (inches)", 
     ylab="Proportion surviving at 3 months")
lines(x.0, predicted / pop, col="#a0a0ff", lwd=2)

প্রশ্নের উত্তরগুলি হ'ল:

এই শ্রেণীর ক্রিয়ামূলক সম্পর্কের প্রতিনিধিত্বকারী লিঙ্ক ফাংশনগুলি সন্ধান করার জন্য আমার কী পদগুলির সন্ধান করা উচিত?

কোনওটি নয় : এটি লিঙ্ক ফাংশনের উদ্দেশ্য নয়।

আমার কী ... অনুসন্ধান করতে হবে ... বিদ্যমান [লিঙ্ক ফাংশন] বাড়ানোর জন্য যা বর্তমানে কেবলমাত্র একঘেয়ে প্রতিক্রিয়ার জন্য?

কিছুই নয় : এটি প্রতিক্রিয়াগুলিকে কীভাবে মডেল করা হয় তার একটি ভুল বোঝাবুঝির ভিত্তিতে।

স্পষ্টতই, প্রথমে রিগ্রেশন মডেল তৈরির সময় ব্যাখ্যামূলক ভেরিয়েবলগুলি কী ব্যবহার বা নির্মাণ করা উচিত সেদিকে প্রথমে ফোকাস করা উচিত । এই উদাহরণে প্রস্তাবিত হিসাবে, অতীত অভিজ্ঞতা এবং তত্ত্ব থেকে দিকনির্দেশ অনুসন্ধান করুন।


দুর্দান্ত উত্তর! উপন্যাস থেকে এটি কি প্রকৃত ডেটা টলকিয়েন?
ক্যাম.ড্যাভিডসন.পিলন

1
@ ক্যামের ডেটা এটিকে চূড়ান্ত কাটা :-) হিসাবে তৈরি করতে পারেনি। (প্রসঙ্গ বরং জিহ্বা-ইন-গাল, আমি ভয় পাই।)
whuber

1
κ

5
κκχ2(1)

1
@ জিপজ্যাপবোইং আমি এখানে যে উদাহরণ দিচ্ছি তা বিশেষ কারণ এটি একটি অন্তর্নিহিত তত্ত্ব দ্বারা জানানো হয়েছিল। যখন এই জাতীয় তথ্য উপলব্ধ থাকে, এটি কোনও মডেল নির্বাচন করার জন্য একটি শক্তিশালী গাইড হতে পারে। যদিও অনেক ক্ষেত্রে এ জাতীয় কোনও তথ্য নেই, বা কেবলমাত্র একজন আশা করেন যে প্রত্যাশিত প্রতিক্রিয়া নিবন্ধভুক্তদের সাথে একঘেয়েভাবে পরিবর্তিত হতে পারে। সম্ভবত সবচেয়ে মূল কারণটি যেটির দিকে ইঙ্গিত করতে পারে তা হ'ল এই প্রত্যাশাটি যে রেজিস্ট্রারগুলির সাথে প্রতিক্রিয়া স্বতন্ত্রভাবে পরিবর্তিত হয় এবং এটি ডেটাতে রেজিস্ট্রারগুলির পরিসীমা জন্য, ডেরাইভেটিভের পরিবর্তনটি ছোট: একটি লিনিয়ার প্রতিক্রিয়া এটি প্রায় আনুমানিক হবে।
whuber

9

তার ডেস্কের ডাইটিং প্ল্যান্টে অপরাধবশতভাবে দেখছে .... সম্ভবত তা নয়

মন্তব্যে @ হুবার বলেছেন যে "সম্পর্কিত মডেলিংয়ের পছন্দগুলি সম্পর্কিত তথ্যগুলি কীভাবে ডেটা তৈরি করেছে এবং প্রাসঙ্গিক শাখায় তত্ত্বগুলি দ্বারা অনুপ্রাণিত হয়েছে তা বোঝার দ্বারা অবহিত করা উচিত", আপনি কীভাবে এটি জিজ্ঞাসা করেছিলেন যে কীভাবে এটি করা যায়।

মাইকেলিস এবং মেনটেন গতিবিজ্ঞান আসলে বেশ কার্যকর উদাহরণ। এই সমীকরণগুলি কিছু অনুমান দিয়ে শুরু করা যায় (উদাহরণস্বরূপ, স্তরটি তার জটিলগুলির সাথে সাম্যাবস্থায় থাকে, এনজাইম গ্রাস হয় না) এবং কিছু জ্ঞাত নীতি (ভর কর্মের আইন) দ্বারা উদ্ভূত হয়। মারে ম্যাথেমেটিকাল বায়োলজি: একটি পরিচিতি chapter অধ্যায়ে ডাইরিভিশনটির মধ্য দিয়ে চলেছে (আমি আরও অনেক বই বাজি ধরব!)।

আরও সাধারণভাবে, এটি মডেল এবং অনুমানের একটি "পুঁজিপাঠ" তৈরি করতে সহায়তা করে। আমি নিশ্চিত যে আপনার ক্ষেত্রে কিছু সাধারণ-গ্রহণযোগ্য, সময়-পরীক্ষিত মডেল রয়েছে। উদাহরণস্বরূপ, যদি কোনও কিছু চার্জ করা হয় বা ডিসচার্জ করা হয় তবে আমি কোনও ক্রিয়াকলাপের কাছে তার সময়ের ভোল্টেজ হিসাবে তার ভোল্টেজকে মডেল করার জন্য পৌঁছে যাব। বিপরীতভাবে, যদি আমি ভোল্টেজ-সময় প্লটের কোনও ক্ষতিকারক-মতো আকৃতিটি দেখতে পাই তবে আমার প্রথম অনুমানটি হ'ল সার্কিটের কিছু ক্যাপাসিটিভভাবে নির্গমন করছে এবং যদি এটি আমি না জানতাম তবে এটি সন্ধান করার চেষ্টা করব। আদর্শভাবে, তত্ত্ব উভয়ই আপনাকে মডেল তৈরি করতে এবং নতুন পরীক্ষার পরামর্শ দিতে সহায়তা করে।

Y=-(এক্স+ +)2সিও2 কম শ্বাসকষ্ট থেকে ক্যাপচার?) এবং বন্যা (শিকড় খাওয়া ব্যাকটেরিয়া?) প্রতিটি টুকরো জন্য একটি নির্দিষ্ট ফর্ম প্রস্তাব করতে পারে।


8

আমার বৈজ্ঞানিক জীবনের অর্ধেকটি বেঞ্চে এবং অন্য অর্ধেকটি কম্পিউটারে ব্যয় করেছেন, এমন পরিসংখ্যানের সাথে আমার কাছে একটি অনানুষ্ঠানিক প্রতিক্রিয়া রয়েছে, যা পরিসংখ্যানের সাথে খেলে। আমি একটি মন্তব্য দেওয়ার চেষ্টা করেছি, তবে এটি অনেক দীর্ঘ ছিল।

আপনি দেখুন, আমি যদি বিজ্ঞানী হয়ে থাকি যে ফলাফলগুলি আপনি কী ধরণের পাচ্ছেন তা পর্যবেক্ষণ করলে আমি শিহরিত হব। বিভিন্ন মনোটোনিক সম্পর্ক বিরক্তিকর এবং খুব কমই আলাদা করা যায়। তবে যে ধরণের সম্পর্কের বিষয়টি আপনি আমাদের দেখান তা একটি খুব বিশেষ প্রভাবের পরামর্শ দেয়। সম্পর্কটি কী, কীভাবে চূড়ান্তভাবে এটি পরিবর্তিত হয় সে সম্পর্কে ধারণা অনুমান করার জন্য এটি আমাদের তাত্ত্বিকদের জন্য একটি দুর্দান্ত খেলার মাঠ দেয় ground এটি বেঞ্চ বিজ্ঞানীকে কী ঘটছে তা নির্ধারণ করার জন্য এবং শর্তাদি সম্পর্কে ব্যাপকভাবে পরীক্ষা করার জন্য একটি দুর্দান্ত খেলার মাঠ দেয়।

এক অর্থে, আমি বরং আপনি যে কেসটি দেখিয়ে যাচ্ছেন তা করতাম এবং কীভাবে একটি সহজ মডেল ফিট করা যায় (তবে একটি নতুন অনুমানটি তৈরি করতে সক্ষম হতে হবে) তুলনায় সহজ সম্পর্ক, মডেল করা সহজ তবে যান্ত্রিকভাবে তদন্ত করা আরও শক্ত। যাইহোক, আমি আমার অনুশীলনে এখনও এর মতো মামলার মুখোমুখি হইনি।

অবশেষে, আরও একটি বিবেচনা আছে। প্রাক্তন বেঞ্চ বিজ্ঞানী হিসাবে - আপনি যদি এমন কোনও পরীক্ষার সন্ধান করছেন যা দেখায় যে কালো রঙ লাল (আপনার ডেটাতে) থেকে আলাদা? এটি চিত্র থেকে যথেষ্ট পরিষ্কার।


5

এই জাতীয় ডেটার জন্য, আমি সম্ভবত কমপক্ষে রৈখিক স্প্লাইনগুলি বিবেচনা করব।

আপনি খুব সহজেই এলএম বা গ্ল্যামের মধ্যে এটি করতে পারেন।

আপনি যদি এই জাতীয় দৃষ্টিভঙ্গি গ্রহণ করেন তবে আপনার সমস্যাটি নট এবং গাঁটের স্থানগুলি বেছে নেবে; একটি সমাধান হতে পারে সম্ভাব্য জায়গাগুলির ন্যায্য সংখ্যা বিবেচনা করা এবং একটি ছোট সেট চিহ্নিত করার জন্য লাসো বা নিয়মিতকরণ এবং নির্বাচনের অন্যান্য পদ্ধতির মতো কিছু ব্যবহার করা; যদিও আপনাকে এই জাতীয় নির্বাচনের প্রভাব বিবেচনায় আনতে হবে।


তবে স্প্লাইন রিগ্রেশন মূলত বলেছে না "প্রতিক্রিয়ার আকৃতি বর্ণনা করে এমন একটি অজানা ফাংশন রয়েছে এবং অন্যান্য ভেরিয়েবলগুলি এই বক্ররেখাটিকে কীভাবে উপরে / নীচে স্থানান্তরিত করবে বা এটি ঝুঁকবে" এটি সম্পর্কে কেবল অনুমানগুলিই পরীক্ষা করব? কোন চিকিত্সা যদি আকারটি নিজেই পরিবর্তিত করে - তবে তা যদি তাৎপর্যপূর্ণ হয় তবে এইরকম ইন্টারঅ্যাকশন শব্দটিকে কীভাবে ব্যাখ্যা করা যায়?
f1r3br4nd

2
বিকল্পটি কতটা সাধারণ? এমনকি সাধারণ ক্ষেত্রেও বিভিন্ন ধরণের পন্থা রয়েছে যেখানে আপনি পৃথক প্রকারের তুলনায় ফিট অভিন্ন নকশাকার নকশাগুলির সাথে তুলনা করতে পারবেন। অ্যাডিটিভ মডেল এবং সাধারণীকরণযোগ্য মডেলগুলি এই জাতীয় তুলনাগুলি মোকাবেলা করতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

আপনি আলোচনার চেয়ে আরও সাধারণ মামলার উদাহরণ হিসাবে (অন্যান্য পদ্ধতির বিভিন্ন বিষয়ে আলোচনা করা রেফারেন্স সহ), যদি আপনি এটি ধরতে পারেন তবে এই পেপারটি একবার দেখুন J.Roca-Pardiñas et al (2006) "বুটস্ট্র্যাপ ভিত্তিক জেনারালাইজড অ্যাডিটিভ মডেলগুলিতে ফ্যাক্টর বাই কার্ভ ইন্টারঅ্যাকশন পরীক্ষার পদ্ধতি: সিদ্ধান্ত গ্রহণের সাথে সম্পর্কিত প্রিফ্রন্টাল কর্টেক্স নিউরাল ক্রিয়াকলির মূল্যায়ন ", মেডিসিনের পরিসংখ্যান , জুলাই 30; 25 (14): 2483-501। সেই কাগজে তারা বুটস্ট্র্যাপিং (এবং গণনা বোঝা হ্রাস করার জন্য বিন্ন) ব্যবহার করে তবে সেখানে অন্যান্য পদ্ধতির উল্লেখ রয়েছে।
গ্লেন_বি -রিনস্টেট মনিকা

আরও বেসিক এবং পুরানো রেফারেন্স হস্টি এবং তিবশিরানী (1990), জেনারালাইজড অ্যাডিটিভ মডেলগুলি (যেমন পি 265 দেখুন) এর মতো কিছু হবে। এছাড়াও, এখানে একবার দেখুন , বিশেষত স্লাইড 34-এ শেষ সমীকরণ। প্রায় চারদিকে এটি gamআর প্যাকেজ ব্যবহার করে কীভাবে এই জাতীয় মডেলটি ফিট করতে পারে তাও ব্যাখ্যা করে mgcv
গ্লেন_বি -রিনস্টেট মনিকা

2

আপনার পুরো পোস্টটি পড়ার জন্য আমার কাছে সময় নেই, তবে মনে হচ্ছে আপনার মূল উদ্বেগটি হ'ল প্রতিক্রিয়ার কার্যকরী ফর্মগুলি চিকিত্সা দিয়ে বদলে যেতে পারে। এটি মোকাবেলার জন্য কৌশল রয়েছে তবে তারা তথ্য-নিবিড়।
আপনার নির্দিষ্ট উদাহরণ হিসাবে:

জি হ'ল বৃদ্ধি হ'ল ডাবল জল হ'ল টি

library(mgcv)
mod = gam(G~T+s(W,by=T))
plot(mod,pages=1,all=TRUE)
?gam

গত দশকে সেমিপ্রেমেট্রিক রিগ্রেশন সম্পর্কে এক টন গবেষণা দেখেছি এবং কার্যকরী ফর্মগুলি সম্পর্কিত এই গরুর মাংসগুলি আরও এবং বেশি পরিচালিত হচ্ছে। তবে দিনের শেষে, পরিসংখ্যান সংখ্যার সাথে খেলছে এবং এটি পর্যবেক্ষণের অধীনে ঘটনাসমূহ সম্পর্কে অন্তর্দৃষ্টি তৈরি করায় এটি কেবল কার্যকর। এর পরিবর্তে সংখ্যাগুলি কীভাবে খেলছে তা বোঝার প্রয়োজন। আপনার পোস্টের টোনটি স্নানের জল দিয়ে বাচ্চাকে বাইরে ফেলে দিতে ইচ্ছুক indicate

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.