আমি দেখতে পেয়েছি যে সহজ ডেটা বিশ্লেষণ অনুশীলনগুলি প্রায়শই পরিসংখ্যান ধারণাগুলির চিত্র ও ব্যাখ্যা করতে সহায়তা করে। পরিসংখ্যান সংক্রান্ত ধারণাটি শেখানোর জন্য আপনি কোন ডেটা বিশ্লেষণ অনুশীলন ব্যবহার করেন?
আমি দেখতে পেয়েছি যে সহজ ডেটা বিশ্লেষণ অনুশীলনগুলি প্রায়শই পরিসংখ্যান ধারণাগুলির চিত্র ও ব্যাখ্যা করতে সহায়তা করে। পরিসংখ্যান সংক্রান্ত ধারণাটি শেখানোর জন্য আপনি কোন ডেটা বিশ্লেষণ অনুশীলন ব্যবহার করেন?
উত্তর:
যেহেতু আমাকে প্রায়শই পরিবর্তনশীল নির্বাচনের পদ্ধতিগুলি ব্যাখ্যা করতে হয়, কোনও পাঠদানের প্রসঙ্গে নয়, তবে অ-পরিসংখ্যানবিদরা তাদের গবেষণায় সাহায্যের জন্য অনুরোধ করেন, আমি এই অত্যন্ত সাধারণ উদাহরণটি পছন্দ করি যা চিত্রিত করে যে একক ভেরিয়েবল নির্বাচন অগত্যা একটি ভাল ধারণা নয় কেন।
আপনার যদি এই ডেটাসেট থাকে:
y X1 x2
1 1 1
1 0 0
0 1 0
0 0 1
এক্স 1 এবং এক্স 2 উভয়ই পৃথকভাবে y এর জন্য সম্পূর্ণরূপে অবিস্মরণীয় তা বুঝতে সময় লাগবে না (যখন তারা সমান হয়, y 'নির্দিষ্ট' হবে - আমি এখানে নমুনা আকারের সমস্যাগুলি উপেক্ষা করছি, কেবল এই চারটি পর্যবেক্ষণকে ধরে নিই পুরো মহাবিশ্ব হতে হবে)। তবে দুটি ভেরিয়েবলের সংমিশ্রণ সম্পূর্ণ তথ্যবহুল। যেমন, লোকেরা বুঝতে এটি কেন সহজ ধারণা নয় (উদাহরণস্বরূপ) কেবলমাত্র রেজিস্ট্রার হিসাবে প্রতিটি পৃথক ভেরিয়েবলের সাথে মডেলগুলির জন্য পি-মানটি পরীক্ষা করা।
আমার অভিজ্ঞতায়, এটি সত্যই বার্তাটি পেয়ে যায়।
একাধিক রিগ্রেশন সহগ এবং প্রত্যাশিত সাইন মিথ্যাচার Fal
ডেটা বিশ্লেষণ অনুশীলনের মাধ্যমে একটি পরিসংখ্যানগত ধারণার আমার প্রিয় চিত্রগুলির মধ্যে একটি হ'ল একাধিক বিভাজনীয় রিগ্রেশনগুলিতে একাধিক রিগ্রেশনকে ডিকনস্ট্রাকশন।
উদ্দেশ্য
ধারণা
একাধিক রিগ্রেশন মডেলের রিগ্রেশন সহগগুলি ক) মধ্যবর্তী সম্পর্কের প্রতিনিধিত্ব করে ক) প্রদত্ত ভবিষ্যদ্বাণী ভেরিয়েবলের (x1) অংশ যা মডেলের অন্যান্য প্রেডিকটর ভেরিয়েবল (x2 ... xN) এর সাথে সম্পর্কিত নয়; এবং 2) প্রতিক্রিয়া ভেরিয়েবলের (Y) অংশটি যা মডেলটির অন্যান্য ভবিষ্যদ্বাণী ভেরিয়েবল (x2 ... xN) এর সাথে সম্পর্কিত নয়। যখন ভবিষ্যদ্বাণীকারীদের মধ্যে পারস্পরিক সম্পর্ক থাকে, তখন ভবিষ্যদ্বাণীকারী সহগের সাথে সম্পর্কিত লক্ষণগুলি সেই অবশিষ্টাংশের মধ্যে সম্পর্কের প্রতিনিধিত্ব করে।
ব্যায়াম
আর 2 এর 4 ধাপের সহগটি x1 এবং x2 সহ একাধিক রিগ্রেশন মডেলের x1 এর সহগ হবে। আপনি এক্স 2 এর জন্য y এবং x2 উভয়ের জন্য x1 কে আংশিক করে do
এই অনুশীলনের জন্য কিছু আর কোড এখানে।
set.seed(3338)
x1 <- rnorm(100)
x2 <- rnorm(100)
y <- 0 + 2*x1 + 5*x2 + rnorm(100)
lm(y ~ x1 + x2) # Multiple regression Model
ry1 <- residuals( lm( y ~ x2) ) # The part of y not related to x2
rx1 <- residuals( lm(x1 ~ x2) ) # The part of x1 not related to x2
lm( ry1 ~ rx1)
ry2 <- residuals( lm( y ~ x1) ) # The part of y not related to x1
rx2 <- residuals( lm(x2 ~ x1) ) # The part of x2 not related to x1
lm( ry2 ~ rx2)
এখানে প্রাসঙ্গিক ফলাফল এবং ফলাফল।
Call:
lm(formula = y ~ x1 + x2)
Coefficients:
(Intercept) ***x1*** ***x2***
-0.02410 ***1.89527*** ***5.07549***
Call:
lm(formula = ry1 ~ rx1)
Coefficients:
(Intercept) ***rx1***
-2.854e-17 ***1.895e+00***
Call:
lm(formula = ry2 ~ rx2)
Coefficients:
(Intercept) ***rx2***
3.406e-17 ***5.075e+00***