ডেটা বিশ্লেষণ অনুশীলনের মাধ্যমে পরিসংখ্যান সংক্রান্ত ধারণা শেখা


18

আমি দেখতে পেয়েছি যে সহজ ডেটা বিশ্লেষণ অনুশীলনগুলি প্রায়শই পরিসংখ্যান ধারণাগুলির চিত্র ও ব্যাখ্যা করতে সহায়তা করে। পরিসংখ্যান সংক্রান্ত ধারণাটি শেখানোর জন্য আপনি কোন ডেটা বিশ্লেষণ অনুশীলন ব্যবহার করেন?

উত্তর:


9

যেহেতু আমাকে প্রায়শই পরিবর্তনশীল নির্বাচনের পদ্ধতিগুলি ব্যাখ্যা করতে হয়, কোনও পাঠদানের প্রসঙ্গে নয়, তবে অ-পরিসংখ্যানবিদরা তাদের গবেষণায় সাহায্যের জন্য অনুরোধ করেন, আমি এই অত্যন্ত সাধারণ উদাহরণটি পছন্দ করি যা চিত্রিত করে যে একক ভেরিয়েবল নির্বাচন অগত্যা একটি ভাল ধারণা নয় কেন।

আপনার যদি এই ডেটাসেট থাকে:

y      X1     x2
1       1      1
1       0      0
0       1      0
0       0      1

এক্স 1 এবং এক্স 2 উভয়ই পৃথকভাবে y এর জন্য সম্পূর্ণরূপে অবিস্মরণীয় তা বুঝতে সময় লাগবে না (যখন তারা সমান হয়, y 'নির্দিষ্ট' হবে - আমি এখানে নমুনা আকারের সমস্যাগুলি উপেক্ষা করছি, কেবল এই চারটি পর্যবেক্ষণকে ধরে নিই পুরো মহাবিশ্ব হতে হবে)। তবে দুটি ভেরিয়েবলের সংমিশ্রণ সম্পূর্ণ তথ্যবহুল। যেমন, লোকেরা বুঝতে এটি কেন সহজ ধারণা নয় (উদাহরণস্বরূপ) কেবলমাত্র রেজিস্ট্রার হিসাবে প্রতিটি পৃথক ভেরিয়েবলের সাথে মডেলগুলির জন্য পি-মানটি পরীক্ষা করা।

আমার অভিজ্ঞতায়, এটি সত্যই বার্তাটি পেয়ে যায়।


5

একাধিক রিগ্রেশন সহগ এবং প্রত্যাশিত সাইন মিথ্যাচার Fal

ডেটা বিশ্লেষণ অনুশীলনের মাধ্যমে একটি পরিসংখ্যানগত ধারণার আমার প্রিয় চিত্রগুলির মধ্যে একটি হ'ল একাধিক বিভাজনীয় রিগ্রেশনগুলিতে একাধিক রিগ্রেশনকে ডিকনস্ট্রাকশন।

উদ্দেশ্য

  • একাধিক ভবিষ্যদ্বাণীকের উপস্থিতিতে রিগ্রেশন সহগের অর্থ স্পষ্ট করা।
  • ভবিষ্যদ্বাণীকারীরা পরস্পর সম্পর্কযুক্ত হওয়ার সাথে সাথে ওয়াইয়ের সাথে এর দ্বিবিভক্ত সম্পর্কের উপর ভিত্তি করে একটি নির্দিষ্ট চিহ্ন থাকতে কেন একাধিক রিগ্রেশন সহগের "আশা" করা ভুল তা ব্যাখ্যা করার জন্য।

ধারণা

একাধিক রিগ্রেশন মডেলের রিগ্রেশন সহগগুলি ক) মধ্যবর্তী সম্পর্কের প্রতিনিধিত্ব করে ক) প্রদত্ত ভবিষ্যদ্বাণী ভেরিয়েবলের (x1) অংশ যা মডেলের অন্যান্য প্রেডিকটর ভেরিয়েবল (x2 ... xN) এর সাথে সম্পর্কিত নয়; এবং 2) প্রতিক্রিয়া ভেরিয়েবলের (Y) অংশটি যা মডেলটির অন্যান্য ভবিষ্যদ্বাণী ভেরিয়েবল (x2 ... xN) এর সাথে সম্পর্কিত নয়। যখন ভবিষ্যদ্বাণীকারীদের মধ্যে পারস্পরিক সম্পর্ক থাকে, তখন ভবিষ্যদ্বাণীকারী সহগের সাথে সম্পর্কিত লক্ষণগুলি সেই অবশিষ্টাংশের মধ্যে সম্পর্কের প্রতিনিধিত্ব করে।

ব্যায়াম

  1. দুটি ভবিষ্যদ্বাণীকারী (x1, x2) এবং একটি প্রতিক্রিয়া (y) এর জন্য কিছু এলোমেলো ডেটা তৈরি করুন।
  2. এক্স 2 এ y রেজিস্ট্রেশন করুন এবং অবশিষ্টাংশ সংরক্ষণ করুন।
  3. এক্স 2 তে এক্স 1 রেজিস্ট্রেশন করুন এবং অবশিষ্টাংশ সংরক্ষণ করুন।
  4. পদক্ষেপ 3 (আর 2) এর অবশিষ্টাংশগুলিতে পদক্ষেপ 2 (আর 1) এর অবশিষ্টাংশগুলিকে নিবন্ধভুক্ত করুন।

আর 2 এর 4 ধাপের সহগটি x1 এবং x2 সহ একাধিক রিগ্রেশন মডেলের x1 এর সহগ হবে। আপনি এক্স 2 এর জন্য y এবং x2 উভয়ের জন্য x1 কে আংশিক করে do

এই অনুশীলনের জন্য কিছু আর কোড এখানে।

set.seed(3338)
x1 <- rnorm(100)
x2 <- rnorm(100)
y <- 0 + 2*x1 + 5*x2 + rnorm(100)
lm(y ~ x1 + x2)  # Multiple regression Model
ry1 <- residuals(  lm( y ~ x2)  )  # The part of y not related to x2
rx1 <- residuals(  lm(x1 ~ x2)  ) # The part of x1 not related to x2
lm( ry1  ~ rx1) 
ry2 <- residuals(  lm( y ~ x1)  ) # The part of y not related to x1
rx2 <- residuals(  lm(x2 ~ x1)  ) # The part of x2 not related to x1
lm( ry2 ~ rx2)

এখানে প্রাসঙ্গিক ফলাফল এবং ফলাফল।

Call:
lm(formula = y ~ x1 + x2)

Coefficients:

(Intercept)           ***x1***           ***x2***  
   -0.02410      ***1.89527***      ***5.07549*** 

Call:
lm(formula = ry1 ~ rx1)

Coefficients:

(Intercept)          ***rx1***  
 -2.854e-17    ***1.895e+00*** 

Call:
lm(formula = ry2 ~ rx2)

Coefficients:

(Intercept)          ***rx2***  
  3.406e-17    ***5.075e+00*** 
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.