নমুনা বিতরণ শেখানোর কৌশল


30

টিএল; ডাঃ সংস্করণ সূচনা স্নাতক স্তরের নমুনা বিতরণ (উদাহরণস্বরূপ, উদাহরণস্বরূপ) শেখানোর জন্য আপনি কোন সফল কৌশল ব্যবহার করেন?

পটভূমি

সেপ্টেম্বরে আমি দ্বিতীয় বর্ষের সামাজিক বিজ্ঞানের (প্রাথমিকভাবে রাষ্ট্রবিজ্ঞান এবং সমাজবিজ্ঞান) শিক্ষার্থীদের ডেভিড মুরের বুনিয়াদি অনুশীলন ব্যবহার করে শিক্ষার্থীদের জন্য একটি সূচনা পরিসংখ্যান কোর্স শিখিয়ে দেব । এটি এই পঞ্চমবারের মতো হবে যে আমি এই কোর্সটি শিখিয়েছি এবং একটি বিষয় যা আমি নিয়মিত করেছিলাম তা হ'ল শিক্ষার্থীরা নমুনা বিতরণের ধারণার সাথে সত্যই লড়াই করেছে । এটি অনুমানের ব্যাকগ্রাউন্ড হিসাবে আচ্ছাদিত এবং সম্ভাবনার প্রাথমিক ধারণা অনুসরণ করে যা তাদের প্রাথমিক প্রাথমিক হিক্কার পরে সমস্যা মনে হয় না (এবং মৌলিকভাবে, আমি বেসিক বলতে চাইছি- সর্বোপরি, এই শিক্ষার্থীদের অনেকগুলি একটি নির্দিষ্ট কোর্সের স্ট্রিমে স্ব-নির্বাচিত হয়েছে কারণ তারা "গণিত" এর একটি অস্পষ্ট ইঙ্গিত দিয়েও কিছু এড়াতে চাইছিলেন)। আমি অনুমান করব যে সম্ভবত 60% ন্যূনতম বোঝাপড়া ছাড়াই কোর্সটি ছেড়ে যায়, প্রায় 25% নীতিটি বুঝতে পারে তবে অন্যান্য ধারণার সাথে সংযোগ নয়, এবং বাকী 15% সম্পূর্ণরূপে বুঝতে পারে।

মূল বিষয়

শিক্ষার্থীরা যে সমস্যাটি মনে করছে তা হ'ল আবেদনটি নিয়ে। তারা কেবল এটি পায় না তা বলা ছাড়া সঠিক সমস্যাটি অন্যটি কী তা বোঝানো কঠিন। আমি সর্বশেষ সেমিস্টার এবং পরীক্ষার প্রতিক্রিয়াগুলি দ্বারা পরিচালিত একটি পোল থেকে আমার মনে হয় যে অসুবিধার এক অংশটি দুটি সম্পর্কিত এবং অনুরূপ শব্দের সাথে (নমুনা বিতরণ এবং নমুনা বিতরণ) মধ্যে বিভ্রান্তি, তাই আমি "নমুনা বিতরণ" শব্দটি ব্যবহার করিনি আর না, তবে অবশ্যই এটি এমন কিছু যা প্রথমে বিভ্রান্ত হওয়ার সাথে সাথে খুব সহজেই কিছুটা চেষ্টা করা যায় এবং যাইহোক এটি একটি নমুনা বিতরণের ধারণার সাধারণ বিভ্রান্তিকে ব্যাখ্যা করতে পারে না।

(আমি বুঝতে পারি যে এটি আমার এবং আমার শিক্ষাদানের হতে পারে যা এখানে সমস্যাযুক্ত! তবে আমি মনে করি যে অস্বস্তিকর সম্ভাবনা উপেক্ষা করা কিছু যুক্তিসঙ্গত কারণ যেহেতু কিছু শিক্ষার্থী মনে করে যে এটি পাওয়া যায় এবং সামগ্রিক প্রত্যেকেই বেশ ভালভাবে কাজ করেছে বলে মনে হয় ...)

আমি কি চেষ্টা করেছি

কম্পিউটার ল্যাবটিতে বাধ্যতামূলক সেশনগুলি চালু করার জন্য আমার বিভাগের স্নাতক প্রশাসকের সাথে তর্ক করতে হয়েছিল যে বারবার বিক্ষোভ সহায়ক হতে পারে (আমি এই কোর্সটি পড়াতে শুরু করার আগে কোনও কম্পিউটিং জড়িত ছিল না)। যদিও আমি মনে করি এটি সাধারণভাবে কোর্স সামগ্রীর সামগ্রিক বুঝতে সহায়তা করে, আমি মনে করি না যে এটি এই নির্দিষ্ট বিষয়ের সাথে সহায়তা করেছে।

একটি ধারণা আমার ছিল তা হল এটিকে একেবারে না শেখানো বা এটিকে বেশি ওজন না দেওয়া, কিছু লোকের (যেমন: অ্যান্ড্রু জেলম্যান ) পক্ষের পক্ষে অবস্থান position আমি এটি বিশেষভাবে সন্তোষজনক বলে মনে করি না কারণ এটি সর্বনিম্ন সাধারণ ডিনোমিনেটরকে পাঠদানের ঝোঁক রয়েছে এবং আরও গুরুত্বপূর্ণভাবে দৃ motiv় এবং অনুপ্রাণিত শিক্ষার্থীদের অস্বীকার করে যারা সত্যিকার অর্থে কীভাবে গুরুত্বপূর্ণ ধারণাগুলি কাজ করে তা বোঝার থেকে পরিসংখ্যান প্রয়োগ সম্পর্কে আরও জানতে চান (কেবলমাত্র নমুনা বিতরণ নয়! )। অন্যদিকে, মধ্যযুগীয় শিক্ষার্থী উদাহরণস্বরূপ পি-মানগুলি উপলব্ধি করে বলে মনে হচ্ছে, সুতরাং তাদের সম্ভবত নমুনা বিতরণ বুঝতে হবে না।

প্রশ্নটি

নমুনা বিতরণ শেখানোর জন্য আপনি কোন কৌশল ব্যবহার করেন? আমি জানি যে উপকরণ এবং আলোচনা উপলভ্য রয়েছে (যেমন এখানে এবং এখানে এবং এই কাগজ যা একটি পিডিএফ ফাইল খোলায় ) তবে আমি কেবল ভাবছি যে আমি কি মানুষের পক্ষে কাজ করে তার কিছু দৃ concrete় উদাহরণ পেতে পারি (বা আমার ধারণা এমনকি কী কাজ করে না সুতরাং আমি এটি চেষ্টা না জানি!)। আমার পরিকল্পনা এখন, যেমন আমি সেপ্টেম্বরের জন্য আমার কোর্সটি পরিকল্পনা করি, হ'ল গেলম্যানের পরামর্শ অনুসরণ করা এবং নমুনা বিতরণকে "ডিফফেসাইজ" করা। আমি এটি শিখিয়ে দেব, তবে আমি শিক্ষার্থীদের আশ্বস্ত করব যে এটি এক প্রকার FYI- বিষয় এবং এটি কোনও পরীক্ষায় অংশ নেবে না (সম্ভবত বোনাস প্রশ্ন ছাড়া ?!)। যাইহোক, আমি লোকেরা ব্যবহার করা অন্যান্য পদ্ধতির কথা শুনতে আগ্রহী।


কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যটি দেখানোর জন্য আপনি অ-সাধারণ জনসংখ্যা বিতরণ দিয়েও এটি করতে পারেন
user41270

দুঃখিত এটি নীচে আমার উত্তর সম্পর্কে একটি মন্তব্য করা উচিত ছিল।
ব্যবহারকারী41270

উত্তর:


23

আমার মতে, স্যাম্পলিং বিতরণগুলি 101 এর পরিসংখ্যানের মূল ধারণা You আপনি সম্ভবত সেই সমস্যাটি এড়িয়ে যেতে পারেন। যাইহোক, শিক্ষার্থীরা কেবল এটি পায় না, এই বিষয়টি সম্পর্কে আমি খুব পরিচিত what আপাতদৃষ্টিতে আপনি যা কিছু করেন না কেন। আমি কৌশল এক সিরিজ আছে। এগুলি অনেক সময় নিতে পারে তবে আমি অন্যান্য বিষয়গুলি এড়িয়ে / সংক্ষিপ্তকরণের পরামর্শ দিই, যাতে তারা নমুনা বিতরণের ধারণাটি পায় তা নিশ্চিত করতে। এখানে কিছু টিপস রয়েছে:

  • এটিকে স্পষ্ট করে বলুন: আমি প্রথমে স্পষ্টভাবে উল্লেখ করেছি যে এখানে 3 বিভিন্ন বিতরণ রয়েছে যার সাথে আমরা সম্পর্কিত: জনসংখ্যা বিতরণ, নমুনা বিতরণ এবং নমুনা বিতরণ। আমি পাঠের ওপরে এবং তারপরে এবং পুরো কোর্স জুড়ে এটি বলছি। প্রতিটি সময় আমি বলতে এই পদ আমি স্বাতন্ত্র্যসূচক শেষের জোর দেওয়া: sam- ple , samp- লিং । (হ্যাঁ, শিক্ষার্থীরা এতে অসুস্থ হয়; তারা ধারণাটিও পায় get)
  • ছবি (চিত্রগুলি) ব্যবহার করুন: আমার কাছে স্ট্যান্ডার্ড ফিগারগুলির একটি সেট রয়েছে যা আমি এই বিষয়ে কথা বলার সময় ব্যবহার করি। এটিতে তিনটি বিতরণ আলাদাভাবে চিত্রিত হয়েছে এবং সাধারণত লেবেলযুক্ত রয়েছে। (এই চিত্রের সাথে যে লেবেলগুলি রয়েছে সেগুলি পাওয়ারপয়েন্ট স্লাইডে রয়েছে এবং সংক্ষিপ্ত বিবরণ অন্তর্ভুক্ত করে, তাই তারা এখানে প্রদর্শিত হয় না, তবে স্পষ্টতই এটি: শীর্ষে জনসংখ্যা, তারপরে নমুনা, তারপরে নমুনা বিতরণ।)
    enter image description here
  • শিক্ষার্থীদের ক্রিয়াকলাপ দিন: আপনি প্রথমবার এই ধারণাটি প্রবর্তন করার সময়, নিকলগুলির একটি রোল আনুন (কিছু কোয়ার্টার অদৃশ্য হয়ে যেতে পারে) বা একগুচ্ছ-পার্শ্বযুক্ত পাশা আনুন। শিক্ষার্থীদের ছোট গ্রুপে ফর্ম করুন এবং 10 টি মানের একটি সেট তৈরি করুন এবং সেগুলি গড় করুন। তারপরে আপনি বোর্ডে বা এক্সেল দিয়ে একটি হিস্টোগ্রাম তৈরি করতে পারেন।
  • অ্যানিমেশনগুলি (সিমুলেশনগুলি) ব্যবহার করুন: আমি ডেটা উত্পন্ন করার জন্য এবং কার্যকরভাবে প্রদর্শন করার জন্য কিছু (কমিকালি অযোগ্য) কোড লিখি। এই অংশটি বিশেষ করে সহায়ক যখন আপনি কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যটি ব্যাখ্যা করার জন্য রূপান্তর করেন। ( Sys.sleep()বিবৃতিগুলি লক্ষ্য করুন , এই বিরতিগুলি প্রতিটি পর্যায়ে কী চলছে তা ব্যাখ্যা করার জন্য আমাকে একটি মুহুর্ত দেয়))
N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
  • এই ধারণাগুলি পুরো সেমিস্টারে পুনরায় প্রতিষ্ঠিত করুন: প্রতিবার আমরা পরবর্তী বিষয় সম্পর্কে কথা বলার পরে নমুনা বিতরণের ধারণাটি আবার সামনে এনেছি (সাধারণত খুব সংক্ষেপে হলেও)। এর জন্য সবচেয়ে গুরুত্বপূর্ণ জায়গাটি হ'ল যখন আপনি আনোভা পড়ান, নাল অনুমানের কেস হিসাবে সত্যই আপনি একই জনসংখ্যার বন্টন থেকে বেশ কয়েকবার নমুনা তৈরি করেছেন এবং আপনার গোষ্ঠীর সেট মানে সত্যিই একটি অভিজ্ঞতা সম্পন্ন নমুনা বিতরণ। (এর উদাহরণের জন্য, আমার উত্তরটি এখানে দেখুন: স্ট্যান্ডার্ড ত্রুটি কীভাবে কাজ করে? )

1
এটি একটি ভাল উত্তর (+1)। আমি বিশেষত ক্রিয়াকলাপ এবং সিমুলেশনগুলি এই বিষয়ে শেখানোর জন্য খুব দরকারী বলে মনে করি। একটি প্রবর্তনীয় কোর্সে আমি কয়েকবার শিখিয়েছি আমরা একটি ওয়েব অ্যাপলেট ব্যবহার করেছি যা শিক্ষার্থীদের নমুনা থেকে কীভাবে পরিসংখ্যান গণনা করা হয় তা পরীক্ষা করতে দেয় এবং নমুনা বিতরণের হিস্টোগ্রামটি যখন আপনি বহুবার পুনরাবৃত্তি করতে শুরু করে তখন কীভাবে আকার নিতে শুরু করে। আমি মনে করি যে স্যাম্পলিং বিতরণগুলি বোঝার সময় শিক্ষার্থীদের কাছে আমি যা বলেছিলাম তার থেকে এই কার্যকলাপটি আরও অনেক বেশি সহায়তা করেছে :)
ম্যাক্রো

+1 ধন্যবাদ গাং, এটি দুর্দান্ত উত্তর! "আমাকে কোডজ পাঠানোর জন্য" ধন্যবাদ (এনবি। ম্যাক ব্যবহারকারীরা এর সাথে প্রতিস্থাপন windows(...)করেছেন quartz(...))। পুরো সেমিস্টারে ধারণাটি পুনর্বহাল করার বিষয়ে আপনার বক্তব্যটি বিশেষভাবে সহায়ক। আমি মনে করি এই নির্দেশিকা অনুসরণ করা সত্যই কার্যকর হবে।
স্মিলিগ

(+1) "3-বিতরণ" মন্ত্রের জন্য এবং সম্পর্কিত চিত্রের জন্য। কেউই প্রথম ধারণা না বুঝে বুঝতে পারে না যে এটি প্রকৃতপক্ষে একটি স্বতন্ত্র ধারণা।
অ্যালেকোস পাপাদোপল্লোস

আমি এর জন্য নমুনা বিতরণে রাইস বিশ্ববিদ্যালয়ের " অনলাইন স্ট্যাট বই " পৃষ্ঠাটি পেয়েছি । মূল সংস্করণ, বহু বছরের পুরানো, একটি জাভা অ্যাপলেট বৈশিষ্ট্যযুক্ত, তবে আমি আনন্দিত যে তারা সম্প্রতি এটি জাভাস্ক্রিপ্টে পুনর্নির্মাণ করেছে। এটি যেভাবে কাজ করে তা মূলত আপনার চিত্রের মতো tially
সিলভারফিশ

8

আমি ছাত্র স্যাম্পলিং বন্টন পরীক্ষার পরিসংখ্যান একটি উপর ভিত্তি করে বিতরণের এটা স্মরণ করিয়ে দেই সঙ্গে কিছু ভাগ্য ছিল র্যান্ডম নমুনা । আমার শিক্ষার্থীরা স্যাম্পলিংয়ের প্রক্রিয়াটি কী হবে তা নিজেই পক্ষপাতদুষ্ট ছিল তা নিয়ে চিন্তাভাবনা করেছে - চরম ক্ষেত্রে মনোনিবেশ করে। উদাহরণস্বরূপ, "নমুনা বিতরণ" দেখতে কেমন হবে যদি আমাদের নমুনা প্রক্রিয়া সর্বদা একই (বিশেষ) উপসেটটি বাছাই করে। তারপরে আমি বিবেচনা করব যে "নমুনা বিতরণ" দেখতে কেমন হবে যদি আমাদের নমুনা প্রক্রিয়া দুটি নির্দিষ্ট (বিশেষ) সাবসেট বেছে নেয় (যার সম্ভাব্যতা 1/2) 2 এইগুলি নমুনাটির গড় (বিশেষত অন্তর্নিহিত জনগোষ্ঠীর জন্য "বিশেষ" বিশেষ পছন্দগুলির জন্য) সাথে কাজ করা বেশ সহজ।

I think for some (clearly not all) students this seems to help them with the idea that the sampling distribution can be very different from the population distribution. I have also used the central limit theorem example that Michael Chernick mentioned with some success - especially with distributions that are clearly not normal (simulations really do seem to help).


Graham Cookson has a nice classroom exercise that is posted as an answer in "What is your favorite layman's explanation for a difficult statistical concept?" - a community wiki.
shoda

+1, talking about what the sampling distribution of non-random samples would be is a good idea.
gung - Reinstate Monica

+1 Great idea about the subset selection! I think this is the link you're referring to @shoda: stats.stackexchange.com/a/554/9249
smillig

7

I start back with the teaching of probability. I don't go into a lot of the formal definitions and rules (just not enough time), but show probability by simulation. The Monty Hall problem is a great example to use, I show through simulation (and then follow-up with the logic) that the strategy to switch gives a higher probability of winning. I point out that by simulation we were able to play the game many times (without risk or reward) to evaluate the strategies and that lets us choose the better strategy (if we are ever in that situation). Choosing the better strategy does not guarentee a win, but it gives us a better chance and helps choose between strategies. I then point out that how this will apply to the rest of the course is that it will help us choose strategies where there is a random component, but more realistic situations that we will be in.

Then when I introduce the sampling distribution I again start with simulation and say we want to develop strategies. Just like with the Monty Hall problem, in real life we will only be able to take 1 sample, but we can simulate a bunch of samples to help us develop a strategy. I then show simulations of many samples from the same population (known population in this case) and show the relationships that we learn from the simulations (histogram of the sample means), i.e. sample means clustered around true mean (mean of means is mean), smaller standard deviation of sampling distribution for bigger samples, more normal for bigger samples. The whole time I talk about repeating the ideas of simulation to choose strategies, just the same idea as the Monty Hall problem applied now to sample means instead of game shows. I then show the official rules and say that in addition to the simulations they can be proved mathematically, but I will not inflict the proofs on the entire class. I offer that if they really want to see the mathematical proofs they can come to an office hour and I will show them the math (nobody from the intro classes has taken me up on this yet).

তারপরে যখন আমাদের দৃষ্টি আকর্ষণ করা হয় আমি বলি যে আমরা কেবলমাত্র আসল বিশ্বে 1 টি নমুনা নিতে সক্ষম হব, ঠিক যেমন আমরা কেবল 1 বার (বেশিরভাগ) গেমটি খেলতে পারি তবে আমরা যে কৌশলগুলি শিখিয়েছি তা ব্যবহার করতে পারি এমন একটি কৌশল (জেড-পরীক্ষা, টি-টেস্ট, বা সিআই সূত্র) বিকাশের জন্য অনেকগুলি নমুনা যা আমাদের নির্বাচিত বৈশিষ্ট্যগুলি (সঠিক হওয়ার সম্ভাবনা) দেয়। ঠিক গেমের মতোই, আমরা জানি না যে আমরা চূড়ান্ত উপসংহারটি সঠিক হবে কিনা তা শুরু করার আগে আমরা জানি না (এবং সাধারণত আমরা এরপরে এখনও জানি না) তবে দীর্ঘমেয়াদী সম্ভাবনা কী ব্যবহার করছে তা আমরা সিমুলেশন এবং স্যাম্পলিং বিতরণ থেকে জানি যে কৌশল।

Do 100% of students have a perfect understanding? no, but I think more of them get the general idea that we can use simulation and math rules (that they are glad they don't have to look at, just trust the book/instructor) to choose a strategy/formula that has the desired properties.


+1 Thanks for sharing this advice. I think you nailed it with the problem being the link between what we can teach about what the sampling distribution is vs. how that can be extrapolated to inference from a single sample. As you (and others here) have suggested, continuing to reiterate the concept over and over throughout the course is important, but not often done (at least not by me, probably because I already find it hard enough to fit in everything I want, let alone returning to concepts already covered!).
smillig

3

This is a very important and well-thought out issue on your part. I do think the concept of sampling distribution is vary basic to understanding inference and definitely should be taught.

I have taught many introductory statistics courses particularly in biostatistics. I teach the concept of sampling distribution and have approaches that I think are good but don't really have good feedback to determine how successful I have been with them. Anyway here is what I do.

First I try to give a simple definition. The sampling distribution is the distribution that the test statistic would have if the sample process were repeated many times. It depends on the population distribution that the data are assumed to be generated from.

Although I think this is about as simple a definition as I can give I realize it is not very simple and understanding of the concept will not come immediately in most cases. So follow this up with a basic example that reinforces what is said with the definition.

The example I would use is a sample of size n that is independent and identically distributed as a normal distribution with mean μ and variance σ2 then the sample mean which is used as a point estimate for the mean or use to form a test statistic for the mean has a sampling distribution which is normal with mean μ and variance σ2/n.

Then I would follow this up with an important application, the central limit theorem. In the simplest terms the central limit theorem says that for many distributions that are not normal the sampling distribution for the sample mean will be close to a normal distribution when the sample size n is large. To illustrate this take distributions like the uniform (a bimodal distribution would also be good to look at) and show what the sampling distribution for the mean looks like for sample sizes of 3, 4, 5, 10 and 100. The student can see how the shape of the distribution changes from something that does not look normal at all for small n to something that looks very much like a normal distribution for large n.

To convince the student that these sampling distributions really do have these shapes have the students conduct simulations genrating many samples of various sizes and compute the sample means. Then have them generate histograms for these estimates of the mean. I would also suggest applying a physical demonstration showing how this works using a quincunx board. While doing this you point out how the device generates samples of the sum of independent Bernoulli trials where the probability of going left or right at each level equals 1/2. The resulting stacks at the bottom represent a histogram for this sampling distribution (the binomial) and its shape can be seen to look approximately normal after a large number of balls land at the bottom of the quincunx, a demonstration of the DeMoivre-Laplace version of the central limit theorem through smapling distributions.


Thanks for the valuable suggestions. I really like the idea of an actual physical demonstration and will definitely try implementing something like this (assuming I can distract them from facebook for long enough...), although the connection to the sum of independent Bernoulli trials is probably a bit over their heads! Thanks.
smillig

1
But seeing the normal distribution shape form from the experiment is really eye-opening. I first saw one of these demonstrated at the Science Museum in Chicago when I was a child (about 10 years old). Didn't know anything about statistics then but never forgot the curve.
Michael R. Chernick

1

I think it would be good to put a 'population' of numbers in a bag ( ranging for example from 1-10). You could make your own tiles, or use coins, playing cards etc.

Get students to sit in groups (5 or more) and each pick a number out of the bag. Each group then calculates the mean value for their group. Tell them that earlier you worked out the population mean, plot it on a histogram and get a member of each group to come and plot their sample mean on a historgram around this. Get them to do this excerise a few times to 'build up the histogram'.

You will then be able to graphically show the variation in sample means around the population mean. Work out the variation in sample means compared to the population mean. I think student distinctly remember doing such a practical exercise and the concept of sampling variation will come back to them more easily as a result. It might sound a bit babyish but students sometimes just like a change to do something active....there aren't many opportunities to do this in stats.

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.