স্বতন্ত্র নমুনাগুলি টি-টেস্ট: বড় আকারের নমুনা আকারের জন্য সাধারণত কী ডেটা বিতরণ করা দরকার?


13

ধরা যাক আমি দুটি স্বতন্ত্র নমুনার আলাদা উপায় আছে কিনা তা পরীক্ষা করতে চাই। আমি জানি অন্তর্নিহিত বিতরণটি স্বাভাবিক নয়

যদি আমি সঠিকভাবে বুঝতে পারি তবে আমার পরীক্ষার পরিসংখ্যানটি গড় এবং বড় পরিমাণে নমুনার আকারের জন্য, নমুনাগুলি না থাকলেও গড়টি সাধারণত বিতরণ করা উচিত। সুতরাং একটি প্যারাম্যাট্রিক তাত্পর্য পরীক্ষা এই ক্ষেত্রে বৈধ হওয়া উচিত, তাই না? আমি এ সম্পর্কে বিরোধী এবং বিভ্রান্তিকর তথ্য পড়েছি তাই আমি কিছু নিশ্চিতকরণের (বা আমি কেন ভুল করছি তা ব্যাখ্যা করার জন্য) প্রশংসা করব।

এছাড়াও, আমি পড়েছি যে বড় নমুনা আকারের জন্য, আমার টি-স্ট্যাটিস্টিকের পরিবর্তে জেড-স্ট্যাটিসিক ব্যবহার করা উচিত। কিন্তু বাস্তবে, টি-বিতরণ কেবলমাত্র সাধারণ বিতরণে রূপান্তরিত হবে এবং দুটি পরিসংখ্যান একই হওয়া উচিত, না?

সম্পাদনা করুন : নীচে জেড-পরীক্ষাটি বর্ণনা করার জন্য কিছু উত্স রয়েছে। তারা উভয়ই বলে যে জনগণকে সাধারণত বিতরণ করতে হবে:

এখানে এটি বলে যে "জেড-পরীক্ষার ধরণের ব্যবহার নির্বিশেষে এটি ধরে নেওয়া হয় যে নমুনাগুলি আঁকা জনসংখ্যাগুলি স্বাভাবিক।" এবং এখানে , জেড-পরীক্ষার প্রয়োজনীয়তাগুলি "দুটি সাধারণত বিতরণ করা হলেও স্বতন্ত্র জনসংখ্যা, σ জানা" হিসাবে তালিকাবদ্ধ রয়েছে।


আপনি যা বলছেন তা বোধগম্য হয়। নমুনার মাধ্যমগুলির বন্টনের ক্ষেত্রে স্বাভাবিকতা ধরে নিতে আপনি কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি ব্যবহার করছেন। এছাড়াও, আপনি টি-পরীক্ষাটি ব্যবহার করছেন কারণ আপনার জনসংখ্যার বৈকল্পিক নেই এবং আপনি নমুনা বৈকল্পিকের ভিত্তিতে এটি নির্ধারণ করছেন। তবে আপনি কি এই বিরোধী উত্সগুলির কোনও লিঙ্ক বা পোস্ট করতে পারেন?
আন্তনি পরল্লদা

আপনার উত্তর দেওয়ার জন্য ধন্যবাদ! এখানে উদাহরণস্বরূপ, জেড-টেস্টের প্রয়োজনীয়তাগুলি "দুটি সাধারণত বিতরণ করা হলেও স্বতন্ত্র জনসংখ্যা, σ পরিচিত" হিসাবে তালিকাভুক্ত হয়, তাই তারা জনসংখ্যার বন্টন সম্পর্কে কথা বলছে, গড়টি নয় - এটি কি ভুল?
লিসা

@ আন্তনিপরেল্লদা আমি মূল উত্সটিতে কিছু উত্স অন্তর্ভুক্ত করেছি!
লিসা


যদি আসল জনসংখ্যাগুলি স্বাভাবিক হিসাবে জানা থাকে তবে আমাদের একটি নিখুঁত, অপরিবর্তনীয় পরিস্থিতি রয়েছে। তবে সিএলটি প্রায়শই সেখানে থাকে, বিশেষত বড় নমুনাগুলিতে, আপনার লিঙ্কযুক্ত কাগজে উল্লিখিত শর্তগুলির এই অত্যন্ত লম্বা ক্রমের উপর নির্ভর করে এড়াতে।
আন্তনি পরল্লদা

উত্তর:


7

আমি মনে করি এটি সিএলটি-র একটি সাধারণ ভুল বোঝাবুঝি। দ্বিতীয় ধরণের ত্রুটি সংরক্ষণের সাথে কেবল সিএলটি-র কিছুই করার নেই (যা এখানে কেউ উল্লেখ করেনি) তবে জনসংখ্যার বৈচিত্রটি অনুমান করার সময় এটি প্রায়শই প্রযোজ্য নয়। ডেটা অ গাউসিয়ান হ'ল নমুনার বৈচিত্র্য একটি মাপানো চি-স্কোয়ার ডিস্ট্রিবিউশন থেকে খুব দূরে হতে পারে, সুতরাং নমুনার আকার কয়েক হাজার ছাড়িয়ে গেলেও সিএলটি প্রয়োগ করতে পারে না। অনেক বিতরণের জন্য এসডি বিচ্ছুরণেরও ভাল মাপকাঠি নয়।

সিএলটি সত্যিই ব্যবহার করতে, দুটি জিনিসের একটি অবশ্যই সত্য: (1) নমুনা স্ট্যান্ডার্ড বিচ্যুতি সত্য অজানা বিতরণের জন্য ছড়িয়ে দেওয়ার পরিমাপ হিসাবে কাজ করে বা (2) সত্য জনসংখ্যার মান বিচ্যুতি জানা যায়। এটি প্রায়শই হয় না। এবং সিএলটি "কাজ" করার জন্য এন = 20,000 এর চেয়ে অনেক ছোট হওয়ার উদাহরণ এই সাইটের অন্য কোথাও আলোচিত লগনরমাল বিতরণ থেকে নমুনাগুলি আঁকা থেকে আসে।

নমুনার স্ট্যান্ডার্ড বিচ্যুতিটি একটি বিচ্ছুরণ পরিমাপ হিসাবে "কাজ করে" উদাহরণস্বরূপ যদি বিতরণটি প্রতিসম হয় এবং গাওসীয় বিতরণের চেয়ে ভারী এমন লেজ না থাকে।

আমি আমার কোনও বিশ্লেষণের জন্য সিএলটি-র উপর নির্ভর করতে চাই না।


3
সিএলটি কিছুটা রেড হেরিং হতে পারে। এটি প্রায়শই ঘটতে পারে যে নমুনাটির গড় একটি নির্ধারিত অ-স্বাভাবিক বিতরণ থাকে এবং নমুনা এসডি নির্ধারিতভাবে অ-চি আকারে থাকে তবে তবুও টি-স্ট্যাটিস্টিকটি কোনও শিক্ষার্থীর টি বিতরণ দ্বারা কার্যকরভাবে সান্নিধ্যযুক্ত হয় (অংশে উভয়ের মধ্যে নির্ভরতার কারণে পরিসংখ্যান)। এটি কেস কিনা তা কোনও অবস্থাতেই মূল্যায়ন করা উচিত। তবে, যেহেতু সিএলটি সীমাবদ্ধ নমুনাগুলি সম্পর্কে সামান্য দাবি করে (এবং এগুলি সম্পর্কে পরিমাণগত কিছুই বলে না ), বন্টনমূলক অনুমানের সমর্থনে এটির অনুরোধটি সাধারণত অবৈধ।
whuber

এটা কি বলা উচিত যে আমরা একটি প্রক্রিয়া (টি-টেস্টের সাথে অজানা বিতরণ থেকে দুটি নমুনার অর্থের তুলনা করছি) যা নিয়মিতভাবে (এবং সম্ভবত নির্বোধভাবে) সর্বত্রই সঞ্চালিত হয় তা নিয়ে আলোচনা করছি, যদিও এর ন্যায্যতা কি দুর্বল হতে পারে? এবং, বাস্তবে সিএলটি-র কোনও ব্যবহার রয়েছে, এটি আদর্শ না হলেও সহনীয় / গ্রহণযোগ্য হবে?
আন্তনি পরল্লদা

-statistic খুব প্রায়ই একটি বিতরণ কাছ থেকে অনেক দূরে যে হয়েছে বন্টন ডেটা একটি অ-গসিয়ান বন্টন থেকে আসা। এবং হ্যাঁ আমি যা বলতে চাই ব্যবহারের জন্য আত্মপক্ষ সমর্থন -test দুর্বল চেয়ে সবচেয়ে অনুশীলনকারীদের মনে হয়। সে কারণেই আমি আধা এবং প্যারামিট্রিক পদ্ধতি পছন্দ করি। t tttt
ফ্র্যাঙ্ক হ্যারেল

2
সিএলটি আসলেই একটি অ্যাসিম্পোটোটিক স্টেটমেন্ট, এবং যখন বেশিরভাগ লোকেরা এটি আহ্বান করে তখন আমি সন্দেহ করি যে তাদের মাথার মধ্যে ধারণাটি সত্যই বেরি se এসিন উপপাদ্যের মতো (তারা বিশ্বাস করেন যে স্বাভাবিকতার সাথে সংহতি একটি "যুক্তিসঙ্গত" হারে ঘটে এবং তাই তাদের নমুনার আকার "যথেষ্ট ভাল")। তবে এই সামান্য আরও পরিশীলিত যুক্তি টি-পরীক্ষার বৈধতা সম্পর্কে একটি ভুল সিদ্ধান্তে নিয়ে যেতে পারে। আমি অবাক হয়েছি যে এই উত্তরে এটি উল্লেখ করার / জোর দেওয়া উচিত যে এমনকি বেরি – এসিনও সিএলটি-তে মিথ্যা আবেদনগুলি "সংরক্ষণ" করে না।
সিলভারফিশ

3
@ ফ্র্যাঙ্কহারেল "নমুনা স্ট্যান্ডার্ড বিচ্যুতি সত্য অজানা বিতরণের জন্য ছড়িয়ে দেওয়ার পরিমাপ হিসাবে কাজ করে" বলতে কী বোঝ? আপনি যদি নিজের উত্তরে একটি সংক্ষিপ্ত ব্যাখ্যা (সম্ভবত একটি বাক্য) যোগ করেন তবে এটি সহায়ক হবে।
999

9

আমি এই অনুচ্ছেদে মন্তব্যগুলি বোঝার জন্য রেখে যাচ্ছি: সম্ভবত আসল জনগোষ্ঠীর মধ্যে স্বাভাবিকতার অনুমান খুব সীমাবদ্ধ, এবং নমুনা বিতরণকে কেন্দ্র করে ভুলে যাওয়া যেতে পারে এবং বিশেষত বৃহত নমুনাগুলির জন্য কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি ধন্যবাদ thanks

টেস্ট প্রয়োগ করা সম্ভবত একটি ভাল ধারণা যদি (সাধারণত যেমন হয়) আপনি জনসংখ্যার বৈচিত্রটি জানেন না এবং আপনি পরিবর্তে নমুনা রূপগুলি অনুমানকারী হিসাবে ব্যবহার করছেন। নোট করুন যে পুলের বৈকল্পিক প্রয়োগের আগে অভিন্ন রূপের অনুমানের কোনও বৈকল্পিকের F পরীক্ষা বা ল্যাভেন টেস্টের সাথে পরীক্ষা করার প্রয়োজন হতে পারে - আমার এখানে গিটহাবের কিছু নোট রয়েছে ।t

যেমন আপনি উল্লেখ করেছেন, টি-ডিস্ট্রিবিউশনটি নমুনা বৃদ্ধির সাথে সাথে সাধারণ বিতরণে রূপান্তরিত করে, যেমন এই দ্রুত আর প্লটটি দেখায়:

এখানে চিত্র বর্ণনা লিখুন

লাল রঙের মধ্যে একটি সাধারণ বিতরণের পিডিএফ হয় এবং বেগুনি রঙে আপনি বিতরণের পিডিএফের "ফ্যাট টেইল" (বা ভারী লেজ) মধ্যে প্রগতিশীল পরিবর্তন দেখতে পান স্বাধীনতার ডিগ্রি হিসাবে শেষ পর্যন্ত এটি মিশ্রিত না হওয়া পর্যন্ত সাধারণ প্লটt

সুতরাং বড় নমুনাগুলির সাথে একটি জেড-পরীক্ষা প্রয়োগ করা ঠিক আছে।


আমার প্রাথমিক উত্তর দিয়ে বিষয়গুলি সম্বোধন করছি। ধন্যবাদ, গ্লেন_ বি ওপিতে আপনার সহায়তার জন্য (ব্যাখ্যাটিতে সম্ভবত নতুন নতুন ভুল সম্পূর্ণ আমার)।

  1. সাধারণ দায়বদ্ধতার অধীনে বিতরণে টি স্ট্যাটিকস অনুসরণ করে:

এক-নমুনা বনাম দ্বি-নমুনা (জোড়যুক্ত এবং অযৌক্তিক) জন্য সূত্রে জটিলতাগুলি বাদ দিয়ে, কোনও জনসংখ্যার সাথে একটি নমুনা গড়ের তুলনা করার ক্ষেত্রে সাধারণ টি পরিসংখ্যানটি বোঝায় :

(1)t-test=X¯μsn=X¯μσ/ns2σ2=X¯μσ/nx=1n(XX¯)2n1σ2

যদি গড় এবং বৈকল্পিক সহ একটি সাধারণ বিতরণ অনুসরণ করে :μ σ 2Xμσ2

  1. লব ।এন ( 1 , 0 )(1) N(1,0)
  2. হর বর্গমূল হতে হবে (স্কেলযুক্ত চি স্কোয়ার্ড), যেহেতু here এখানে প্রাপ্ত ।এস 2 / σ 2(1)s2/σ2n11n1χn12(n1)s2/σ2χn12
  3. সংখ্যা এবং ডিনোমেনেটর স্বতন্ত্র হতে হবে।

এই কনডিটনগুলির অধীনে ।t-statistict(df=n1)

  1. কেন্দ্রীয় সীমা উপপাদ্য:

নমুনার স্যাম্পলিং বিতরণের স্বাভাবিকতার দিকে প্রবণতা অর্থাত্ নমুনার আকার বৃদ্ধি হওয়ায় সংখ্যাটি সাধারণ না থাকলেও সংখ্যাটির একটি সাধারণ বন্টনকে ন্যায্যতা প্রমাণ করতে পারে। তবে এটি অন্য দুটি অবস্থার উপর প্রভাব ফেলবে না (ডিনোমিনেটরের চি স্কোয়ার বিতরণ এবং ডোনমিনেটর থেকে সংখ্যার স্বাধীনতা)।

তবে সব হারিয়ে যায় না, এই পোস্টে আলোচনা করা হয়েছে যে স্লুটজকি উপপাদ্যটি ডিনোমিনেটরের চি বিতরণ পূরণ না করা সত্ত্বেও কীভাবে একটি সাধারণ বন্টনের দিকে অ্যাসিপোটিক কনভার্সনকে সমর্থন করে।

  1. বলিষ্ঠতার:

সাইকোলোজস্কি এসএস এবং ব্লেয়ার আরসি সাইকোলজিকাল বুলেটিন, ১৯৯২, খণ্ডে "জনসংখ্যার স্বাভাবিকতা থেকে প্রস্থানের টেস্টের টেস্টের টেস্ট টেস্ট টেস্ট টেস্ট টু টেস্ট টেস্ট টু টেস্ট টু টেপ টু পপুলেশন নরমালটি" -র গবেষণাপত্রে কাগজে ১১১, নং -২, ৩৫২-৩60০ , যেখানে তারা বিদ্যুতের জন্য এবং প্রথম ধরণের ত্রুটির জন্য কম আদর্শ বা বেশি "বাস্তব বিশ্বের" (কম স্বাভাবিক) বিতরণ পরীক্ষা করেছিল, নিম্নলিখিত যুক্তিগুলি পাওয়া যায়: "প্রকারের ক্ষেত্রে রক্ষণশীল প্রকৃতি থাকা সত্ত্বেও আমি এই বাস্তব বিতরণের কিছুগুলির জন্য টি টেস্টের ত্রুটি করেছি, বিভিন্ন চিকিত্সার শর্তাদি এবং অধ্যয়ন করা নমুনা আকারের জন্য বিদ্যুতের স্তরের উপর খুব সামান্য প্রভাব পড়েছিল Rese গবেষকরা সহজেই সামান্য বড় নমুনার আকার নির্বাচন করে ক্ষমতার সামান্য ক্ষতির জন্য ক্ষতিপূরণ দিতে পারেন "

" প্রচলিত মতামতটি দেখে মনে হচ্ছে যে স্বতন্ত্র-নমুনা টি পরীক্ষাটি যথাযথভাবে শক্তিশালী, যেমন টাইপ আই ত্রুটির সাথে সম্পর্কিত, গা-নন জনসংখ্যার আকারের যতক্ষণ না (ক) নমুনা আকার সমান বা প্রায়, (খ) নমুনা মাপগুলি মোটামুটি বড় (বোনাউ, 1960, 25 থেকে 30 এর নমুনা আকারের উল্লেখ করে) এবং (গ) পরীক্ষাগুলি এক-লেজির চেয়ে দ্বি-পুচ্ছ হয় also এছাড়াও নোট করুন যে যখন এই শর্তগুলি পূরণ হয় এবং নামমাত্র আলফা এবং আসল আলফার মধ্যে পার্থক্য হয় দেখা দেয়, তাত্পর্যগুলি সাধারণত উদার প্রকৃতির চেয়ে রক্ষণশীলতার হয় "

লেখকরা বিষয়টির বিতর্কিত দিকগুলিকে জোর দেয় এবং আমি অধ্যাপক হ্যারেলের দ্বারা বর্ণিত লগমনরমাল বিতরণের উপর ভিত্তি করে কিছু সিমুলেশন নিয়ে কাজ করার অপেক্ষায় রয়েছি। আমি নন-প্যারামেট্রিক পদ্ধতিগুলির (যেমন মান – হুইটনি ইউ পরীক্ষা) কিছু মন্টি কার্লো তুলনা করতেও চাই। সুতরাং এটি একটি কাজ চলছে ...


উন্নয়নশীল:

দাবি অস্বীকার: এক উপায় বা অন্য কোনও উপায়ে "নিজেকে প্রমাণ করে দেওয়ার" মধ্যে এই অনুশীলনের মধ্যে একটি যা অনুসরণ করে। ফলাফলগুলি সাধারণীকরণ করতে (কমপক্ষে আমার দ্বারা নয়) ব্যবহার করা যায় না, তবে আমি অনুমান করতে পারি যে এই দুটি (সম্ভবত ত্রুটিযুক্ত) এমসির সিমুলেশনগুলি পরিস্থিতিতে টি পরীক্ষার ব্যবহার সম্পর্কে খুব বেশি নিরুৎসাহিত বলে মনে হচ্ছে না don't বর্ণনা করেছেন।

টাইপ আই ত্রুটি:

টাইপ আই ত্রুটির বিষয়ে, আমি লগনারমাল বিতরণ ব্যবহার করে একটি মন্টি কার্লো সিমুলেশন চালিয়েছি। Para এবং পরামিতিগুলির সাথে লগন্যালমাল বিতরণ থেকে বৃহত্তর নমুনাগুলি ( ) কে বহুবার বিবেচনা করা হবে সেগুলি বের করে , আমি টি-মানগুলি এবং পি-মানগুলি গণনা করেছি যা ফলাফলগুলির তুলনা করা হয় যদি আমরা এর সাথে তুলনা করি এই নমুনাগুলির মধ্যে সমস্তগুলি একই জনসংখ্যা থেকে এবং একই আকারের সমস্ত all মন্তব্যগুলিতে এবং ডানদিকে বিতরণের চিহ্নিত স্কিউনেসের ভিত্তিতে লগনরমালটি বেছে নেওয়া হয়েছিল:n=50μ=0σ=1

এখানে চিত্র বর্ণনা লিখুন

এর তাত্পর্যপূর্ণ স্তরটি নির্ধারণ করা প্রকৃত ধরণের আই ত্রুটির হার been হত , খুব খারাপ হবে না ...5%4.5%

বাস্তবে প্রাপ্ত টি পরীক্ষার ঘনত্বের চক্রান্তটি টি-বিতরণের প্রকৃত পিডিএফকে ওভারল্যাপ করে বলে মনে হয়েছিল:

এখানে চিত্র বর্ণনা লিখুন

সবচেয়ে আকর্ষণীয় অংশটি টি পরীক্ষার "ডিনোমিনেটর" এর দিকে চেয়েছিল, যে অংশটি চি-স্কোয়ার বিতরণ অনুসরণ করার কথা ছিল:

(n1)s2/σ2=98(49(SDA2+SDA2))/98(eσ21)e2μ+σ2

এই উইকিপিডিয়া এন্ট্রি হিসাবে আমরা এখানে সাধারণ স্ট্যান্ডার্ড বিচ্যুতি ব্যবহার করছি :

SX1X2=(n11)SX12+(n21)SX22n1+n22

এবং, আশ্চর্যরূপে (বা না) চক্রান্তটি সুপারিম্পোজড চি-স্কোয়ার্ড পিডিএফ থেকে সম্পূর্ণ ভিন্ন ছিল:

এখানে চিত্র বর্ণনা লিখুন

টাইপ II ত্রুটি এবং পাওয়ার:

রক্তচাপ বিতরণের সম্ভব লগ-স্বাভাবিক হয় , যা অত্যন্ত কুশলী আসে একটি সিন্থেটিক দৃশ্যকল্প যা তুলনা গ্রুপ ক্লিনিকাল প্রাসঙ্গিকতা একটি দূরত্ব দ্বারা গড় মানের মধ্যে আলাদা সেট আপ করার জন্য, একটি রক্তচাপ প্রভাব পরীক্ষা একটি ক্লিনিকাল গবেষণায় বলা ড্রাগগুলি ডায়াস্টোলিক বিপি-তে ফোকাস করে, একটি উল্লেখযোগ্য প্রভাবকে মিমিএইচজি (প্রায় মিমিএইচজি একটি এসডি চয়ন করা হয়েছিল) এর গড় ড্রপ হিসাবে বিবেচনা করা যেতে পারে :9109

এখানে চিত্র বর্ণনা লিখুন এই কল্পিত গ্রুপগুলির মধ্যে টাইপ প্রথম ত্রুটি হিসাবে অন্যথায় অনুরূপ মন্টি কার্লো সিমুলেশন সম্পর্কে তুলনা টি-পরীক্ষা চালানো এবং এর তাত্পর্যপূর্ণ স্তর সহ আমরা টাইপ II ত্রুটিগুলি সহ শেষ করি এবং কেবলমাত্র শক্তি ।0.024 % 99 %5%0.024%99%

কোডটি এখানে


1
আমি মনে করি এটি সিএলটি-র একটি সাধারণ ভুল বোঝাবুঝি। দ্বিতীয় ধরণের ত্রুটি সংরক্ষণের সাথে কেবল সিএলটি-র কিছুই করার নেই (যা এখানে কেউ উল্লেখ করেনি) তবে জনসংখ্যার বৈচিত্রটি অনুমান করার সময় এটি প্রায়শই প্রযোজ্য নয়। ডেটা অ গাউসিয়ান হ'ল নমুনার বৈচিত্র্য একটি মাপানো চি-স্কোয়ার ডিস্ট্রিবিউশন থেকে খুব দূরে হতে পারে, সুতরাং নমুনার আকার কয়েক হাজার ছাড়িয়ে গেলেও সিএলটি প্রয়োগ করতে পারে না। অনেক বিতরণের জন্য এসডি বিচ্ছুরণেরও ভাল মাপকাঠি নয়।
ফ্রাঙ্ক হ্যারেল

1
অধ্যাপক হ্যারেল, পোস্টটি ভুল হলে আমি খুলে খুশি হব। এটি খুব ভাল একটি খুব মৌলিক ভুল বোঝাবুঝি হতে পারে। আমি পরামর্শ দিচ্ছিলাম যে নমুনা বিতরণে সিএলটি প্রয়োগ করা হয়েছে যার অর্থ হল বড় আকারের নমুনাগুলিতে, নমুনাগুলির উত্স বন্টন নির্বিশেষে জেড-টেস্ট বা টি-টেস্টের সাথে অর্থের তুলনা করা। এটা ঠিক না?
আন্তনি পরল্লদা

1
এটি সঠিক হবে যদি (1) নমুনা স্ট্যান্ডার্ড বিচ্যুতি সত্য অজানা বিতরণের জন্য ছড়িয়ে দেওয়ার পরিমাপ হিসাবে কাজ করে বা (2) সত্য জনসংখ্যার মান বিচ্যুতি জানা যায়। এটি প্রায়শই হয় না। আর এন = 20,000 হচ্ছে একটি উদাহরণ পর্যন্ত খুব "কাজ" করতে CLT জন্য ছোট lognormal বন্টন থেকে নমুনা অঙ্কন থেকে আসে। এই পয়েন্টগুলি সম্পর্কে ভুল বোঝাবুঝি 20 বছরের অভিজ্ঞতার সাথে পরিসংখ্যানগুলিতে পিএইচডিগুলির মধ্যে ছড়িয়ে পড়ে।
ফ্রাঙ্ক হ্যারেল

5
সমস্যাটি লিসা, আপনার অর্থের তুলনা করতে হবে বা আপনি দুটি জনসংখ্যার অবস্থানের তুলনা করতে ইচ্ছুক কিনা। কিছু অ্যাপ্লিকেশনগুলিতে আগ্রহ একটি গড় বা যোগফলকে কেন্দ্র করে, যেহেতু অন্য কোনও পরামিতি দ্বারা এটি প্রতিস্থাপন করা খুব কম কাজে আসবে। এটি বিশেষত ক্ষেত্রে যেখানে জনসংখ্যার প্রাকৃতিক পরিমাণে পরিমাণ থাকে যেমন অর্থ বা পরিবেশ দূষণ।
হুবুহু

3
আন্তনি, দৃust়তার বিষয়ে আপনার শেষ বিভাগটি বেশ উপযুক্ত। আমি স্যালোসকি এবং ব্লেয়ারের বর্ণনার মতো অনেকগুলি অধ্যয়ন করেছি এবং আরও অনেকগুলি পড়েছি এবং তাই সন্দেহ করি যে তাদের সিদ্ধান্তগুলি অবশ্যই খুব বিশেষ ধরণের ডেটাতেই সীমাবদ্ধ থাকতে পারে। টি পরীক্ষা শোচনীয়ভাবে ব্যর্থ হয়, বিশেষ করে , ক্ষমতা পরিপ্রেক্ষিতে অত্যন্ত স্কিউ ডিস্ট্রিবিউশন উপস্থিতিতে। বছরের পর বছরগুলিতে আমাকে যা অবাক করেছে তা হ'ল স্বাভাবিকতা থেকে অন্য প্রস্থানের পক্ষে এটি সত্যই দৃust় এবং এ পর্যন্ত যে আমি দাবিতে কিছুটা বৈধতা দেখি যে এটি একটি ননপ্যারমেট্রিক পদ্ধতি।
শুকনো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.