যথেষ্ট পরিমাণে নমুনার আকার দেওয়া হয়েছে, সত্যের প্রভাবের আকারটি ঠিক শূন্য না হওয়া পর্যন্ত একটি পরীক্ষা সর্বদা উল্লেখযোগ্য ফলাফল প্রদর্শন করে। কেন?


21

প্রভাবের আকারে উইকিপিডিয়ায় নিবন্ধে করা দাবি সম্পর্কে আমি কৌতূহলী । বিশেষ করে:

[...] একটি নন-নাল স্ট্যাটিস্টিকাল তুলনা সর্বদা একটি পরিসংখ্যানপূর্ণ তাৎপর্যপূর্ণ ফলাফল দেখায় যদি না জনসংখ্যার প্রভাবের আকার হুবুহু হয়

আমি এর অর্থ / ইঙ্গিত কী তা নিশ্চিত নই, এটির ব্যাক আপ নেওয়ার জন্য একটি যুক্তি দেওয়া যাক। আমার ধারণা, সর্বোপরি, প্রভাবটি একটি পরিসংখ্যান, অর্থাত, একটি নিজস্ব মূল্য বন্টন সহ একটি নমুনা থেকে গণনা করা একটি মান। এর মানে কি এই যে প্রভাবগুলি কখনই কেবল এলোমেলো পরিবর্তনের কারণে হয় না (যা আমি বুঝতে পেরেছি তা তাৎপর্যপূর্ণ না হওয়ার অর্থ)? এরপরে কি আমরা কেবল বিবেচনা করি যে প্রভাবটি যথেষ্ট শক্তিশালী - উচ্চ পরম মূল্য রয়েছে?

আমি যে প্রভাবটির সাথে আমি সর্বাধিক পরিচিত তা বিবেচনা করছি: পিয়ারসন পারস্পরিক সম্পর্ক সহগ এটি এর বিরোধিতা করছে বলে মনে হচ্ছে। কেন কোনও পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হবে? যদি ছোট হয় তবে আমাদের রিগ্রেশন রেখা rr

y=ax+b=r(sysx)=ϵx+b

জন্য ছোট, 0 পাসে, একটি এফ পরীক্ষা সম্ভবত ঢাল জন্য 0 ধারণকারী ব্যবধান একটি কনফিডেন্স ধারণ করবে। এটি কি কাউন্টারিক্স নমুনা নয়?ε


10
ইঙ্গিত: আপনি যে অংশটি উদ্ধৃত করেছেন তার আগে এই ধারাটি অপরিহার্য। " পর্যাপ্ত পরিমাণে নমুনার আকার দেওয়া হয়েছে , জনসংখ্যার প্রভাবের আকারটি শূন্য না হলে একটি অ-শূন্য পরিসংখ্যান তুলনা সর্বদা একটি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফলাফল দেখায় ..."
কোডিওলজিস্ট

@ কোডিওলজিস্ট: তবে, আমার উদাহরণটি আবার কী বোঝায় যে নমুনার আকার যদি বড় হয় তবে r নিজেও বড় হবে, বা কমপক্ষে এক্সপ্রেশনটি বড় হবে যদি নমুনার আকার বড় হত? আমি এটা দেখতে পাচ্ছি না। R(গুলিY/গুলিএক্স)
গ্যারি

5
যদি এটি সত্য না হয় তবে এটি পরিসংখ্যান পদ্ধতিতে একটি ত্রুটি হবে। যদি অবশ্যই কিছু নমুনার আকার পার্থক্য সনাক্ত করতে যথেষ্ট বড়। μ>μ0
জন কোলেম্যান

উত্তর:


26

একটি সাধারণ উদাহরণ হিসাবে ধরুন, আমি কয়েকটি পরিসংখ্যানের জাম্বু জাম্বো ব্যবহার করে আপনার উচ্চতা অনুমান করছি।

আপনি সর্বদা অন্যকে বলেছিলেন যে আপনি 177 সেন্টিমিটার (প্রায় 5 ফুট 10 ইঞ্চি)।

যদি আমি এই অনুমানটি পরীক্ষা করে দেখি (যে আপনার উচ্চতা 177 সেন্টিমিটার, সমান ) এবং আমি আমার পরিমাপের ত্রুটিটি যথেষ্ট পরিমাণে কমিয়ে দিতে পারি, তবে আমি প্রমাণ করতে পারি যে আপনি আসলে 177 সেন্টিমিটার নন । অবশেষে, আমি যদি আপনার উচ্চতাটি দশমিক স্থানে নির্ধারণ করি তবে আপনি অবশ্যই প্রায় 177.00000000 সেমি'র উচ্চতা থেকে বিচ্যুত হবেন। সম্ভবত আপনি 177.02 সেমি; আপনি 177 সেন্টিমিটার নন, তা জানতে আমাকে কেবল আমার ত্রুটি .02 এর চেয়ে কম করতে হবে।=177

আমি কীভাবে পরিসংখ্যান ত্রুটি হ্রাস করব? একটি বড় নমুনা পান। আপনি যদি যথেষ্ট পরিমাণে নমুনা পান তবে ত্রুটিটি এত ছোট হয়ে যায় যে আপনি নাল অনুমান থেকে সবচেয়ে বিয়োগ বিচ্যুতি সনাক্ত করতে পারেন।


2
এটি একটি খুব স্পষ্ট এবং সংক্ষিপ্ত ব্যাখ্যা। আরও গাণিতিক উত্তরের চেয়ে কেন এটি ঘটে তা বোঝার জন্য এটি সম্ভবত আরও সহায়ক। সাবাশ.
কেউ

1
সুন্দরভাবে ব্যাখ্যা করা হয়েছে, তবে আমি মনে করি এটি বিবেচনা করাও গুরুত্বপূর্ণ যে এমন কিছু ক্ষেত্রে রয়েছে যেখানে বর্ণিত মানটি সত্যই সঠিক। উদাহরণস্বরূপ, স্ট্রিং তত্ত্ব ইত্যাদিতে ঘটে যাওয়া অদ্ভুত জিনিসগুলি বাদ দেওয়া, আমাদের মহাবিশ্বের স্থানিক মাত্রার সংখ্যার একটি পরিমাপ (যা করা যেতে পারে) 3 দিতে চলেছে, এবং আপনি যে পরিমাপটি কতটা সুনির্দিষ্ট করেন না কেন আপনি তা করবেন পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ বিচ্যুতিগুলি 3 থেকে ধারাবাহিকভাবে কখনই খুঁজে পাবেন না enough অবশ্যই আপনি পর্যাপ্ত সময় পরীক্ষা করে চলতে থাকলে কেবলমাত্র বৈকল্পের কারণে কিছু বিচ্যুতি পাবেন তবে এটি একটি ভিন্ন বিষয়।
ডেভিড জেড

সম্ভবত একটি নিষ্পাপ প্রশ্ন তবে আমি যদি দাবি করি যে আমি 177 সেন্টিমিটার আছি তবে তাৎপর্যপূর্ণ অঙ্কের ধারণার অর্থ কি আমি কেবল বলছি না যে আমি 176.5 থেকে 177.5 এর মধ্যে আছি? উত্তরটি একটি ভাল তাত্ত্বিক ধারণা দেয় বলে মনে হচ্ছে সত্য, তবে এটি কি কোনও মিথ্যা ভিত্তির ভিত্তিতে নয়? আমি কী মিস করছি?
জিমলোহসে

এক্ষেত্রে 177 এর উল্লিখিত উচ্চতা পরিসংখ্যানগুলিতে নাল অনুমানের সাথে সমান। সাম্যের জন্য traditionalতিহ্যগত অনুমানের পরীক্ষায় আপনি সাম্যের বিবৃতি দেন (যেমন )। মুল বক্তব্যটি হ'ল আপনি নিজের উচ্চতাটিকে যা বলে থাকুক না কেন, নাল অনুমানটি একেবারে সত্য না হলে আমি ত্রুটিটি হ্রাস করে এটিকে অস্বীকার করতে পারি। আমি উদাহরণ বুঝতে একটি সহজ হিসাবে উচ্চতা ব্যবহৃত হয়েছে, কিন্তু এই ধারণা (পদার্থ এক্স না ক্যান্সার সৃষ্টি, এই মুদ্রা ন্যায্য হয় না ইত্যাদি) অন্যান্য এলাকায় একইμ=177
Underminer

13

@ কোডিওলজিস্ট যেমন উল্লেখ করেছেন, এটি বড় আকারের নমুনার আকারের ক্ষেত্রে কী ঘটে তা সত্য। ছোট নমুনা আকারের জন্য আপনার কাছে মিথ্যা ধনাত্মক বা মিথ্যা sণাত্মক না থাকতে পারে এমন কোনও কারণ নেই।

আমি মনে করি টেষ্টটি অ্যাসিম্পটোটিক কেসটিকে আরও পরিষ্কার করে তোলে। ধরুন আমাদের কাছে এক্স 1 , , এক্স এন আইড এন ( μ , 1 ) রয়েছে এবং আমরা এইচ 0 : μ = 0 বনাম এইচ : μ 0 পরীক্ষা করতে চাই । আমাদের পরীক্ষার পরিসংখ্যান হ'ল জেড এন = ˉ এক্স এন - 0zX1,,XniidN(μ,1)H0:μ=0HA:μ0

জেডএন=এক্স¯এন-01/এন=এনএক্স¯এন

তাইজেডএন=এক্স¯এন~এন(μ,1এন)। আমরাপি(|জেডএন|α) এ আগ্রহীপি(|জেডএন|α)=পি(জেডএন-α)+পি(জেডএনα)=1+Φ(-α-μজেডএন=এনএক্স¯এন~এন(μএন,1)পি(|জেডএন|α)

পি(|জেডএন|α)=পি(জেডএন-α)+ +পি(জেডএনα)
যাকওয়াই~এন(0,1)আমাদের রেফারেন্স পরিবর্তনশীল হও। এইচ0μ=0 এরঅধীনেআমাদের কাছেপি(|জেডএন|α)=1-পি(-αওয়াইα) রয়েছেতাই আমরা পছন্দ করতে পারিtype আমাদের প্রকারের ত্রুটি হারকেপছন্দসইভাবেনিয়ন্ত্রণকরতে। তবেএইচμ √ এর অধীনে
=1+ +Φ(-α-μএন)-Φ(α-μএন)
ওয়াই~এন(0,1)এইচ0 μ=0পি(|জেডএন|α)=1-পি(-αওয়াইα)αএইচএকজন তাই পি(|জেডএন|α)1+ +Φ(±)-Φ(±)=1 তাই সম্ভাব্যতা 1 আমরা প্রত্যাখ্যান করবেএইচ0যদিμ0(±ক্ষেত্রে হয়μ<0, তবে উভয় উপায়ে একই চিহ্ন রয়েছে)।μএন0
পি(|জেডএন|α)1+ +Φ(±)-Φ(±)=1
এইচ0μ0±μ<0

μ 0μ01এনএইচএকজন1এন

এইচ0:ρ=ρ0এইচএকজন:ρρ01


1
μ<0 - Zn

1
μ=0X¯p0n

1
@ দেলতাভ, ঠিক আছে, যদি রূপান্তর হারটি আলাদা হয় তবে একটি অজস্র নাল বিতরণ পেতে আলাদা স্কেলিং প্রয়োজন one তবে বর্তমান উদাহরণের জন্য, মূল-এন হ'ল সঠিক হার।
ক্রিস্টোফ হ্যাঙ্ক

1
এনএক্স¯0

7

যুক্তিযুক্তভাবে তারা যা বলেছিল তা ভুল, যদি তাদের "এটি সর্বদা ঘটে থাকে" ব্যবহার না করে অন্য কোনও কারণে না হয়।

আমি জানি না যে এটি আপনার মধ্যে যে বিভ্রান্তির সৃষ্টি হয়েছে তা যদি হয় তবে আমি এটি পোস্ট করব কারণ আমি মনে করি অনেকেই এর দ্বারা বিভ্রান্ত হয়ে পড়বেন:

Xnn>n0এক্স

লিমএনpr(এক্স)=1

তারা আক্ষরিকভাবে যা বলছে তা নিম্নলিখিতগুলিতে অনুবাদ করে:

কোনও ন্যূনতম আকারের উপরে যে কোনও নমুনা আকারের জন্য, কোনও শূন্য না হলে কোনও নন-নাল পরীক্ষার ফলাফল উল্লেখযোগ্য হওয়ার গ্যারান্টিযুক্ত।এন 0এনএন0

তারা কি ছিল চেষ্টা বলতে, যদিও, নিম্নলিখিত হল:

যে কোনও তাত্পর্য স্তরের জন্য, নমুনার আকার বাড়ার সাথে সাথে, সত্য-প্রভাবের আকারটি শূন্য না হলে একটি নন-নাল পরীক্ষা একটি উল্লেখযোগ্য ফলাফলের সম্ভাব্যতা 1 এ পৌঁছায়।

এখানে গুরুত্বপূর্ণ পার্থক্য রয়েছে:

  • কোন গ্যারান্টি নেই। আপনি সম্ভবত আরও বড় নমুনা সহ একটি উল্লেখযোগ্য ফলাফল পাওয়ার সম্ভাবনা বেশি । এখন, তারা এখানে দোষের কিছু অংশ ছিনিয়ে নিতে পারে, কারণ এখন পর্যন্ত এটি কেবল একটি পরিভাষার সমস্যা। সম্ভাব্য প্রসঙ্গে, এটা হয় বোঝা যে বিবৃতি "যদি এন বৃহৎ যথেষ্ট তারপর এক্স হল" করতে পারেন এছাড়াও মানে ব্যাখ্যা করা "এক্স আরো এবং আরো সম্ভাবনা সত্য হতে পারে হয়ে এন বৃহৎ বৃদ্ধি"
    যাইহোক, এই ব্যাখ্যাটি "উইন্ডো" হওয়ার সাথে সাথে আমার উইন্ডোটি বাইরে চলে যায়। এখানে যথাযথ পরিভাষাটি " উচ্চ সম্ভাবনার সাথে " 1 বলার কারণ হতে পারে ।

  • এটি গৌণ, তবে তাদের শব্দটি বিভ্রান্তিকর — এটি বোঝা যাচ্ছে যে আপনি নমুনার আকারটিকে "যথেষ্ট পরিমাণে" বড় করে ফিক্স করেছেন এবং তারপরে বিবৃতিটি কোনও তাত্পর্য স্তরের জন্য সত্যকে ধারণ করে। তবে সঠিক গাণিতিক বক্তব্যটি নির্বিশেষে, এর সত্যিকার অর্থে কোনও অর্থ হয় না: আপনি সর্বদা প্রথমে তাত্পর্য স্তরটি ঠিক করেন এবং তারপরে আপনি নমুনার আকারটি যথেষ্ট বড় হিসাবে বেছে নেন।
    কিন্তু প্রস্তাব এটি একরকম অন্যান্য উপায় হতে পারে প্রায় দুর্ভাগ্যবশত উপর জোর দেয় তাই এমনকি খারাপ উপরে সমস্যা যে "বৃহৎ যথেষ্ট", ব্যাখ্যা।এন>এন0

তবে আপনি একবার সাহিত্যটি বুঝতে পারলে তারা কী বলার চেষ্টা করছেন তা পেয়ে যাবেন।

(পার্শ্ব দ্রষ্টব্য: ঘটনাক্রমে, অনেকেই উইকিপিডিয়ায় যে ধ্রুবক সমস্যাগুলির মধ্যে রয়েছেন তার মধ্যে এটি একটি Frequently প্রায়শই, আপনি যদি ইতিমধ্যে উপাদানটি জেনে থাকেন তবে তারা কী বলছে তা বোঝা সম্ভব, সুতরাং এটি কেবলমাত্র একটি রেফারেন্সের জন্য বা একটি অনুস্মারক হিসাবে ভাল , স্ব-শিক্ষাদানের উপাদান হিসাবে নয়))

1 সহযোদ্ধাদের (হাই!), হ্যাঁ, এই শব্দটির একটি নির্দিষ্ট অর্থ রয়েছে যার সাথে আমি যুক্ত হয়েছি। আমরা সম্ভবত এখানে চাই সবচেয়ে স্বল্প প্রযুক্তিগত শব্দটি হ'ল "asyptotically প্রায় অবশ্যই"এখানে দেখুন


"যদি নন-নাল পরীক্ষাটি একটি উল্লেখযোগ্য ফলাফল দেয় তবে প্রকৃত প্রভাবের আকারটি ঠিক শূন্য হয় এমন সম্ভাবনা 0 টি সঠিক নাও হতে পারে: যদি পরীক্ষার তাৎপর্য স্তর তবে তাৎপর্যপূর্ণ ফলাফলের সম্ভাবনা থাকতে পারে বা সমস্ত নমুনা মাপের অবস্থানααα
হেনরি

@ হেনরি: ওহ গুলি, ঠিক বলেছেন! আমি এত তাড়াতাড়ি লিখেছিলাম আমি ভাবতে থামিনি। অসংখ্য ধন্যবাদ! আমি এটা ঠিক করেছি। :)
মেহরদাদ

3

আমার প্রিয় উদাহরণটি লিঙ্গ অনুসারে আঙ্গুলের সংখ্যা। বেশিরভাগ মানুষের 10 টি আঙুল রয়েছে। কেউ কেউ দুর্ঘটনার কারণে আঙ্গুল হারিয়েছেন। কারও কারও অতিরিক্ত আঙুল রয়েছে।

আমি জানি না পুরুষদের মহিলাদের চেয়ে বেশি আঙ্গুল রয়েছে (গড়ে)। সহজেই উপলভ্য সমস্ত প্রমাণ ইঙ্গিত দেয় যে পুরুষ এবং মহিলা উভয়েরই 10 টি আঙ্গুল রয়েছে।

তবে আমি অত্যন্ত আত্মবিশ্বাসী যে আমি যদি সমস্ত পুরুষ এবং সমস্ত মহিলার একটি জনগণনা করি তবে আমি শিখতে পারি যে একটি লিঙ্গের অপরটির চেয়ে বেশি আঙ্গুল রয়েছে (গড়ে)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.