পিয়ারসনের চি স্কোয়ার্ড স্ট্যাটিস্টিক কীভাবে প্রায় চি স্কোয়ার ডিস্ট্রিবিউশনটি করে


10

সুতরাং যদি পিয়ারসনের চি স্কোয়ার্ড স্ট্যাটিস্টিককে টেবিলের জন্য দেওয়া হয় , তবে এর ফর্মটি হ'ল:1×N

i=1n(OiEi)2Ei

তারপরে এটি , নমুনার আকার আরও বড় হওয়ার সাথে সাথে স্বাধীনতার ডিগ্রি সহ চি-স্কোয়ার্ড বিতরণ । χn12n1N

আমি যা বুঝতে পারি না তা হ'ল এই অ্যাসিপটোটিক আনুমানিকতা কীভাবে কাজ করে। আমি মনে 'denominators, মধ্যে গুলি উল্লেখ করা আবশ্যক । যেহেতু এটি আপনাকে জন্য । তবে অবশ্যই এটির নয়, স্বাধীনতার ডিগ্রি রয়েছে , সুতরাং স্পষ্টভাবে অন্য কিছু চলছে।Eisi2niχn2=i=1nZi2Zin(0,1)nn1


যদিও এটি আপনার প্রশ্নের উত্তর দেয় না , তবে এটি এতে কিছুটা আলোকপাত করতে পারে।
whuber

উত্তর:


11

আমি এটি স্বজ্ঞাতভাবে অনুপ্রাণিত করতে যাচ্ছি, এবং এটি দ্বিপাক্ষিকের স্বাভাবিক সান্নিধ্য গ্রহণ করতে আপনি সন্তুষ্ট হয়ে ধরে নিলাম, এটি দুটি গ্রুপের বিশেষ ক্ষেত্রে কীভাবে ঘটে তা নির্দেশ করে চলেছি।

আশা করি এটি কেন এটি কাজ করে কেন তা বোঝার জন্য আপনার পক্ষে এটি যথেষ্ট।

আপনি ফিট টেস্টের চি-স্কোয়ার ধার্মিকতার কথা বলছেন। ধরা যাক গ্রুপ রয়েছে (আপনার কাছে এটি হিসাবে আছে , তবে এর কোনও কারণ নেই যে আমি একে বলে পছন্দ করি )।knk

মডেলে এ অবস্থার জন্য প্রয়োগ করা হচ্ছে, এই সংখ্যা , হয় MULTINOMIALOii=1,2,...,k

যাক । গণনাগুলি তে যোগ করা হয় (কিছু বিরল পরিস্থিতিতে বাদে); এবং প্রতিটি বিভাগের জন্য সম্ভাব্যতার কিছু পূর্বনির্ধারিত সেট রয়েছে, , যার সমষ্টি ।N=i=1kOiNpi,i=1,2,,k1

দ্বি-দ্বিখণ্ডিতের মতো, বহু-জাতীয়গুলির জন্য একটি অ্যাসিম্পটোটিক স্বাভাবিক আনুমানিকতা রয়েছে - প্রকৃতপক্ষে, যদি আপনি কেবলমাত্র একটি নির্দিষ্ট ঘরে ("এই বিভাগে" বা না) গণনা বিবেচনা করেন, তবে এটি দ্বিপাক্ষিক হবে। দ্বিপদী হিসাবে যেমন গণনাগুলির বৈচিত্রগুলি (তেমনি বহুবর্ষে তাদের সমবায়) এবং এর কাজ; আপনি আলাদাভাবে কোনও বৈকল্পিক অনুমান করবেন না।Np

অর্থাৎ, যদি প্রত্যাশিত গণনাগুলি যথেষ্ট পরিমাণে বড় হয় তবে সাথে পরিসংখ্যানের ভেক্টর প্রায় স্বাভাবিক । তবে, গণনাগুলি তে কন্ডিশনড হওয়ার কারণে , বিতরণটি হ্রাস পেয়েছে (এটি মাত্রার হাইপারপ্লেনে উপস্থিত রয়েছে , যেহেতু গণনাগুলির নির্দিষ্ট করে বাকিটিকে স্থির করে)। ভেরিয়েন্স-কোভেরিয়েন্স ম্যাট্রিক্সে ত্রিভুজ এবং তির্যক উপাদানগুলি বন্ধ , এবং এটি অবক্ষয়ের কারণে পদে রয়েছে ।Ei=NpiNk1k1Npi(1pi)Npipjk1

ফলস্বরূপ, একজন ব্যক্তি কক্ষের জন্য , এবং আপনি লিখতে পারেন। তবে শর্তাবলী নির্ভরশীল (নেতিবাচকভাবে সম্পর্কিত), সুতরাং আপনি যদি এই এর বর্গাকার যোগফল যোগ করেন তবে এটিতে কে বিতরণ থাকবে না (এটি যদি তারা স্বতন্ত্র ভেরিয়েবল হয় তবে)। পরিবর্তে আমরা সম্ভাব্যভাবে মূল থেকে স্বতন্ত্র ভেরিয়েবলগুলির একটি সেট তৈরি করতে পারি যা স্বতন্ত্র এবং এখনও প্রায় সাধারণ (অ্যাসিপোটোটিক্যালি স্বাভাবিক)। আমরা যদি সংকলিত তাদের (প্রচলিত) স্কোয়ার, আমরা একটি পেতে চাই । এই ধরণের সেট তৈরির উপায় রয়েছেVar(Oi)=Npi(1pi)zi=OiEiEi(1pi)ziχk2k1kχk12k1 পরিবর্তনশীল স্পষ্টতই, তবে ভাগ্যক্রমে একটি খুব ঝরঝরে শর্টকাট রয়েছে যা প্রচুর পরিমাণে পরিশ্রমের পরিমাণটিকে এড়িয়ে চলে এবং একই ফলাফল (পরিসংখ্যানের একই মান) দেয় যেন আমরা সমস্যায় পড়েছি।

সরলতার জন্য বিবেচনা করুন, দুটি বিভাগের (যা এখন দ্বিপদী) এর সাথে খাপ খায়। প্রথম কক্ষে থাকার সম্ভাবনা হ'ল , এবং দ্বিতীয় কক্ষে । আছে প্রথম কক্ষে পর্যবেক্ষণ, এবং দ্বিতীয় কক্ষে।p1=pp2=1pX=O1NX=O2

পরিদর্শন করা প্রথম কক্ষ গণনা, হ'ল সংক্ষিপ্তভাবে । আমরা যেমন প্রমিত করতে। তারপরে approximately প্রায় (asyptotically )।XN(Np,Np(1p))z=XNpNp(1p)z2=(XNp)2Np(1p)χ12χ12

লক্ষ্য করুন

i=12(OiEi)2Ei=[XNp]2Np+[(NX)(NNp)]2N(1p)=[XNp]2Np+[XNp]2N(1p)=(XNp)2[1Np+1N(1p)]

কিন্তু

1Np+1N(1p)=Np+N(1p)Np.N(1p)=1Np(1p)

সুতরাং যা আমরা শুরু করে দিয়েছিলাম - যা সংক্ষিপ্তভাবে এলোমেলো পরিবর্তনশীল হবে। দুটি কক্ষের মধ্যে নির্ভরতা হ'ল এর পরিবর্তে দ্বারা ডাইভিংয়ের মাধ্যমে আমরা দুজনের মধ্যে নির্ভরতার জন্য হুবহু ক্ষতিপূরণ করি এবং মূল বর্গক্ষেত্রে একটি আনুমানিক-সাধারণ-এলোমেলো পরিবর্তনশীল পাই।i=12(OiEi)2Ei=(XNp)2Np(1p)z2χ12EiEi(1pi)

যখন বেশি বিভাগ রয়েছে - একই ধরণের সমষ্টি নির্ভরতা একই পদ্ধতির দ্বারা দেখা হয় - পরিবর্তে সমস্ত পদে, আপনি ঠিক নির্ভরতার প্রভাবের জন্য ক্ষতিপূরণ দেন এবং স্বতন্ত্র নরমালসের যোগফলের সমতুল্য যোগফল পান ।(OiEi)2Ei(OiEi)2Ei(1pi)kk1

পরিসংখ্যানগুলির এমন একটি বিতরণ রয়েছে যা দেখানোর বিভিন্ন উপায় রয়েছে যে বৃহত্তর জন্য ((এটি কিছু স্নাতক পরিসংখ্যান কোর্সে আচ্ছাদিত, এবং স্নাতক-স্তরের কয়েকটি সংখ্যায় পাওয়া যায়), তবে আমি আপনাকে আপনার স্তরের স্তরের চেয়ে অনেক বেশি এগিয়ে নিয়ে যেতে চাই না। প্রকৃতপক্ষে ইন্টারনেটে নোটগুলি পাওয়া খুব সহজ, উদাহরণস্বরূপ এখানে প্রায় দুই পৃষ্ঠার ফাঁকে দুটি পৃথক উপকরণ রয়েছেχk12k


ধন্যবাদ, এটি উপলব্ধি করে। এটি কি গাণিতিক কাকতালীয় / দুর্ঘটনার কিছু যে এটি কেবল প্রত্যাশিত মান দ্বারা বিভাজন হয়ে এত সুন্দরভাবে কাজ করে? বা কেন এটি হওয়া উচিত তার কোনও স্বজ্ঞাত পরিসংখ্যানগত ব্যাখ্যা রয়েছে।
থোথ

বিভিন্ন ব্যাখ্যা যে বা স্বজ্ঞাত হতে পারে, যা ব্যক্তি থেকে ব্যক্তি থেকে পৃথক হতে উপর নির্ভর করে আছে। উদাহরণস্বরূপ, যদি পর্যবেক্ষণ করা গণনাগুলি মূলত স্বতন্ত্র পোয়েসন ভেরিয়েবলগুলি ছিল তবে এর বৈকল্পিকতা আপনাকে আসলে দ্বারা বিভক্ত করতে পরিচালিত করবে (এবং স্বাভাবিক)। আপনি যদি মোট (উপরের মত) শর্ত করে থাকেন তবে আপনি বহুজাতিক পাবেন in আপনি মোটের উপর কন্ডিশন রাখুন বা না করুন (যেমন আপনি এটি পোইসন বা বহুজাতিক হিসাবে বিবেচনা করুন), এমএল অনুমানক একই, এবং সুতরাং সেই অনুমানকারীটির বৈচিত্র একই - (সিটিডি)zEi
গ্লেন_বি -রেইনস্টেট মনিকা

(ctd) ... এর ফলে, আপনি দ্বারা বিভক্ত করা উচিত এবং ভ্যারিয়েন্স ঠিক ঠিক বের হয়ে আসা উচিৎ। [ যদিও আপনার এখনও কেবল ডিএফ রয়েছে Eik1
have

0

এক পৃষ্ঠার পাণ্ডুলিপি http://sites.stat.psu.edu/~dhunter/asymp/lectures/p175to184.pdf ব্যবহারকারী @Glen_b দ্বারা চরমভাবে শো উল্লেখ যে পরিসংখ্যাত হিসেবে পুনর্লিখিত করা যেতে পারে Hotelling সহভেদাংক পদে থেকে = (একা। 9.6 দেখুন)। এরপরে আমরা এস জে সেপানস্কি (1994) এর ক্লাসিকাল ফলাফলটি ডিগ্রি সহ চি-স্কোয়ার হিসাবে এর অ্যাসিম্পোটিক বিতরণ পেতে পেতে পারি ।T2k1k1

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.