ফিট-টেস্টের চি-বর্গক্ষেত্রের উপর ডেটা-ভিত্তিক বিন সীমানার প্রভাব?


18

এই ধরণের পরিস্থিতিতে চি-স্কোয়ারের নিম্ন ক্ষমতার স্পষ্ট সমস্যাটি বাদ দিয়ে, ডেটা বিন্যাস করে, অনির্দিষ্ট পরামিতিগুলির সাথে কিছু ঘনত্বের জন্য চি-বর্গক্ষেত্রের পরীক্ষা করার কল্পনা করুন।

সংক্ষিপ্ততার জন্য, আসুন অজানা গড়ের সাথে একটি ক্ষতিকারক বিতরণ এবং 100 বলার একটি নমুনা আকার বলে।

বিন প্রতি প্রত্যাশিত পর্যবেক্ষণের একটি যুক্তিসঙ্গত সংখ্যার জন্য কিছু অ্যাকাউন্ট নেওয়ার প্রয়োজন হবে (উদাহরণস্বরূপ যদি আমরা গড়ের নীচে 6 টি এবং তার উপরে 4 টি বিটি স্থাপন করা বেছে নিয়েছি তবে এটি ডেটা ভিত্তিক বিন সীমানা ব্যবহার করবে) ।

কিন্তু ডেটা দেখার উপর ভিত্তি করে বিনের এই ব্যবহারটি নালীর নীচে পরীক্ষার পরিসংখ্যান বিতরণকে সম্ভবত প্রভাবিত করবে।

আমি এই ব্যপারে প্রচুর আলোচনা দেখেছি যে - যদি প্যারামিটারগুলি বিন্যাসিত ডেটা থেকে সর্বাধিক সম্ভাবনার দ্বারা অনুমান করা হয় - আপনি আনুমানিক প্যারামিটারের তুলনায় 1 ডিএফ হারাবেন (ফিশার বনাম কার্ল পিয়ারসনের ডানদিকের একটি সমস্যা) - তবে আমি মনে করি না উপাত্তের উপর ভিত্তি করে বিন সীমানা সন্ধানের বিষয়ে কিছু পড়া। (যদি আপনি আনবিডবিহীন ডেটা থেকে তাদের অনুমান করেন, তবে পরীক্ষার পরিসংখ্যানগুলির বিতরণ বিনের সাহায্যে কোথাও একটি এবং একটি ))χ2χ-পি2

বিনের এই ডেটা-ভিত্তিক পছন্দটি কী তাত্পর্যপূর্ণ স্তর বা শক্তিকে প্রভাবিত করে? অন্যদের চেয়ে বেশি কিছু বিষয় রয়েছে কি? যদি খুব বেশি প্রভাব থাকে তবে এটি কি এমন কিছু যা বড় নমুনায় চলে যায়?

যদি এর কোনও তাত্পর্যপূর্ণ প্রভাব থাকে তবে এটি চ-স্কোয়ার পরীক্ষার ব্যবহার বলে মনে হয় যখন প্যারামিটারগুলি অজানা প্রায় অনেক ক্ষেত্রেই অকেজো হয় (তবুও বেশ কয়েকটি পাঠ্যপুস্তকে উকিল হওয়া সত্ত্বেও) যদি না আপনি ভাল হন -প্যারামিটারের প্রাক্কলন অনুমান।

ইস্যুগুলি বা রেফারেন্সগুলিতে পয়েন্টারগুলির আলোচনা (সাধারণত তাদের উপসংহারের উল্লেখ সহ) দরকারী হবে।


সম্পাদনা করুন, মূল প্রশ্নটির চেয়ে অনেক বেশি একদিকে:

এটি আমার কাছে ঘটে যায় যে ক্ষতিকারক * এর নির্দিষ্ট ক্ষেত্রে (এবং ইউনিফর্মটি এটি ভাবতে আসে) এর সম্ভাব্য সমাধান রয়েছে, তবে আমি এখনও বিন সীমানা বেছে নেওয়ার প্রভাবটির আরও সাধারণ বিষয়ে আগ্রহী।

* উদাহরণস্বরূপ, ঘনিষ্ঠর জন্য, কেউ বিন্দুটি কোথায় রাখবেন (যেহেতু ক্ষুদ্রতম পর্যবেক্ষণটি গড় ) সম্পর্কে খুব রুক্ষ ধারণা পাওয়ার জন্য ক্ষুদ্রতম পর্যবেক্ষণটি (এটি সমান বলে ) ব্যবহার করতে পারে এবং তারপরে জন্য অবশিষ্ট পার্থক্য ( ) পরীক্ষা করুন। অবশ্যই এটি এর খুব দুর্বল অনুমান করতে পারে এবং তাই দুর্বল বিন পছন্দগুলি, যদিও আমি মনে করি যে কেউ যুক্তিটি পুনরাবৃত্তভাবে ব্যবহার করতে পারে যার থেকে সর্বনিম্ন দুটি বা তিনটি পর্যবেক্ষণ নিতে হবে যার থেকে যুক্তিসঙ্গত বিন্যাসগুলি বেছে নিতে এবং তারপরে পার্থক্যগুলি পরীক্ষা করতে পারে ক্ষুদ্রতর ক্ষুদ্রতর অর্ডার পরিসংখ্যানগুলির মধ্যে বৃহত্তমটির উপরের অবশিষ্ট পর্যবেক্ষণগুলিμ / এন এন - 1 এক্স আই - এম μমিμ/এনএন-1এক্সআমি-মিμ


1
আকর্ষণীয় প্রশ্ন। আমি উত্তরটি জানি না, তবে স্বাধীনতার কিছু ডিগ্রি হারাতে হবে এই ধারণাটি বোধগম্য। যদি আপনি এটি ইতিমধ্যে না দেখে থাকেন তবে @ শুভর এই উত্তরটি ভাবনা-উদ্দীপক হওয়া উচিত: কীভাবে বুঝতে হবে-ডিগ্রি-অফ-স্বাধীনতা । আমার কাছে মনে হয় কিছু সিমুলেশন অধ্যয়ন আপনাকে কমপক্ষে কিছু নির্দিষ্ট ক্ষেত্রে এখানে একটি টোহোল্ড পেতে সক্ষম করে।
গুং - মনিকা পুনরায়

1
এটি কতটা সহায়ক তা নিশ্চিত নয়, তবে দৃust় অনুমানের ক্ষেত্রেও একই রকম সমস্যা রয়েছে। বিশেষত, শক্তিশালী অনুমানের একটি পদ্ধতিতে (যেমন: ছাঁটাইযুক্ত গড়) প্রায়শই একটি প্যারামিটারাইজড ইনপুট (যেমন প্যারামিটারটি কতটা ছাঁটাতে হবে তা নির্ধারণ করে) প্রয়োজন। এই পরামিতিটি একটি ডেটা-চালিত পদ্ধতি দ্বারা চয়ন করা যেতে পারে (যেমন ট্রিমিং প্যারামিটারটি বেছে নেওয়ার আগে লেজগুলি কতটা চর্বিযুক্ত তা দেখুন)। তবে ট্রিমিং প্যারামিটারের প্রাক-নির্বাচন করা ছাঁটাই গড়ের বিতরণকে প্রভাবিত করে, বনাম, বলুন, একটি নির্দিষ্ট প্যারামিটার নিয়ম। সাহিত্যে এর সাথে যেভাবে আচরণ করা হয় তা বুটস্ট্র্যাপের মাধ্যমে।
কলিন টি বোয়র্স

@ কলিনটিবার্স - সম্ভবত কিছুটা সহায়ক, ধন্যবাদ বুটস্ট্র্যাপিংয়ের সম্ভাবনা সম্পর্কে ভাবেননি।
গ্লেন_বি -রিনস্টেট মনিকা

1
সমস্যাটিকে একটি সাধারণ ক্ষেত্রে বিভক্ত করা আকর্ষণীয় হতে পারে। আপনার পছন্দসই বিতরণ থেকে মাত্র 5 টি পর্যবেক্ষণের মতো কিছু কল্পনা করুন এবং ডেটাতে একটি মাত্র বিভাজক রাখুন মাত্র দুটি বিন ins
zkurtz

উত্তর:


15

চি-স্কোয়ার ধার্মিকতা-ফিট-পরীক্ষার প্রাথমিক ফলাফলগুলি শ্রেণিবদ্ধভাবে বোঝা যায়

শ্রেনী 0 । স্থির সম্ভাব্যতা ভেক্টর বিরুদ্ধে বহু বহুদিনের নমুনা পরীক্ষা করার জন্য ক্লাসিকাল পিয়ারসনের চি-স্কোয়ার পরীক্ষার পরিসংখ্যান হ'ল এক্স 2 ( পি ) = কে i = 1 ( এক্স ( এন ) i - n পি i ) 2পি যেখানে এক্স ( এন ) আমি ফলাফল সংখ্যা উল্লেখ করে আমি তম ঘরের আকার একটি নমুনা থেকে বের এন । এটিকে ভেক্টর Y n = ( Y ( n ) 1 , , Y ( n ) কে ) এর বর্গক্ষেত্রের আদর্শ হিসাবে কার্যকরভাবে দেখা যেতে পারেযেখানে Y ( n ) i = ( X ( n ) i - n p i ) /

X2(p)=i=1k(Xi(n)npi)2npidχk12,
Xi(n)inYn=(Y1(n),,Yk(n)) যা বহুভিত্তিক কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি Y N d Nহিসাবে বিতরণে রূপান্তর করে (0,I-Yi(n)=(Xi(n)npi)/npi এ থেকে আমরা দেখতে পাচ্ছি যে এক্স 2 = Y n 2χ 2 কে - 1 আমি - since থেকে
YndN(0,IppT).
X2=Yn2χk12পদে idempotent হয়-1IppTk1

স্তর 1 । শ্রেণিবিন্যাসের পরবর্তী স্তরে, আমরা বহু-জাতীয় নমুনাগুলি সহ যৌগিক অনুমানগুলি বিবেচনা করি। যেহেতু আগ্রহের সঠিক নাল অনুমানের অধীনে অজানা, তাই আমাদের এটি অনুমান করতে হবে। যদি নাল অনুমানটি যৌগিক হয় এবং মাত্রা মিটারের লিনিয়ার উপ-স্থান নিয়ে গঠিত হয় , তবে পি i এর সর্বাধিক সম্ভাবনা অনুমান (বা অন্যান্য দক্ষ অনুমানকারী) "প্লাগ-ইন" ​​অনুমানকারী হিসাবে ব্যবহার করা যেতে পারে। তারপর, পরিসংখ্যাত এক্স 2 1 = Σ আমি = 1 ( এক্স ( এন ) আমি - এন পি আমি ) 2পিমিপিআমি নাল হাইপোথিসিস অধীনে।

এক্স12=Σআমি=1(এক্সআমি(এন)-এনপি^আমি)2এনপি^আমিχ-মি-12,

স্তর 2 । একটি প্যারাম্যাট্রিক মডেলের ফিট টেস্টিংয়ের সদ্ব্যবহারের বিষয়টি বিবেচনা করুন যেখানে কোষগুলি স্থির করা হয় এবং আগে থেকেই পরিচিত ছিল: উদাহরণস্বরূপ, আমাদের কাছে হারের সাথে একটি ঘনিষ্ঠ বিতরণ থেকে একটি নমুনা পাওয়া যায় এবং এর থেকে আমরা কে সেলগুলিতে বিন্যস্ত করে একটি বহুজাতিক নমুনা তৈরি করি, তারপরে উপরের ফলাফলটি এখনও নিশ্চিত করে যে আমরা কেবলমাত্র পর্যবেক্ষিত ফ্রিকোয়েন্সি ব্যবহার করে বিন সম্ভাবনার দক্ষ অনুমানগুলি (যেমন, এমএলই) ব্যবহার করিλ

মিমি=1

এক্স22=Σআমি=1(এক্সআমি(এন)-এনপি^আমি)2এনপি^আমিχ-মি-12,
পি^আমি

জেড1,...,জেডএন~এফλλχ-মি-12χ-12

ওয়াইএনএন(0,আমি-পিλপিλটি-একজন(λ))

λএকজন(λ)

ওয়াইএনবি(λ^)

ওয়াইএনটিবিটিবিওয়াইএনχ-12,

উদাহরণগুলি হ'ল রাও – রবসন – নিকুলিন পরিসংখ্যান এবং জাজাপারিডজে – নিকুলিন পরিসংখ্যান

1/আমি^=μ^+ +σ^আমি0,আমি0,=[এফ-1((-1)/),এফ-1(/))

তথ্যসূত্র

  1. এ ডব্লু। ভ্যান ডার ভার্ট (1998), অ্যাসিম্পটোটিক স্ট্যাটিস্টিকস , কেমব্রিজ ইউনিভার্সিটি প্রেস। অধ্যায় 17 : চি-স্কোয়ার টেস্ট

  2. χ2

  3. এফসি Drost (1989), অবস্থান-স্কেল মডেলের জন্য চি-বর্গক্ষেত্র ধার্মিকতা অফ হইয়া পরীক্ষার সাধারণভাবে ক্লাস সংখ্যা অনন্ত থাকে যখন , অ্যান। স্ট্যাট , ভোল। 17, না। 3, 1285–1300।

  4. এমএস নিকুলিন, এমএস (1973), শিফ্ট এবং স্কেল পরামিতিগুলির সাথে অবিচ্ছিন্ন বিতরণের জন্য চি-বর্গ পরীক্ষা , সম্ভাবনার তত্ত্ব এবং এর প্রয়োগ , খণ্ড। 19, না। 3, 559–568।

  5. কেও জাজারিডজে এবং এমএস নিকুলিন (১৯ 197৩), পিয়ারসনের স্ট্যান্ডার্ড পরিসংখ্যানের একটি সংশোধন বিষয়ে , থিওরি অফ প্রোবিলিটি এবং এর প্রয়োগ , খণ্ড। 19, না। 4, 851–853।

  6. কেসি রাও এবং ডিএস রবসন (1974), তাত্পর্যপূর্ণ পরিবার , কম-এর মধ্যে ফিট টেস্টের সদ্ব্যবহারের জন্য একটি চি-বর্গ পরিসংখ্যান পরিসংখ্যানবিৎ। , খণ্ড 3., না। 12, 1139–1153।

  7. এন। বালাকৃষ্ণান, ভি। ভেনভ এবং এমএস নিকুলিন (২০১৩), অ্যাপ্লিকেশন সহ একাডেমিক প্রেসের সাথে ফিট টেস্টের চি-স্কোয়ারড গুডনেস


5

আমি নীচে আমার প্রশ্নের অন্তত আংশিক উত্তর পেয়েছি। (আমি এখনও কাউকে সেই বোনাস দিতে চাই, তাই আরও যে কোনও তথ্য প্রশংসিত হয়))

χ-পি-12পি χ12পিχ-পি2χ2পি

তথ্যসূত্র

মুর ডিএস (১৯ )১), এ-চি-স্কয়ার স্ট্যাটিস্টিকস উইথ র্যান্ডম সেল সীমানা , আন। ম্যাথ। তাত্ক্ষণিকবাজার। , ভোল 42, নং 1, 147–156।

χ2

χ2

χ2

ওয়াটসন, জিএস (1959), এর কয়েকটি সাম্প্রতিক ফলাফলχ2মঙ্গলজনক -পরীক্ষা-নিরীক্ষা , বায়োমেট্রিক্স , 15 , 440-468

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.