কীভাবে কার্ল পিয়ারসন চি-স্কোয়ার পরিসংখ্যান নিয়ে এসেছেন?


14

পিয়ারসন কীভাবে নীচের পিয়ারসন চি-স্কোয়ার পরিসংখ্যান নিয়ে 1900 সালে এসেছিলেন?

যে Kχ2

K=(OijEij)2Eij
Kχ2

তিনি কি মনে মনে চি-স্কোয়ার রেখেছিলেন এবং মেট্রিক (নীচে-আপ পদ্ধতির) তৈরি করেছিলেন, নাকি তিনি পরিসংখ্যানটি তৈরি করেছিলেন এবং পরে প্রমাণ করেছেন যে এটি চি-স্কোয়ার বিতরণ (শীর্ষ-ডাউন) অনুসরণ করে?K

আমি জানতে চাই কেন তিনি যেমন বেছে নেওয়া হয়েছে নির্দিষ্ট ফর্ম এবং অন্যদের চান বা Σ | আই জে - আই | , এবং কেন সে কেনো বর্গকে বিভাজকের সাথে ভাগ করে নিল।(OijEij)2|OijEij|



1
অবশ্যই আপনি ব্যবহার করতে পারেন এমন অনেকগুলি পরিসংখ্যান পাওয়া সম্ভব। আপনার বিকল্পগুলি পুরোপুরি সূক্ষ্ম, যদিও আপনাকে তাদের জন্য নমুনা বিতরণের কাজ করতে হবে, যা কোষের সংখ্যার ভিত্তিতে পৃথক হবে। এই ফর্মটি সম্পর্কে সুবিধাজনক একটি জিনিস হ'ল এটির অন্যান্য বিতরণের সাথে কিছু নির্দিষ্ট সম্পর্ক রয়েছে, যেমন এটি কে স্কোয়ার্ড স্ট্যান্ডার্ড স্বাভাবিক এলোমেলো পরিবর্তনের যোগফল।
গুং - মনিকা পুনরায়

উত্তর:


23

পিয়ারসনের 1900 এর কাগজটি কপিরাইটের বাইরে নয়, তাই আমরা এটি অনলাইনে পড়তে পারি ।

আপনার এই প্রবন্ধটি শুরু করে দেখা উচিত যে স্বাধীনতা বা একজাতীয়তার পরীক্ষা নয়, এই কাগজটি ফিটের পরীক্ষার মঙ্গল সম্পর্কে।

তিনি মাল্টিভারিয়েট স্বাভাবিকের সাথে কাজ করে এগিয়ে যান এবং চি-স্কোয়ারটি স্কোয়ার স্ট্যান্ডার্ডাইজড স্বাভাবিক পরিবর্তনের যোগফল হিসাবে উত্থিত হয়।

আপনি p160-161-এর আলোচনার মাধ্যমে দেখতে পাচ্ছেন যে তিনি বহুজাতিক বিতরণকৃত ডেটাতে পরীক্ষা প্রয়োগের বিষয়ে স্পষ্টভাবে আলোচনা করছেন (আমি মনে করি না যে তিনি এই শব্দটি কোথাও ব্যবহার করেছেন)। তিনি বাহ্যিকভাবে বহুবর্ষের আনুমানিক বহুবিধ স্বাভাবিকতা বুঝতে পেরেছেন (অবশ্যই তিনি জানেন যে মার্জিনগুলি প্রায় স্বাভাবিক - এটি একটি খুব পুরানো ফলাফল - এবং কারণগুলি, কাগজগুলিতে বর্ণিত হওয়ার কারণে, উপায়গুলি এবং সমবায়িকতাগুলি জানেন); আমার অনুমান যে 1900 সালের মধ্যে ইতিমধ্যে বেশিরভাগ স্টাফ পুরাতন টুপি (

তারপরে পি 163৩ এর নীচে তিনি একটি চি-বর্গাকার পরিসংখ্যানটি "ফিটের উপকারের মাপকাঠি" হিসাবে আবিষ্কার করেন (পরিসংখ্যানটি নিজেই বহুবিচিত্র সাধারণ অনুমানের সূচক হিসাবে প্রদর্শিত হয়)।

এরপর তিনি এর কিভাবে P-মান * নির্ণয় করা নিয়ে আলোচনা করার জন্য, এবং তারপর তিনি সঠিকভাবে একটি উপরের লেজ এলাকায় দেয় 43.87 0.000016 যেমন তার পরেও। [তবে আপনার মনে রাখা উচিত যে সে পর্যায়ে প্যারামিটার অনুমানের জন্য স্বাধীনতার ডিগ্রিগুলি কীভাবে সমন্বয় করা যায় সে সঠিকভাবে বুঝতে পারেননি, তাই তাঁর কাগজপত্রের কয়েকটি উদাহরণ খুব বেশি ডিএফ ব্যবহার করে]χ122

* (উল্লেখ্য যে ফিশারিয়ান বা নেইমন-পিয়ারসন পরীক্ষার দৃষ্টান্ত দুটিই বিদ্যমান নেই, তবুও আমরা স্পষ্টভাবে দেখতে পাচ্ছি যে তিনি ইতিমধ্যে পি-ভ্যালু ধারণাটি প্রয়োগ করেছেন।)

আপনি লক্ষ করবেন যে তিনি স্পষ্টভাবে মতো পদগুলি লিখেন না । পরিবর্তে, তিনি প্রত্যাশিত গণনা এবং পর্যবেক্ষণ পরিমাণের জন্য তিনি মি 1 ব্যবহার করেন এবং এর জন্য আরও লিখেন মি 1 , মি 2 ইত্যাদি । তারপরে তিনি e = m - m (নীচের অর্ধেক p160) এবং প্রতিটি ঘরের জন্য e 2 / m গণনা করুন (eq। (Xv) p163 এবং p167 এর নীচে টেবিলের শেষ কলামটি দেখুন ... সমমানের পরিমাণ, কিন্তু বিভিন্ন স্বরলিপি।(OiEi)2/Eim1m2m1e=mme2/m

চি-স্কোয়ার পরীক্ষাটি বোঝার বর্তমান পদ্ধতির বেশিরভাগটি এখনও কার্যকর হয়নি তবে অন্যদিকে, বেশ কিছুটা ইতিমধ্যে রয়েছে (কমপক্ষে যদি আপনি কী সন্ধান করতে চান তবে)। 1920 এর দশকে (এবং পরবর্তীকালে) অনেক কিছু ঘটেছে যা এই বিষয়গুলির দিকে আমাদের দৃষ্টিভঙ্গি বদলেছে।


কেন আমরা দ্বারা বিভক্ত করা হিসাবে MULTINOMIAL ক্ষেত্রে, এটা যে যদিও একটি MULTINOMIAL মধ্যে পৃথক উপাদান ভ্যারিয়েন্স চেয়ে ছোট হয় আমি , আমরা যখন covariances হিসাব, এটা ঠিক দ্বারা বিভাজক সমতুল্য আমি , তৈরীর একটি সহজ সরলকরণ জন্য।EiEiEi


সম্পাদনায় যুক্ত হয়েছে:

প্ল্যাককেটের 1983 সালের কাগজটি historicalতিহাসিক প্রেক্ষাপটের একটি ভাল চুক্তি এবং কাগজের জন্য গাইডের কিছু দেয়। আমি এটি এক নজরে নেওয়ার সুপারিশ। দেখে মনে হচ্ছে এটি জেস্টোরের মাধ্যমে অনলাইনে নিখরচায় (যদি আপনি সাইন ইন করেন), সুতরাং এটি পড়ার জন্য আপনার এমনকি কোনও প্রতিষ্ঠানের মাধ্যমে অ্যাক্সেসের প্রয়োজন হবে না।

প্ল্যাককেট, আরএল (1983),
"কার্ল পিয়ারসন এবং চি-স্কোয়ার্ড টেস্ট,"
আন্তর্জাতিক পরিসংখ্যান পর্যালোচনা ,
খণ্ড। 51, নং 1 (এপ্রিল), পিপি 59-72


1
আমি এই পোস্টটি কেবল পুনরায় পড়েছি এবং আমি যতবার করি, আমি একটি অতিরিক্ত অন্তর্দৃষ্টি পাই। @ গ্লেেন_বি আমি আপনার দুর্দান্ত উত্তরটির জন্য আপনাকে ধন্যবাদ জানাতে চাই, যা আমার আগে করা উচিত ছিল। যদি আমি অতিরিক্ত প্রশ্ন জিজ্ঞাসা করতে পারি, E দ্বারা বিভাজনকে কীভাবে সমব্যবহারের জন্য সামঞ্জস্য করা হয়েছে সে সম্পর্কে আপনার ব্যাখ্যাতে, আপনি কি সেই বিষয়ে আরও বিশদ বর্ণনা করতে পারেন বা আমাকে এই বিষয়টির সাথে আলোচনা করা সংস্থানটির দিকে নির্দেশ করতে পারেন? "সাধারণীকরণ" কেন প্রয়োজনীয় তা আমি স্বজ্ঞাতভাবে বুঝতে পারি, তবে আমি গাণিতিক প্রমাণের সাথে আমার স্বজ্ঞাতাকে ফিরে পেতে চাই।
অ্যালবাই

1
Ei

1
XiCov(Xi,Xj)=E(XiXj)E(Xi)E(Xj)=E(Xi)E(Xj)Xi,Xj>0Cov(Oi,Oj)

লিঙ্কের জন্য আপনাকে ধন্যবাদ গ্লে_বি। পোস্ট পড়ার পরে, এখন এটি আরও পরিষ্কার! আমি নির্লজ্জভাবে ভাবছিলাম যে ডিনোমিনেটর প্রতিটি কক্ষের জন্য প্রাথমিক পার্থক্যগুলির জন্য সামঞ্জস্য করতে পারে, সুতরাং এই শব্দটি "নরমালাইজিং" হয় তবে আপনার পোস্টটি পড়ে আমি বুঝতে পেরেছিলাম যে আমি পুরোপুরি দাগ ছাড়ছি।
অ্যালবাই

দুর্ভাগ্যক্রমে, 'নরমালাইজ' শব্দটির পরিসংখ্যানের ক্ষেত্রে কমপক্ষে তিনটি পৃথক সংবেদন রয়েছে। অযত্নবিহীন, আমি সাধারণত এটি ব্যবহার করতে চাই "মানটিকে 0 বলে প্রমাণ করতে হবে এবং আদর্শ বিচ্যুতি 1" তবে অন্যান্য লোকেরা কিছু নিয়ম অনুসারে ভেক্টরকে সাধারণকরণের অর্থে, এমনকি আনুমানিক স্বাভাবিকতায় রূপান্তরিত করতে এটি ব্যবহার করে। যেহেতু এটি এখানে এমন বাগবার, তাই এটি এড়াতে আমার এখন অবধি জানা উচিত।
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.