'পুল ডেটা' বলতে আসলে কী বোঝায়?


16

আমি ভেবেছিলাম যে 'পুলিং ডেটা'র অর্থ কেবল এমন ডেটাগুলি একত্রিত করা যা পূর্বে বিভাগগুলিতে বিভক্ত ছিল ... মূলত, বিভাগগুলি উপেক্ষা করে ডেটাটিকে ডেটার একটি বিশাল' পুল 'সেট করে। আমার ধারণা, পরিসংখ্যান প্রয়োগের চেয়ে পরিভাষা সম্পর্কে এটি একটি প্রশ্ন।

উদাহরণস্বরূপ: আমি 2 টি সাইটের তুলনা করতে চাই এবং প্রতিটি সাইটের মধ্যে আমার কাছে দুটি বছরের ধরণের (ভাল এবং দরিদ্র) রয়েছে। যদি আমি 2 টি সাইটের 'সামগ্রিক' তুলনা করতে চাই (অর্থাত্, বছর-ধরণের উপেক্ষা করে), আমি কি প্রতিটি সাইটের মধ্যে ডেটা পুল করছি তা বলা কি সঠিক? তদুপরি, বেশ কয়েক বছরের ডেটা ভাল এবং দরিদ্র বছরের ধরণের সমন্বিত হওয়ার কারণে, প্রতিটি সাইটের মধ্যে 'ভাল বছর' এবং 'দুর্বল বছর' ডেটা সেট করার জন্য আমি বছরের পর বছর ডেটাগুলিকে পুলিং করছি তাও কি সঠিক? আপনার সাহায্যের জন্য ধন্যবাদ! MOG

উত্তর:


13

হ্যাঁ, আপনার উদাহরণগুলি সঠিক।

অক্সফোর্ড ইংরাজি অভিধান সংজ্ঞায়িত পুকুর হিসাবে:

পুল, v।

(Pul)

1.1 ট্রান্স চুক্তি অনুসারে বিতরণ করার জন্য একটি সাধারণ স্টক বা তহবিলের মধ্যে ফেলে দেওয়া; সাধারণ সুবিধার জন্য সংযুক্ত (মূলধন বা স্বার্থ); বৈশিষ্ট। প্রতিযোগী রেলওয়ে সংস্থাগুলি ইত্যাদির ভাগ: ভাগ বা ভাগ করা (ট্র্যাফিক বা প্রাপ্তি)।

আর একটি উদাহরণ হ'ল:

আপনি পুরুষ এবং স্ত্রীদের মধ্যে এক্স পদার্থের রক্তের মাত্রা পরিমাপ করেন। আপনি দুটি গ্রুপের মধ্যে পরিসংখ্যানগত পার্থক্য দেখতে পাচ্ছেন না তাই আপনি পরীক্ষামূলক বিষয়ের লিঙ্গ উপেক্ষা করে ডেটা একসাথে পোল করেন।

এটি করা পরিসংখ্যানগতভাবে সঠিক কিনা তা নির্দিষ্ট ক্ষেত্রে নির্ভর করে।


12

পুলিং ডেটা সংমিশ্রণের বিষয়ে উল্লেখ করতে পারে তবে এটি কাঁচা তথ্যের চেয়ে তথ্যের সংমিশ্রণের বিষয়েও উল্লেখ করতে পারে। পুলিংয়ের সর্বাধিক সাধারণ ব্যবহারগুলির মধ্যে একটি হ'ল বৈচিত্র্য অনুমান করা। যদি আমরা বিশ্বাস করি যে 2 জনসংখ্যার একই বৈকল্পিক রয়েছে, তবে সম্ভবত একইরকমভাবে নয়, তবে আমরা 2 টি গ্রুপের নমুনাগুলি থেকে বৈকল্পিকের 2 অনুমান গণনা করতে পারি, তারপরে একটি মাত্র অনুমান পেতে তাদের পুল করুন (একটি ওজনযুক্ত গড় নিন) সাধারণ বৈকল্পিকতা। আমরা সম্মিলিত ডেটা থেকে ভিন্নতার একক অনুমান গণনা করি না কারণ যদি উপায়গুলি সমান না হয় তবে এটি বৈকল্পিক অনুমানকে স্ফীত করে দেবে।


ধন্যবাদ @ গ্রেগ। স্পষ্ট করার জন্য (যেহেতু আমি সাহিত্য থেকেও বৈচিত্রগুলি একত্রিত করার চেষ্টা করছি), আপনি যা বলছেন তা হ'ল একাধিক জনগোষ্ঠীর জন্য একটি 'গড়' বৈকল্পিক পেতে, আমি গণনা বৈকল্পিকের একটি ভারিত গড় নিতে পারি? আমি কীভাবে এই রূপগুলি ওজন করব? প্রতিটি জনসংখ্যা = 1 নয়?
মোগ

যদি নমুনার আকারগুলি সমান হয়, তবে সাধারণ গড় কাজ করে। সাধারণত আমরা প্রতিটি ডাটা পয়েন্টকে সমান ওজন দিয়ে থাকি, আদর্শ সূত্রটি হ'ল স্বাধীনতার ডিগ্রি দ্বারা প্রতিটি বৈকল্পিককে (বা গোষ্ঠীর চেয়ে এনও 1 এর জন্য সংখ্যাটি সংখ্যা), তারপরে সমস্ত টুকরা যোগ করে, তার পরে যোগফলের যোগফলকে ভাগ করে স্বাধীনতার ডিগ্রি (সমস্ত এন_আই -1)।
গ্রেগ স্নো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.