প্রতিস্থাপন ছাড়াই কে সংখ্যাগুলির যোগফলের প্রত্যাশা


9

প্রদত্ত এনসংখ্যা, যেখানে প্রতিটি সংখ্যার মান পৃথক, হিসাবে চিহ্নিত করা হয় এবং প্রতিটি সংখ্যা নির্বাচনের সম্ভাবনা যথাক্রমে হয়।বনাম1,বনাম2,,বনামএনপি1,পি2,,পিএন

এখন যদি আমি প্রদত্ত সম্ভাবনার উপর ভিত্তি করে নম্বর নির্বাচন করি , যেখানে , সেই সংখ্যার যোগফলের প্রত্যাশা কী ? নোট করুন যে নির্বাচনটি প্রতিস্থাপন ছাড়াই রয়েছে, যাতে সংখ্যাগুলি সদৃশ সংখ্যাগুলিকে জড়িত করতে না পারে। আমি বুঝেছি যে নির্বাচনটি প্রতিস্থাপনের সাথে থাকলে, সংখ্যার যোগফলের প্রত্যাশা সমান হয় , যেখানেকেকেএনকেকেকেকে×(ভী)

(ভী)=বনাম1×পি1+ +বনাম2×পি2+ ++ +বনামএন×পিএন

তদুপরি, এই সংখ্যার বৈচিত্রের প্রত্যাশা সম্পর্কে কী বলা যায় ?কে

আমি একজন সিএস পিএইচডি শিক্ষার্থী যিনি একটি বড় ডেটা সমস্যা নিয়ে কাজ করছেন এবং আমার কোনও পরিসংখ্যানের পটভূমি নেই। আমি আশা করি যে কেউ আমাকে উত্তর হিসাবে একটি সূত্র দিতে পারেন। তবে, যদি কোনও সূত্র বা নিবিড় গণনা জবাব জবাব দেওয়া খুব জটিল হয়, একটি আনুমানিক উত্তর সম্পূর্ণ গ্রহণযোগ্য।

আপনি ধরে নিতে পারেন এখানে বেশ বড়, এবং সম্ভাবনা অনেক পৃথক হতে পারে। অনুশীলনে, এই সম্ভাবনার মানগুলি একটি কোয়েরি লগ থেকে আসে, যা একত্রিতকরণ অনুসন্ধানগুলির একটি সিরিজ রেকর্ড করে। মুল বক্তব্যটি হল যে প্রশ্নের সাথে জড়িত প্রতিটি সংখ্যার ফ্রিকোয়েন্সি বেশ স্কিউ হতে পারে, যার মধ্যে কিছু খুব কমই অনুসন্ধান করা হয়, আবার কিছু খুব ঘন ঘন জিজ্ঞাসা করা হয়। আপনি ধরে নিতে পারেন সম্ভাবনা বন্টন হ'ল সাধারণ বিতরণ, জিপফ বিতরণ বা অন্য কোনও যুক্তিসঙ্গত বিকল্প।এন

মান বিতরণ কোনও সম্ভাব্য বিতরণের কেবল একটি সংক্ষিপ্ত উপসেট। অন্য কথায়, যদি আপনার কাছে হিস্টোগ্রাম থাকে যা একটি নির্দিষ্ট বন্টনকে উপস্থাপন করে তবে এই সমস্যার সাথে জড়িত সমস্ত সংখ্যা হ'ল একক বালতিতে থাকা সমস্ত সংখ্যা।

কে এর মান বিবেচনায় আপনি ধরে নিতে পারেন এটি প্রায়শই জিজ্ঞাসিত উপাদানগুলির সংখ্যার তুলনায় কম।


3
যোগফলের পরিবর্তে যোগফলের ভিন্নতার প্রত্যাশা আলাদা হবে; কোনও প্রতিস্থাপন না থাকলে আপনার সীমাবদ্ধ জনসংখ্যা সংশোধন ফ্যাক্টর প্রয়োজন। (স্বজ্ঞাতভাবে এটি দেখতে, মনে রাখবেন যে কে = এন এর যোগফলের পরিমাণটি শূন্য হয়, কারণ এটি সর্বদা একই সংখ্যায় থাকবে; সুতরাং কে আরও এগিয়ে যাওয়ার সাথে যোগফলের
প্রকরণটি

1
এই প্রশ্নটি দেখতে দেখতে দেখতে আরও জটিল হতে পারে। কেস বিবেচনা করুনএন=2 এবং (বনাম1,বনাম2)=(0,1)। প্রতিস্থাপনের সাথে আঁকা দুটি মানের প্রত্যাশিত যোগফল2পি2যা অবশ্যই একমূল্যের প্রত্যাশার সমষ্টি; তবে প্রতিস্থাপন ছাড়াই অঙ্কিত দুটি মানের প্রত্যাশিত যোগটি অবশ্যইবনাম1+ +বনাম2=12পি2 বাদে কখন পি1=পি2=1/2
whuber

1
@Zbcyclist সম্ভবত আমি সমস্যাটি স্পষ্ট করে বলিনি। আমার
দৃশ্যে

1
(1) এটি আমার কাছে একটি স্ব-অধ্যয়ন প্রশ্নের মতো মনে হচ্ছে না: এটি সম্ভাবনার ক্ষেত্রে সত্যিকারের প্রয়োগ সমস্যা মনে হচ্ছে। (2) কত বড় শক্তিএনথাকা? সমস্ত সাবসেটগুলি গণনা করা যায় তবে ব্যতীত সলিউশনগুলি অবিচলিত দেখায়। (3) যদিএন এর চেয়ে অনেক বড় হতে পারে 20 বা তাই, দ্রুত গণনা বন্ধ করে, আপনি এই সম্পর্কে কী বলতে পারেন পিআমি? উদাহরণস্বরূপ, এগুলি পৃথক হতে পারে বা এগুলি সমস্তই খুব কাছাকাছি থাকবে1/এন? এটি আনুমানিক উত্তরগুলি সন্ধানের প্রচেষ্টা সম্পর্কে অবহিত করতে পারে।
whuber

1
সম্পাদনা করার জন্য ধন্যবাদ। আপনি আরও আমাদের সম্পর্কে বলতে পারেনএন, কে, দ্য বনামআমি, এবং পিআমি, আরও ভাল। উদাহরণস্বরূপ, যদিকেসর্বোচ্চ(পিআমি)«1তারপরে প্রতিস্থাপনের সাথে নমুনা নেওয়ার সূত্রগুলি ভাল আনুমানিক হওয়া উচিত (কারণ খুব কম মান, যদি কোনও হয় তবে একাধিকবার নির্বাচিত হবে)। আমি বিশ্বাস করি সবচেয়ে শক্তিশালী মামলাগুলি যেখানে মানগুলির বিস্তৃত সীমা রয়েছেপিআমি- সুতরাং আপনি কেবল তাদের বেশিরভাগকে জিরো এবং এখনও সাথে প্রতিস্থাপন করতে পারবেন না পিআমি>1/কে একটি প্রশংসনীয় সংখ্যার জন্য আমি--এবং কেএন/2
whuber

উত্তর:


2

এটি সম্ভবত একটি উত্তরের প্রকৃতিতে রয়েছে যা সঠিক হলেও এটি সম্ভবত তেমন কার্যকর নয়। হরভিটস এবং থম্পসন (1952) ফলাফল প্রদান করে যা সাধারণভাবে এই পরিস্থিতিটি আবৃত করে। এই ফলাফলগুলি যে আশা করতে পারে সম্মিলিত এক্সপ্রেশনগুলির ক্ষেত্রে দেওয়া হয় given

তাদের স্বরলিখনের সাথে সামঞ্জস্য রাখতে এবং আরও বহুল ব্যবহৃত ব্যবহৃত স্বরলিপিটির সাথে আরও ভালভাবে মিলিয়ে দেওয়ার জন্য, আমাকে কিছু পরিমাণের সংজ্ঞা দিন। দিনএন জনসংখ্যার উপাদানগুলির সংখ্যা এবং এন নমুনা আকার হতে।

দিন তোমার দর্শন লগ করাআমি, আমি=1,,এন, প্রতিনিধিত্ব করুন এন প্রদত্ত মান সহ জনসংখ্যার উপাদান ভীআমি, আমি=1,,এন এবং নির্বাচনের সম্ভাবনা পি1,,পিএন। আকারের প্রদত্ত নমুনার জন্যএন, নমুনা পর্যবেক্ষণ মান হতে দিন বনাম1,,বনামএন

নমুনা মোটের গড় এবং তারতম্যটি যা পছন্দসই তা হল

Σআমি=1এনবনামআমি

মন্তব্যে উল্লিখিত হিসাবে, একটি নির্দিষ্ট নমুনা নির্বাচনের সম্ভাবনা গুলি={তোমার দর্শন লগ করাআমি,তোমার দর্শন লগ করা,,তোমার দর্শন লগ করাটি} যে ক্রমে আঁকা হয়

pr(গুলি)=পিআমি1পি2পিটিএন,
যেখানে প্রাথমিক সম্ভাবনা পিআমি1 অঙ্কন তোমার দর্শন লগ করাআমি দেওয়া হয় পিআমিদ্বিতীয় সম্ভাবনা পি2 অঙ্কন তোমার দর্শন লগ করা অপসারণ শর্তাধীন তোমার দর্শন লগ করাআমিজনসংখ্যা থেকে এবং আরও সুতরাং প্রতিটি পরবর্তী ইউনিট অঙ্কিত পরবর্তী ইউনিটের জন্য একটি নতুন সম্ভাব্যতা বিতরণে ফলাফল (সুতরাং, বিভিন্ন সূচক বর্ণগুলির পছন্দ, কারণ প্রত্যেকে পৃথক বিতরণের প্রতিনিধিত্ব করে))

সেখানে

S(i)=n!(N1n1)
আকারের নমুনা n যে ধারণ করে uiপুরো জনসংখ্যার বাইরে। মনে রাখবেন যে এটি অ্যাকাউন্টে নেয়n! নমুনার ক্রম।

দিন sn(i) আকারের একটি নির্দিষ্ট নমুনা বোঝায় n যা রয়েছে ui। তারপরে, উপাদান নির্বাচন করার সম্ভাবনাui দেওয়া হয়

P(ui)=Pr(sn(i)),
যেখানে সমষ্টিটি আকারের সেটের উপরে S(i) সমস্ত সম্ভাব্য নমুনা sn(i) আকারের n যে ধারণ করে ui। (কাগজটি থেকে আমার কাছে স্বরলিপিটি কিছুটা পরিবর্তন করা হয়েছে কারণ এটি আমার কাছে বিভ্রান্তিকর বলে মনে হয়েছিল।)

একইভাবে, সংজ্ঞা দিন

S(ij)=n!(N2n2)
উভয় সমন্বিত নমুনার সংখ্যা হিসাবে ui এবং uj। তারপরে আমরা উভয় হিসাবে থাকা একটি নমুনার সম্ভাব্যতা সংজ্ঞায়িত করতে পারি
P(uআমিতোমার দর্শন লগ করা)=Σpr(গুলিএন(আমি)),
যেখানে সমষ্টিটি আকারের সেটের উপরে এস(আমি) সমস্ত সম্ভাব্য নমুনা গুলিএন(আমি) আকারের এন যে ধারণ করে তোমার দর্শন লগ করাআমি এবং তোমার দর্শন লগ করা

প্রত্যাশিত মানটি তখন হিসাবে প্রাপ্ত হয়

(Σআমি=1এনবনামআমি)=Σআমি=1এনপি(তোমার দর্শন লগ করাআমি)ভীআমি

যদিও কাগজটিতে সুস্পষ্টভাবে ভিন্নতা পাওয়া যায় নি তবে এটি এর এক্সপেকশন থেকে প্রাপ্ত হতে পারে কুইমূহুর্ত

(Σআমি=1এনবনামআমিকুই)=Σআমি=1এনপি(তোমার দর্শন লগ করাআমি)ভীআমিকুই
এবং ক্রস পণ্য
(Σআমিএনবনামআমিবনাম)=Σআমিপি(তোমার দর্শন লগ করাআমিতোমার দর্শন লগ করা)ভীআমিভী

অন্য কথায়, দেখে মনে হচ্ছে এই গণনাগুলি সম্পাদন করার জন্য সকলকেই সম্ভাব্য সমস্ত উপগ্রহের মধ্য দিয়ে যেতে হবে। হয়তো এটি এর ছোট মানগুলির জন্য করা যেতে পারেএনযদিও।

হরভিটজ, ডিজি এবং থম্পসন, ডিজে (১৯৫২) সীমাবদ্ধ মহাবিশ্ব থেকে প্রতিস্থাপন না করে নমুনা তৈরির একটি সাধারণীকরণ। আমেরিকান পরিসংখ্যান সমিতির জার্নাল 47 (260): 663-685।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.