সাধারণ বিতরণ এবং একঘেয়ে রূপান্তর


9

শুনেছি প্রকৃতিতে প্রচুর পরিমাণে সাধারণত বিতরণ করা হয়। এটি সাধারণত কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যটি ব্যবহার করে ন্যায়সঙ্গত হয় যা বলে যে আপনি যখন আইআইডি র‌্যান্ডম ভেরিয়েবলের একটি বড় সংখ্যা গড় করেন তখন আপনি একটি সাধারণ বিতরণ পান। সুতরাং, উদাহরণস্বরূপ, বৃহত সংখ্যক জিনের সংযোজনমূলক প্রভাব দ্বারা নির্ধারিত একটি বৈশিষ্ট্য প্রায় সাধারণত বিতরণ করা যেতে পারে কারণ জিনের মানগুলি আইড র্যান্ডম ভেরিয়েবলের মতো আচরণ করতে পারে।

এখন, যা আমাকে বিভ্রান্ত করে তা হ'ল সাধারণভাবে বিতরণ করার সম্পত্তিটি একচেটিয়া রূপান্তরের অধীনে সুস্পষ্টভাবে আক্রমণকারী নয়। সুতরাং, যদি একরকম পরিবর্তনের সাথে সম্পর্কিত এমন কোনও কিছুর পরিমাপের দুটি উপায় থাকে তবে এগুলি উভয়ই সাধারণত বিতরণ করার সম্ভাবনা থাকে না (যদি না যে একঘেয়ে রূপান্তরটি লিনিয়ার না হয়)। উদাহরণস্বরূপ, আমরা বৃষ্টিপাতের আকারগুলি ব্যাস, পৃষ্ঠের ক্ষেত্রফল বা ভলিউম দ্বারা পরিমাপ করতে পারি। সমস্ত বৃষ্টিপাতের জন্য একই আকার ধরে ধরে, পৃষ্ঠের ক্ষেত্রফলটি ব্যাসের বর্গক্ষেত্রের সমানুপাতিক এবং ভলিউম ব্যাসের ঘনক্ষেত্রের সাথে সমানুপাতিক। সুতরাং পরিমাপের এই সমস্ত উপায় সাধারণত বিতরণ করা যায় না।

সুতরাং আমার প্রশ্নটি হল স্কেলিংয়ের নির্দিষ্ট উপায় (অর্থাত্ একঘেয়ে রূপান্তরকরণের বিশেষ পছন্দ) যার অধীনে বিতরণটি স্বাভাবিক হয়ে যায়, অবশ্যই শারীরিক তাত্পর্য বহন করে। উদাহরণস্বরূপ, উচ্চতাগুলি কি সাধারণত বিতরণ করা উচিত বা উচ্চতার বর্গক্ষেত্র, বা উচ্চতার লোগারিদম বা উচ্চতার বর্গমূল হওয়া উচিত? উচ্চতা প্রভাবিত প্রক্রিয়াগুলি বোঝার দ্বারা এই প্রশ্নের উত্তর দেওয়ার কোনও উপায় আছে কি?


আমি সর্বদা এটি বুঝতে পেরেছি, কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রচুর পরিমাণে আইআইডি র্যান্ডম ভেরিয়েবলের গড় সম্পর্কে কিছু পোস্ট করে না। বরং এটি উল্লেখ করে যে যখন নমুনা দেওয়ার অর্থ হয় তখন মাধ্যমের বন্টন স্বাভাবিক হয় (যেটি নমুনা দেওয়া হয় তার অন্তর্গত বিতরণ থেকে স্বতন্ত্র)। সুতরাং আমি আপনার প্রশ্নটির পূর্বসূরি ধারণ করে কিনা তা প্রশ্ন করি।
হেনরিক

তবে, যদি অন্তর্নিহিত বিতরণটি নির্বিশেষে স্যাম্পলিংয়ের মাধ্যমটি স্বাভাবিক হয়ে যায় তবে এটি 'আইডি এলোমেলো ভেরিয়েবলের একটি বড় সংখ্যার গড়' বলার মতো নয় যা আমাদের একটি সাধারণ বিতরণ করে। আমার কাছে তারা সমতুল্য বক্তব্য বলে মনে হচ্ছে।

আমার চোখে নয় (তবে আমি অন্যথায় বিশ্বাসী হতে চাই)। এক ক্ষেত্রে (আমি সিএলটি বলতে বোঝায় এমন একজন) আপনি একটি বিতরণ থেকে নমুনা আঁকেন। তাদের উপায়গুলি সাধারণত বিতরণ করা হয়। আমি যে প্রশ্নটি থেকে বুঝতে পারি এবং "আইড র‌্যান্ডম ভেরিয়েবলের গড় একটি গড় গড়ে" তা স্টেফ ডিফারেন্ট: বিভিন্ন আইড র‌্যান্ডম ভেরিয়েবলের পৃথক তাত্পর্য একটি বৈশিষ্ট্য নির্ধারণ করে (বা মেক আপ) করে। সুতরাং, একক বিতরণ থেকে কোনও গড় (যেমন একটি গড় গণনা) করা যায় না এবং তাই, সিএলটি প্রয়োগ হয় না। আমি মনে করি এমবিকিউর উত্তরগুলি একই ইস্যুতে ইঙ্গিত করে।
হেনরিক

1
ভাল কিছু শর্ত যদি ধরে থাকে তবে বিতরণটি অভিন্ন হওয়ার দরকার নেই। দেখুন: en.wikipedia.org/wiki/...

1
@Henrik সেখানে এন স্বাধীন ও প্রতিটি থেকে একটি একক নমুনা মধ্যে কোনো অর্থপূর্ণ পার্থক্য আছে কি অভিন্নরুপে বিতরণ rvs এবং একটি একক আরভি এর এন স্বাধীন পরিমাপ?
ওয়াকিটালকি

উত্তর:


5

খুব ভাল প্রশ্ন। আমি অনুভব করি যে উত্তরটি আপনি অন্তর্নিহিত প্রক্রিয়াটি সনাক্ত করতে পারবেন কিনা তা নির্ভর করে যা প্রশ্নে পরিমাপকে বাড়িয়ে তোলে। উদাহরণস্বরূপ, আপনার কাছে প্রমাণ রয়েছে যে উচ্চতাটি বিভিন্ন কারণগুলির একটি লিনিয়ার সংমিশ্রণ (যেমন, পিতামাতার উচ্চতা, দাদা-দাদিদের উচ্চতা ইত্যাদি) তবে উচ্চতাটি সাধারণত বিতরণ করা হয়েছে বলে ধরে নেওয়া স্বাভাবিক হবে। অন্যদিকে আপনার কাছে প্রমাণ থাকলে বা সম্ভবত তত্ত্বটিও রয়েছে যে উচ্চতার লগটি বেশ কয়েকটি ভেরিয়েবলের লিনিয়ার সংমিশ্রণ (যেমন লগ প্যারেন্টস হাইটস, দাদা-দাদীর হাইটস লগ ইত্যাদি) তবে উচ্চতার লগটি সাধারণত বিতরণ করা হবে।

বেশিরভাগ পরিস্থিতিতে, আমরা অন্তর্নিহিত প্রক্রিয়াটি জানি না যা আগ্রহের পরিমাপটি পরিচালনা করে। সুতরাং, আমরা বেশ কয়েকটি কাজের একটি করতে পারি:

(ক) উচ্চতাগুলির অভিজ্ঞতাগত বিতরণ যদি স্বাভাবিক দেখায় তবে আমরা আরও বিশ্লেষণের জন্য একটি সাধারণ ঘনত্ব ব্যবহার করি যা স্পষ্টতই ধরে নেয় যে উচ্চতাটি বেশ কয়েকটি ভেরিয়েবলের রৈখিক সংমিশ্রণ।

(খ) যদি অভিজ্ঞতাগত বিতরণটি স্বাভাবিক না দেখায় আমরা এমবিকিউ (যেমন লগ (উচ্চতা)) দ্বারা প্রস্তাবিত কিছু রূপান্তর চেষ্টা করতে পারি । এক্ষেত্রে আমরা স্পষ্টতই ধরে নিই যে ট্রান্সফর্মড ভেরিয়েবল (যেমন লগ (উচ্চতা)) বেশ কয়েকটি ভেরিয়েবলের রৈখিক সংমিশ্রণ।

(গ) যদি (ক) বা (খ) সহায়তা না করে থাকে তবে আমাদের সিএলটি এবং স্বাভাবিকতার ধারনা আমাদের যে সুবিধা দেয় তা বর্জন করতে হবে এবং অন্য কিছু বিতরণ ব্যবহার করে ভেরিয়েবলের মডেল করতে হবে।


5

নির্দিষ্ট পরিবর্তনশীলটিকে পুনরুদ্ধার করা, যখন সম্ভব হয়, এর ফলে কিছুটা বোধগম্য স্কেলের সাথে সম্পর্কিত হওয়া উচিত কারণ এটি ফলাফলের মডেলটিকে ব্যাখ্যাযোগ্য করে তুলতে সহায়তা করে। যাইহোক, ফলাফল রূপান্তর সম্পূর্ণ শারীরিক তাত্পর্য বহন করা প্রয়োজন। মূলত আপনাকে স্বাভাবিকতা অনুমানের লঙ্ঘন এবং আপনার মডেলের ব্যাখ্যাযোগ্যতার মধ্যে একটি বাণিজ্য বন্ধ করতে হবে। এই পরিস্থিতিতে আমি যা করতে চাই তা হ'ল মূল ডেটা, ডেটা এমনভাবে রূপান্তরিত হয় যা বোধগম্য হয় এবং ডেটা এমনভাবে রূপান্তরিত হয় যা সবচেয়ে স্বাভাবিক। যদি তথ্যটি এমনভাবে রূপান্তরিত হয় যা বোধগম্য হয় যখন ফলাফলগুলি একইভাবে হয় যখন ডেটাটি এমনভাবে রূপান্তরিত হয় যা একে একে একে সাধারণ করে তোলে, আমি এটিকে এমনভাবে রিপোর্ট করছি যা একটি পার্শ্ব নোটের সাথে ব্যাখ্যামূলক হয় যে সর্বোত্তম রূপান্তরিত (এবং / বা অপরিবর্তিত) ডেটার ক্ষেত্রে ফলাফলগুলি একই হয়। যখন অপরিবর্তিত তথ্য বিশেষত খারাপ আচরণ করে, আমি রূপান্তরিত ডেটা নিয়ে আমার বিশ্লেষণগুলি পরিচালনা করি তবে অপরিকল্পিত ইউনিটগুলিতে ফলাফলগুলি রিপোর্ট করার জন্য যথাসাধ্য চেষ্টা করি।

এছাড়াও, আমি মনে করি আপনার বিবৃতিতে আপনার একটি ভুল ধারণা রয়েছে যে "প্রকৃতির পরিমাণগুলি সাধারণত বিতরণ করা হয়"। এটি কেবলমাত্র সেই ক্ষেত্রে সত্য যেখানে মানগুলি স্বাধীন কারণগুলির "বৃহত সংখ্যার সংযোজনমূলক প্রভাব দ্বারা নির্ধারিত হয়"। অর্থাত্, অর্থগুলি এবং অঙ্কগুলি সাধারণত তাদের বিতরণ করা হয় যা অন্তর্নিহিত বিতরণ থেকে তারা আঁকেন, যেখানে পৃথক মান হিসাবে সাধারণত বিতরণ করা হবে বলে আশা করা যায় না। উদাহরণস্বরূপ, দ্বিপদী বিতরণ থেকে পৃথক অঙ্কগুলি সমস্ত সাধারণের দিকে নজর দেয় না, তবে দ্বিপদী বিতরণ থেকে 30 অঙ্কের অঙ্কের বন্টন বরং স্বাভাবিক দেখায়।


5

আমাকে অবশ্যই স্বীকার করতে হবে যে আমি আপনার প্রশ্নটি সত্যই বুঝতে পারি না:

  • আপনার বৃষ্টিপাতের উদাহরণটি খুব সন্তোষজনক নয়, কারণ এটি গৌসিয়ান আচরণ "আইড র‌্যান্ডম ভেরিয়েবলের একটি গড়ের গড়" থেকে আসে তা এই সত্যটি চিত্রিত করে না।

  • পরিমাণ যদি এক্স আপনি আগ্রহী যে গড় ওয়াই1+ +...+ +ওয়াইএনএন এটি গাউসিয়ান উপায়ে তার গড়ের প্রায় ওঠানামা করে, আপনি এটিও আশা করতে পারেন (ওয়াই1)+ +...+ +(ওয়াইএন)এন গাউসির আচরণ রয়েছে।

  • এর ওঠানামা যদি এক্স এর গড় প্রায় কাছাকাছি প্রায় গাউসিয়ান এবং ছোট, তারপর এর ওঠানামা হয় (এক্স) এর গড় কাছাকাছি (টেলর সম্প্রসারণ দ্বারা)

  • গড়পড়তা থেকে আসা গাউসিয়ান আচরণের কিছু সত্য উদাহরণ আপনি (বাস্তব জীবন) তুলে ধরতে পারেন: এটি খুব সাধারণ নয়! গাউসীয় আচরণটি প্রায়শই পরিসংখ্যানগুলিতে প্রথম রুক্ষ অনুমান হিসাবে ব্যবহৃত হয় কারণ গণনাগুলি খুব ট্র্যাকটেবল। পদার্থবিজ্ঞানীরা যেমন সুরেলা অনুমান ব্যবহার করেন, তেমনি পরিসংখ্যানবিদরা গাউসীয় অনুমান ব্যবহার করেন।


সর্বাধিক এনট্রপি নীতিটি গাউসীয় বিতরণ ব্যবহৃত হওয়ার অন্য কারণ। উদাহরণস্বরূপ, রৈখিক মডেলটিতে গাউসীয় ত্রুটিগুলি ট্র্যাকটেবিলিটি বাদ দিয়ে ব্যবহার করার ভাল কারণগুলি কী?
আলেক

5

বিপুল, আপনি আপনার প্রশ্নে পুরোপুরি নির্ভুল হচ্ছেন না।

এটি সাধারণত কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যটি ব্যবহার করে ন্যায়সঙ্গত হয় যা বলে যে আপনি যখন আইআইডি র‌্যান্ডম ভেরিয়েবলের একটি বড় সংখ্যা গড় করেন তখন আপনি একটি সাধারণ বিতরণ পান।

আপনি যা বলছেন তা আমি সম্পূর্ণরূপে নিশ্চিত নই, তবে মনে রাখবেন যে আপনার উদাহরণের বৃষ্টিপাতগুলি আইডম র্যান্ডম ভেরিয়েবল নয়। এই বৃষ্টিপাতের একটি নির্দিষ্ট সংখ্যার নমুনা দিয়ে গণনা করা গড়টি একটি এলোমেলো ভেরিয়েবল, এবং যেহেতু মাধ্যমগুলি যথেষ্ট পরিমাণে নমুনার আকার ব্যবহার করে গণনা করা হয়, সেই নমুনাটির গড় বিতরণ স্বাভাবিক।

বিপুল সংখ্যার আইন বলছে যে সেই নমুনার অর্থের অর্থ জনসংখ্যার গড় মানকে রূপান্তরিত করে (সংশ্লেষের ধরণের উপর নির্ভর করে শক্তিশালী বা দুর্বল)।

সিএলটি বলে যে নমুনাটির অর্থ, এটি এক্সএম (এন) বলুন, যা এলোমেলো পরিবর্তনশীল, এর বিতরণ রয়েছে, জি (এন) বলে। এন যেমন অনন্যতার কাছে পৌঁছেছে, সেই বিতরণ হল সাধারণ বিতরণ distribution সিএলটি হ'ল বিতরণে একত্রিত হওয়া , কোনও প্রাথমিক ধারণা নয়।

আপনি যে পর্যবেক্ষণগুলি আঁকেন (ব্যাস, ক্ষেত্র, আয়তন) এগুলি মোটেও সাধারণ হতে হবে না। আপনি তাদের ষড়যন্ত্র যদি করেন তারা সম্ভবত তা হবে না। তবে, তিনটি পর্যবেক্ষণ নেওয়া থেকে নমুনাটির অর্থ সাধারণ বিতরণ হবে। এবং, ভলিউম ব্যাসের ঘনক্ষেত্র হবে না, বা অঞ্চলটি ব্যাসের বর্গক্ষেত্র হবে না। আপনি অদ্ভুতভাবে ভাগ্যবান না হলে যোগফলগুলির বর্গফল বর্গের যোগফল হবে না।


4

কেবল সিএলটি (বা অন্য কোনও উপপাদ্য) এই বলে না যে মহাবিশ্বের প্রতিটি পরিমাণ সাধারণত বিতরণ করা হয়। প্রকৃতপক্ষে, পরিসংখ্যানবিদরা প্রায়শই স্বাভাবিকতা উন্নত করতে একঘেয়ে রূপান্তর ব্যবহার করেন, যাতে তারা তাদের পছন্দসই সরঞ্জামগুলি ব্যবহার করতে পারেন।


4

আমি মনে করি আপনি সাধারণ বিতরণে পরিসংখ্যানবিদ ব্যবহারের (অর্ধেক) ভুল বুঝতে পেরেছেন তবে আমি আপনার প্রশ্নটি সত্যিই পছন্দ করি।

আমি মনে করি না নিয়মতান্ত্রিকভাবে স্বাভাবিকতা অনুমান করা ভাল ধারণা এবং আমি স্বীকার করি যে এটি কোনও সময় হয়ে গেছে (সম্ভবত কারণ সাধারণ বিতরণটি ট্র্যাকটেবল, ইউনিমোডাল ...) যাচাইকরণ ছাড়াই। অতএব একঘেয়ে মানচিত্র সম্পর্কে আপনার মন্তব্য দুর্দান্ত!

তবে স্বাভাবিকতার মধ্যে শক্তিশালী ব্যবহার আসে যখন আপনি প্রত্যাশা empiriral কাউন্টার অংশ প্রয়োগ যেমন যে প্রদর্শিত হয় এক হিসাবে নতুন পরিসংখ্যান নিজেকে গঠন করা: গবেষণামূলক গড় । তাই অভিজ্ঞতাগত গড় এবং আরও সাধারণভাবে স্মুথিং হ'ল যা সর্বত্র স্বাভাবিকতা উপস্থিত হয় ...


2

এলোমেলো পরিবর্তনশীল এবং এর বহু রূপান্তর উভয়ই প্রায় স্বাভাবিক হতে পারে; প্রকৃতপক্ষে যদি গড়ের তুলনায় ভেরিয়েন্সটি ছোট হয় তবে এটি হতে পারে যে খুব বিস্তৃত রূপান্তরগুলি বেশ স্বাভাবিক দেখায়।

> a<-rgamma(10000,1000,1000)
> hist(a)
> hist(1/a)
> hist(a^2)
> hist(a^(3/2))

4 হিস্টোগ্রামগুলি নিকট-স্বাভাবিকতা দেখায়

(আরও বড় সংস্করণের জন্য ক্লিক করুন )

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.