পরিসংখ্যানের এলোমেলোতা সম্পর্কে কিছু প্রশ্ন


15

থেকে উইকিপিডিয়ার পরিসংখ্যান randoness :

গ্লোবাল এলোমেলোতা এবং স্থানীয় এলোমেলোতা আলাদা। এলোমেলোতার বেশিরভাগ দার্শনিক ধারণা বিশ্বব্যাপী - কারণ এ ধারণার উপর ভিত্তি করে যে তারা "দীর্ঘমেয়াদে" একটি ক্রমকে সত্যই এলোমেলো দেখায়, এমনকি কিছু উপ-অনুক্রমগুলি এলোমেলো মনে না হলেও। একটি "সত্যিকারের" পর্যাপ্ত দৈর্ঘ্যের সংখ্যার এলোমেলো ক্রম, উদাহরণস্বরূপ, এটি সম্ভবত জিরো ব্যতীত আর কিছুই লম্বা ক্রম হতে পারে, যদিও পুরো ক্রমটি এলোমেলো হতে পারে। স্থানীয় এলোমেলোতা ধারণাটি বোঝায় যে ন্যূনতম ক্রম দৈর্ঘ্য হতে পারে যাতে এলোমেলো বিতরণগুলি প্রায় অনুমান করা হয়।একই সংখ্যার দীর্ঘ প্রসারিত এমনকি "সত্যিকারের" এলোমেলো প্রক্রিয়া দ্বারা উত্পাদিত একটি নমুনার "স্থানীয় এলোমেলোতা" হ্রাস করবে (এটি কেবলমাত্র 10,000 সংখ্যার সিকোয়েন্সের জন্য স্থানীয়ভাবে এলোমেলো হতে পারে; এক হাজারেরও কম সংখ্যক ক্রম গ্রহণ করা এলোমেলোভাবে প্রদর্শিত না হতে পারে would মোটেও, উদাহরণস্বরূপ)।

কোনও প্যাটার্ন প্রদর্শিত একটি ক্রম এর দ্বারা পরিসংখ্যানগতভাবে এলোমেলো প্রমাণিত হয় না। রামসে তত্ত্বের নীতিমালা অনুসারে পর্যাপ্ত পরিমাণে বড় অবজেক্টের অবশ্যই একটি প্রদত্ত কাঠামো থাকতে হবে ("সম্পূর্ণ ব্যাধি অসম্ভব")।

আমি দু'টি বাক্যটির অর্থ গা bold়ভাবে বুঝতে পারি না।

  1. প্রথম বাক্যটির অর্থ কী যে কোনও কিছু একটি দৈর্ঘ্যকে একটি সিকোয়েন্স স্থানীয় এলোমেলো করে তোলে এবং একটি ছোট দৈর্ঘ্যে স্থানীয় এলোমেলো করে না?

    প্রথম বন্ধনের অভ্যন্তরের উদাহরণটি কীভাবে কাজ করে?

  2. দ্বিতীয় বাক্যটির অর্থ কী কোনও প্যাটার্ন প্রদর্শিত ক্রমটি পরিসংখ্যানগতভাবে এলোমেলো প্রমাণিত হতে পারে না? কেন?

ধন্যবাদ


1
ভাল প্রশ্ন. আমি এই লেখাটি নিজেকে কিছুটা বিস্মিত করে দেখি। আমি ভাবতাম যে অনুক্রমটি এলোমেলো কিনা তা কীভাবে তৈরি করা যায় তা করা উচিত; ফলাফল কি হয় না। আমি এখানে একটি ভাষাগত সমস্যা আছে সন্দেহ করি - আমার জন্য এলোমেলো অর্থ এটি কীভাবে উত্পন্ন হয়; সাধারণ জ্ঞানের জন্য (এবং সম্ভবত কম পরিষ্কার-চিন্তাভাবনা দার্শনিক?) এটি এমন কিছু সম্পর্কে যা বিশৃঙ্খলা দেখা দেয়?
পিটার এলিস

3
@ পিটার, আপনি কেবল প্রজন্মের প্রক্রিয়াতে উল্লেখ করতে পারলে এলোমেলোতা সংজ্ঞা দিতে এমনকি আপনার পক্ষে একটি কঠিন সময় থাকতে পারে। শেষ পর্যন্ত, কারণ এলোমেলো ক্রমের সমস্ত ইউটিলিটি তাদের সংখ্যায় অন্তর্ভুক্ত - এবং কীভাবে এই সংখ্যাগুলি উত্পাদিত হয়েছিল তা নয় - সিক্যুয়েন্সগুলির নিরিখে নির্ভেজালভাবে সংজ্ঞা নির্ধারণ ও পরীক্ষা করার উপায় থাকতে হবে, আপনি কি ভাবেন না?
whuber

1
অবশ্যই আমি সম্মত হই যে আপনি এর ফলাফলগুলি থেকে এলোমেলোতা পরীক্ষা করতে পারেন - এলোমেলোতার প্রশংসার পক্ষে, এর প্রমাণের জন্য আগ্রহী না হয়ে। প্রজন্মভিত্তিক সংজ্ঞার দার্শনিক চ্যালেঞ্জগুলি নিয়ে আমার সম্ভবত আরও কিছু পড়া এবং চিন্তা করা দরকার।
পিটার এলিস

আমি মনে করি এলোমেলোতা কেবল অজানা এর প্রতিশব্দ। আমিও এই বাক্যটি বিজারে পাই
সম্ভাব্যতা ব্লগ

উত্তর:


15

ধারণাটি খুব কার্যকরভাবে কার্যকরযোগ্য কোড দ্বারা চিত্রিত করা যেতে পারে। R10,000 শূন্য এবং এর ক্রম তৈরি করতে আমরা একটি ভাল সিউডো এলোমেলো সংখ্যা জেনারেটর ব্যবহার করে শুরু করি (ইন ):

set.seed(17)
x <- floor(runif(10000, min=0, max=2))

এটি কয়েকটি বেসিক এলোমেলো নম্বর পরীক্ষায় পাস করে। উদাহরণ হিসেবে বলা যায়, এর মানে তুলনা করার জন্য একটি t-test এর একটি পি-মূল্য আছে 40,09 যা আমাদের অনুমান যে zeros এবং বেশী সমানভাবে সম্ভাবনা বেশি গ্রহণ করতে পারবেন%,।1/240,09

এই সংখ্যাগুলি থেকে আমরা 5081 তম মানের থেকে শুরু করে ধারাবাহিক মানগুলির একটি অনুচ্ছেদটি বের করতে এগিয়ে যাই:1000

x0 <- x[1:1000 + 5080]

এগুলি যদি এলোমেলোভাবে দেখতে হয় তবে এগুলি একই র্যান্ডম সংখ্যার পরীক্ষায় পাস করা উচিত। উদাহরণস্বরূপ, আসুন পরীক্ষা করে দেখি যে তাদের গড়টি 1/2 হয়:

> t.test(x0-1/2)

    One Sample t-test

data:  x0 - 1/2 
t = 2.6005, df = 999, p-value = 0.009445
alternative hypothesis: true mean is not equal to 0 
95 percent confidence interval:
 0.01006167 0.07193833 
sample estimates:
mean of x 
    0.041 

কম পি-ভ্যালু (কম 1%) দৃঢ়ভাবে সুপারিশ গড় উল্লেখযোগ্যভাবে হয় বৃহত্তর তুলনায় । প্রকৃতপক্ষে, এই অনুচ্ছেদের সংখ্যাসমূহের শক্তিশালী upর্ধ্বমুখী প্রবণতা রয়েছে:1/2

> plot(cumsum(x0-1/2))

এলোমেলো হাটা?

এলোমেলো আচরণ নয়!

মূল অনুক্রমের (একটি সংশ্লেষক যোগফল হিসাবে প্লট করা) এর তুলনা এই অনুবর্তনের সাথে কী ঘটছে তা প্রকাশ করে:

এলোমেলো হাটা

দীর্ঘ ক্রমটি প্রকৃতপক্ষে একটি এলোমেলো হাঁটার মতো আচরণ করে - যেমনটি হওয়া উচিত - তবে আমি যে বিশেষ উপগ্রহটি বের করেছি তাতে একই দৈর্ঘ্যের সমস্ত অনুচ্ছেদগুলির মধ্যে দীর্ঘতম wardর্ধ্বমুখী বৃদ্ধি রয়েছে। দেখে মনে হচ্ছে যে আমি "ননরানডম" আচরণের চিত্র প্রদর্শনকারী অন্যান্য কিছু অনুচ্ছেদগুলিও বের করতে পারতাম, যেমন প্রায় কেন্দ্রিক যেখানে প্রায় একাধিক 20 টি প্রদর্শিত হয়!9000


এই সাধারণ বিশ্লেষণগুলি যেমন দেখিয়েছে, কোনও পরীক্ষা "প্রমাণ" করতে পারে না যে অনুক্রমটি এলোমেলোভাবে উপস্থিত হয়। আমরা কেবল যা করতে পারি তা পরীক্ষা করে বলা হচ্ছে যে ক্রমগুলি এলোমেলো নয় এমন প্রমাণ দেওয়ার জন্য এলোমেলো ক্রমগুলির প্রত্যাশিত আচরণগুলি থেকে যথেষ্ট পরিমাণে বিচ্যুত হয় । এলোমেলো-সংখ্যার পরীক্ষার ব্যাটারি এভাবে কাজ করে: এলোমেলো সংখ্যা ক্রমগুলির উত্থানের সম্ভাবনা খুব বেশি বলে তারা নিদর্শনগুলি সন্ধান করে। প্রতিবার দীর্ঘ সময় পরে তারা আমাদের এই সিদ্ধান্তে পৌঁছে দেবে যে সংখ্যার সত্যিকারের এলোমেলো অনুক্রমটি এলোমেলোভাবে উপস্থিত হয় না: আমরা এটিকে অন্য কিছু করার চেষ্টা প্রত্যাখ্যান করব।

দীর্ঘমেয়াদে, যদিও - ঠিক যেমনটি আমরা সকলেই মারা গেছি - যেকোন সত্যিকারের এলোমেলো সংখ্যা জেনারেটর 1000 ডিজিটের প্রতিটি সম্ভাব্য ক্রম তৈরি করবে এবং এটি অসীম বহু বার এটি করবে। যৌক্তিক দ্বন্দ্ব থেকে আমাদের কী উদ্ধার করে তা হ'ল এ জাতীয় দৃশ্যমান বিস্ফোরণ ঘটতে আমাদের একটি ভয়ঙ্কর দীর্ঘ সময় অপেক্ষা করতে হবে।


ধন্যবাদ! একটি সম্পর্কিত প্রশ্ন: কিছু পদ্ধতি দ্বারা উত্পন্ন সিউডো এলোমেলো সংখ্যার এলোমেলো পরীক্ষা করার সময়, এলোমেলোতার অর্থ কি অভিন্ন বন্টন? অন্য কথায়, অভিন্ন বন্টন পরীক্ষা করার জন্য কি এলোমেলোভাবে পরীক্ষা করা হয়? আমি এটি জিজ্ঞাসা করেছি কারণ এই পক্ষপাতদুষ্ট বিতরণগুলি স্বজ্ঞাতভাবে আমার কাছে কম এলোমেলো মনে হচ্ছে।
টিম

@ টিম: না, গাউসিয়ান এলোমেলোতার জন্য অনেকগুলি সাধারণ পরীক্ষা রয়েছে এবং যে কোনও বিতরণের জন্য পরীক্ষা করা সম্ভব হবে।
naught101

1
[0,1)

2
আমি উত্তরের উপরের দিকে প্রায় "তাকান" এবং "হুইবার" বলতে পারি :) খুব ভাল!
পিএইচডি

2

এই সংক্ষেপে "স্থানীয় র্যান্ডমনেস" এবং "গ্লোবাল এলোমেলোতা" পদগুলি এলোমেলো ভেরিয়েবলের সীমাবদ্ধ সংখ্যার সাথে কী ঘটতে পারে এবং র্যান্ডম ভেরিয়েবলের সম্ভাবনা বন্টন বা প্রত্যাশার মধ্যে পার্থক্য করতে ব্যবহার করে।

এক্সআমি{0,1}θθলিমএন1এনΣআমি=1এনএক্সআমি=θ

[0,1][একটি,]0একটি<1θ

এখানে নতুন কিছু নেই।

এন

সুতরাং, আমি এই সংক্ষিপ্তসারটির কথা চিন্তা করে খুব বেশি মস্তিষ্কের কোষ জ্বালাবো না। এটি গাণিতিকভাবে এত নির্ভুল নয় এবং এলোমেলোতার প্রকৃতি সম্পর্কে আসলে বিভ্রান্তিকর।

মন্তব্যের ভিত্তিতে সম্পাদনা করুন: kতিহাসিক জ্ঞানের জন্য আপনার মন্তব্যে @kjetilbhalvorsen +1 করুন। তবে আমি এখনও মনে করি এই শর্তাবলীর মান সীমিত এবং বিভ্রান্তিকর। আপনি যে সারণীগুলির বর্ণনা দিচ্ছেন সেগুলি বিভ্রান্তিকর অন্তর্ভুক্ত করে বলে মনে হচ্ছে যে ছোট নমুনাগুলি রয়েছে, উদাহরণস্বরূপ, নমুনাটির অর্থ আসল প্রত্যাশিত মান থেকে দূরে বা সম্ভবত একটি অসম্ভব তবে অবশ্যই সম্ভব পুনরাবৃত্ত 0 এর দীর্ঘ ক্রম (আমার বার্নোলির উদাহরণে), কোনওভাবে প্রদর্শিত হবে কম এলোমেলো করে (তারা এই কল্পিত "স্থানীয় এলোমেলোতা" দেখায় না বলে) উদীয়মান পরিসংখ্যানবিদদের জন্য আমি আরও বিভ্রান্তিকর কিছু ভাবতে পারি না!


যদিও "গ্লোবাল এলোমেলোতা" আইডিসিঙ্ক্র্যাটিক হিসাবে প্রদর্শিত হয়, "স্থানীয় র্যান্ডমনেস" এর কমপক্ষে 20 বছরের ইতিহাস রয়েছে। উদাহরণস্বরূপ, isiweb.ee.ethz.ch/papers/arch/umaure-mass-inspec-1991-1.pdf দেখুন ।
whuber

এনএন

2
আমার মনে আছে আমি মাঝে মাঝে এটি পড়েছিলাম: যে সময় লোকেরা সিমুলেশন, পরীক্ষা-নিরীক্ষা ইত্যাদির জন্য ব্যবহার করতে "এলোমেলো সংখ্যার" টেবিল সহ বই প্রকাশ করেছিল, এর মধ্যে কয়েকটি সারণীগুলির অংশগুলি ছোট সিমুলেশনগুলির জন্য উপযুক্ত হিসাবে চিহ্নিত করেছিল (প্রদর্শিত "স্থানীয়" এলোমেলোতা ") এবং অন্যান্য অংশগুলি যা কেবলমাত্র বৃহত্তর সিমুলেশনের জন্য ব্যবহার করা উচিত (" গ্লোবাল এলোমেলোতা "প্রদর্শন করে) সুতরাং ধারণাগুলি মূল্যবান কোনও কিছুর দিকে ইঙ্গিত করে বলে মনে হচ্ছে!
কেজেটিল বি হালওয়ারসেন

1
দুঃখিত, আমি এটি কোথায় পড়েছি তা মনে করতে পারছি না। তবে এটি প্রায় সুস্পষ্ট: এলোমেলো সংজ্ঞা নির্ধারণে দার্শনিক সমস্যাগুলি বাদ দিয়ে যদি আপনার খুব কম সিমুলেশন থাকে যেখানে আপনার 1000 র্যান্ডম সংখ্যার প্রয়োজন হয় এবং আপনার উচ্চ-মানের র্যান্ডম জেনারেটর আপনাকে 1000 শূন্য দেয়, আপনি কী করবেন? "সত্যিকারের এলোমেলো" ক্রমের ক্ষেত্রে এই জাতীয় সংঘটিত হওয়া সম্ভব এবং সত্যই প্রয়োজনীয় হওয়া সত্ত্বেও, আপনার অনুকরণটি নষ্ট হয়ে গেছে!
কেজেটিল বি হালওয়ারসেন

1
ধন্যবাদ ছেলেরা, আমি আমার নিন্দায় খুব কঠোর ছিলাম। আমি এর ভাষা কিছুটা পরিবর্তন করব।
ক্রিস এ।

-1

আমি মনে করি উইকিপিডিয়া পোস্টের লেখকরা এলোমেলোভাবে ভুল ধারণা পোষণ করছে। হ্যাঁ, এমন প্রসার থাকতে পারে যা এলোমেলো নয় বলে মনে হয় তবে ক্রমটি তৈরি করা প্রক্রিয়াটি যদি সত্যিই এলোমেলো হয় তবে অবশ্যই আউটপুট হবে। যদি কিছু সিকোয়েন্সগুলি এলোমেলো মনে হয় তবে এটি পাঠকের একটি ভুল ধারণা (যেমন মানুষ নিদর্শনগুলি সন্ধান করার জন্য ডিজাইন করা হয়েছে)। রাতের আকাশে বিগ ডিপার, এবং ওরিয়ন ইত্যাদি দেখার আমাদের দক্ষতা কোনও প্রমাণ নয় যে তারার নিদর্শনগুলি নিতান্ত্রিক। আমি সম্মত হই যে এলোমেলোভাবে প্রায়শই ননর্যান্ডম প্রদর্শিত হয়। যদি কোনও প্রক্রিয়া সংক্ষিপ্ত সিকোয়েন্সগুলির জন্য সত্যিকারের ননর্যান্ডম নিদর্শনগুলি তৈরি করে, তবে এটি কোনও এলোমেলো প্রক্রিয়া নয়।

আমি মনে করি না যে প্রক্রিয়াটি বিভিন্ন নমুনা আকারে পরিবর্তিত হয়। আপনি নমুনা আকার বৃদ্ধি, আপনি সম্ভাবনা বৃদ্ধি যে আমরা একটি এলোমেলো ক্রম দেখতে পাই যা আমাদের কাছে ননর্যান্ডম বলে মনে হয়। যদি 10% এর সম্ভাবনা থাকে তবে আমরা 20 টি র্যান্ডম পর্যবেক্ষণে একটি প্যাটার্ন দেখতে পাবো, মোট পর্যবেক্ষণের সংখ্যা 10000 করে বাড়ানো আমাদের কোথাও কোথাও কোথাও অস্বীকৃতি দেখার সম্ভাবনা বাড়িয়ে তুলবে।


2
"যদি কোনও প্রক্রিয়া সংক্ষিপ্ত সিকোয়েন্সগুলির জন্য সত্যিকারের ননর্যান্ডম নিদর্শন উত্পন্ন করে, তবে এটি কোনও এলোমেলো প্রক্রিয়া নয়", আমি ভীত, সম্পূর্ণ ভুল, উদাহরণস্বরূপ, কোনও ন্যায্য মুদ্রার যে কোনও 100 টি উল্টাপাল্টায়, আমরা প্রত্যাশা করব যে এক সারি ছয়টি মাথা বা ছয়টি লেজ পর্যবেক্ষণ করা - এবং এটি "এলোমেলোভাবে নিখুঁত বিন্যাসের জন্য [একটি] সংক্ষিপ্ত ক্রম" এটি প্রায় এলোমেলো অর্থ। " আমি সন্দেহ করি যে আপনি এমন কিছু লিখতে চেয়েছিলেন যা আরও সতর্কতার সাথে যোগ্য হওয়া দরকার, যেমন "সংক্ষিপ্ত অনুক্রম" এর আগে "সমস্ত" প্রয়োগ করা।
হোবার

সত্যি? আমি ভেবেছি যেহেতু কেউ একটি এলোমেলো সংখ্যা জেনারেটরের কাছ থেকে লেজের মাথার স্ট্রিংগুলি দেখতে প্রত্যাশা করে, আমরা যখন এটি দেখি, তখন অবাক হওয়ার কিছু নেই। কেন এটি ননরানডম হিসাবে বিবেচনা করবেন? যদি এক একটি সংখ্যা উত্পাদক 100 ফ্লিপ করেনি ছিল, এবং সেটিকে উদ্দেশ্যপূর্ণ ভাবেই একটি সারিতে 4 বা তার বেশি মাথা বা মুদ্রার উলটা পিঠ এড়ানো, এটা হবে চেহারা সত্যিই র্যান্ডম প্রক্রিয়া চেয়ে বেশি র্যান্ডম, কিন্তু এটি আসলে nonrandom হবে। এলোমেলোতার একটি নির্দোষ দৃষ্টিভঙ্গি হ'ল সমস্ত নিদর্শনগুলির অভাব - তবে এটি হবে নিতান্ত্রিক।
পি অরাইটাস

আপনার মন্তব্যটি সঠিক, তবে আপনার উত্তরে প্রকাশটি অস্পষ্ট এবং এমনকি এই বিষয়টির সাথে বিরোধী ory উদাহরণস্বরূপ "সংক্ষিপ্ত অনুক্রমের জন্য সত্যিকারের ননর্যান্ডম নিদর্শনগুলি" তৈরি করে বা "ননর্যান্ডমনেস" এর অর্থ কী তা বোঝার জন্য আরও স্পষ্টভাবে ব্যাখ্যা করার বিষয়ে বিবেচনা করুন।
হোবার

আমি কোন বৈপরীত্য দেখতে পাচ্ছি। আপনি মনে করেন যে এলোমেলো জেনারেটর ননর্যান্ডম নিদর্শন তৈরি করে। এটাই দ্বন্দ্ব। আপনি বিতর্ক করছেন যে সত্যিকারের এলোমেলো প্রক্রিয়াগুলি এলোমেলো পর্যবেক্ষণ উত্পন্ন করবে। আপনি যা বর্ণনা করছেন তা কোথাও কিছুকে "ক্লাস্টারিং মায়া" বলা হয়, যা এলোমেলো বিতরণ থেকে ক্লাস্টারগুলিকে ভুলভাবে উপলব্ধি করার প্রবণতা। আমি যা বলছি তা হ'ল কোনও প্রক্রিয়া যদি ননরানডম পর্যবেক্ষণ তৈরি করে তবে তা এলোমেলো নয়। আপনি যুক্তি দিয়েছিলেন যে আপনি একটি এলোমেলো প্রক্রিয়াটি ননরানডম পর্যবেক্ষণের স্ট্রিং তৈরি করার প্রত্যাশা করেন, তবুও আপনি সেই ননরানডমকে কল করেন। অ্যাওফেনিয়ার ক্লাসিক উদাহরণ।
পি ওরিটাস

1
যে কোনও কথার সাথে নিজের অবস্থানের ভুল ব্যবহার করে এমন একজন কথোপকথকের সাথে কথোপকথন চালানো কঠিন, সুতরাং আমি এই বিষয়টির বাইরে চলে যাব। দুঃখিত।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.