2 ডি স্কোয়ারে পয়েন্ট বিতরণের অভিন্নতা পরিমাপ করুন


11

আমার 2 ডি স্কোয়ার রয়েছে এবং এর ভিতরে আমার পয়েন্টগুলির একটি সেট রয়েছে, বলুন, 1000 পয়েন্ট। স্কোয়ারের ভিতরে পয়েন্টগুলির বিতরণ ছড়িয়ে পড়েছে (বা আরও বা কম অভিন্নভাবে বিতরণ করা হয়েছে) বা তারা স্কয়ারের অভ্যন্তরের কোনও স্থানে একত্রিত হওয়ার জন্য ঝোঁক দিচ্ছে কিনা তা দেখার জন্য আমার একটি উপায় প্রয়োজন।

এটি নির্ধারণ করার জন্য আমার গাণিতিক / পরিসংখ্যান (প্রোগ্রামিং নয়) উপায় দরকার। আমি গুগল করেছিলাম, ফিটের মতো ধার্মিকতা, কলমোগোরভ ইত্যাদির মতো কিছু পেয়েছি এবং এটি অর্জনের জন্য অন্যান্য উপায় আছে কিনা তা অবাক করেছিলাম। ক্লাস পেপারের জন্য এটি দরকার।

ইনপুটস: একটি 2 ডি স্কোয়ার এবং 1000 পয়েন্ট। আউটপুট: হ্যাঁ / না (হ্যাঁ = সমানভাবে ছড়িয়ে পড়েছে, না = কিছু স্পটে একত্রিত হওয়া)।


1
আপনার জন্য "ইউনিফর্মলি বিতরণ" কী তা আপনি নির্দিষ্টভাবে উল্লেখ করতে পারেন নি। আপনার অর্থ কি সমানভাবে টাইলড 2 ডি ইউনিফর্ম কিউব বা অন্য কিছু? উদাহরণস্বরূপ, পয়েন্টের সমানভাবে ব্যবধানে চেইন? বা পয়েন্ট একটি বৃত্ত? এক অর্থে, এই পরিসংখ্যানগুলিও অভিন্ন স্প্রেড।
ttnphns

3
@ttnphns এই প্রসঙ্গে, "ইউনিফর্ম" এর একটি সুপ্রতিষ্ঠিত প্রচলিত অর্থ রয়েছে। এটি ধ্রুবক তীব্রতার সাথে একটি পোইসন প্রক্রিয়াটির সাথে সম্পর্কিত। এটা প্রায়ই হিসাবে "সিএসআর 'নামে পরিচিত সম্পূর্ণরূপে স্থানিক র্যান্ডম
whuber

2
@ ভ্যান আপনি "স্থানিক পয়েন্ট প্রক্রিয়াগুলি" গবেষণা করতে চান। ভাল কীওয়ার্ডগুলির মধ্যে "রিপলে কে ফাংশন," "সিএসআর", এবং "পইসন" অন্তর্ভুক্ত রয়েছে। আপনার জন্য একটি অ্যাক্সেসযোগ্য রেফারেন্স হবে ও'সুলিভান এবং আনউইন, ভৌগলিক তথ্য বিশ্লেষণ। একটি ক্লাসিক হ'ল রিপলি, স্পেসিয়াল স্ট্যাটিস্টিকস : এটি পয়েন্ট প্রক্রিয়াগুলিতে আলোকপাত করে। অ্যাপ্লিকেশনগুলির জন্য ক্রাইমস্ট্যাটটি একবার দেখুন । আপনি যদি স্বাচ্ছন্দ্য বোধ করেন Rতবে এই কাজের জন্য প্রচুর সরঞ্জাম রয়েছে
হোবার

উত্তর:


5

আমি মনে করি @ জন এর চি = স্কোয়ার পরীক্ষা সম্পর্কে ধারণাটি যাওয়ার এক উপায়।

আপনি 2-ডি তে প্যাচগুলি চাইবেন, তবে আপনি 1 উপায় চি-স্কোয়ার পরীক্ষা ব্যবহার করে তাদের পরীক্ষা করতে চান; অর্থাৎ কক্ষগুলির জন্য প্রত্যাশিত মানগুলি যেখানে কোষ সংখ্যা N।1000এন

তবে এটি সম্ভব যে বিভিন্ন সংখ্যক কোষ বিভিন্ন উপসংহার দেয়।

আরেকটি সম্ভাবনা হ'ল পয়েন্টগুলির মধ্যে গড় দূরত্ব গণনা করা এবং তারপরে এটিকে সেই গড়ের সিমুলেটেড ফলাফলের সাথে তুলনা করা। এটি একটি নির্বিচার সংখ্যক কোষের সমস্যা এড়ায়।

সম্পাদনা (গড় দূরত্বে আরও)

1000 পয়েন্ট সহ, পয়েন্টগুলির মধ্যে 2 জোড়াযুক্ত দূরত্ব। এগুলির প্রত্যেককে গণনা করা যেতে পারে (ইউক্লিডিয়ান দূরত্ব ব্যবহার করে)। এই দূরত্বগুলি গড়ে নেওয়া যায়।1000*9992

তারপরে আপনি সমানভাবে বিতরণ করা 1000 পয়েন্টের সেটগুলির N (একটি বিশাল সংখ্যক) উত্পাদন করতে পারেন। এই সমস্ত এন সেটগুলির পয়েন্টগুলির মধ্যেও গড় দূরত্ব রয়েছে।

প্রকৃত পয়েন্টগুলির জন্য ফলাফলগুলি সিমুলেটেড পয়েন্টগুলির সাথে তুলনা করুন, হয় পি-মান পেতে বা কেবল কোথায় পড়েছে তা দেখার জন্য।


আমি একমত যে এক-নমুনা চি-স্কোয়ার ("চুক্তি চি-স্কোয়ার পরীক্ষা") যুক্তিসঙ্গত উপায়গুলির মধ্যে একটি। তবে আপনি কী আপনার "অ্যাভারেজ দূরত্ব" প্রস্তাবটি আরও বিস্তারিতভাবে বর্ণনা করতে পারেন? আমি বেশ বুঝতে পারিনি।
ttnphns

@ এনটিএনএফএনএস, স্থানিক বিশ্লেষণে যেগুলি ব্যবহৃত হয় তা হ'ল নিকটতম প্রতিবেশী পরীক্ষা (ওরফে ক্লার্ক এবং ইভান্স পরীক্ষা), বা রিপলির কে K উদাহরণগুলির জন্য আর লাইব্রেরি স্প্যাটস্যাট বা ক্রাইমস্ট্যাট ডকুমেন্টেশন দেখুন । সিমুলেশন ভিত্তিক আর একটি সম্ভাবনা হ'ল "স্ক্যান" পরীক্ষা, কিন্তু এগুলি গড় দূরত্বের ভিত্তিতে নয়।
অ্যান্ডি ডব্লিউ

3

আর একটি সম্ভাবনা চি-স্কোয়ার্ড পরীক্ষা। বর্গক্ষেত্রকে সমান আকারের নন-ওভারল্যাপিং প্যাচগুলিতে বিভক্ত করুন, এবং অভিন্নতার অনুমানের অধীনে তাদের প্রত্যাশিত গণনার বিরুদ্ধে প্যাচগুলিতে পড়ার পয়েন্টগুলির সংখ্যা পরীক্ষা করুন (প্যাচটির জন্য প্রত্যাশা মোট_পয়েন্টগুলি / মোট_প্যাচগুলি যদি তারা সমান আকারের হয় তবে) , এবং চি-স্কোয়ার্ড পরীক্ষা প্রয়োগ করুন। 1000 পয়েন্টের জন্য 9 টি প্যাচ পর্যাপ্ত হওয়া উচিত তবে আপনার ডেটা কেমন দেখাচ্ছে তার উপর নির্ভর করে আপনি আরও গ্রানুলারিটি ব্যবহার করতে চাইতে পারেন।


1
আমি মনে করি আপনি কিছু চাই তবে ফিট চি-স্কোয়ারের সদ্ব্যবহারের সাথে প্রতিটি কোষের প্রকৃত গণনাগুলির তুলনায় সমান কোষগুলির একটি প্রত্যাশিত গণনা যা আপনি চান তা হবে। কোনও কন্টিনজেন্সি টেস্ট ব্যবহার করে পরীক্ষা করা হবে না যদি আপনার কক্ষগুলির মধ্যে অভিন্ন বিতরণ হয় তবে কেবল সারিটি কলামের উপর নির্ভরশীল।
জন

এছাড়াও, চি-স্কোয়ার পরীক্ষা কেবলমাত্র আপনাকে বলবে যে আপনি নির্বাচিত কক্ষগুলিতে তারা অভিন্ন না থাকলে। তারা অভিন্ন কিনা তা আপনাকে জানায় না।
জন

হ্যাঁ আমি বোঝাচ্ছিলাম তাদের প্রত্যাশিত গণনাগুলির বিরুদ্ধে গণনাগুলির অকার্যমান অনুমানের অধীনে, আমার ক্ষমা যদি এটি পরিষ্কার না হয়। আপনি কেবল এটি একটি টেবিল হিসাবে ভিজ্যুয়ালাইজ করতে পারেন যা নিরবিচ্ছিন্নদের জন্য কী চলছে তা বুঝতে সহায়তা করে! এবং স্পষ্টতই আপনি বিমূর্ত অর্থে অভিন্নতার চেয়ে আপনি যে কোষগুলি নির্বাচন করেছেন তার বিরুদ্ধে পরীক্ষার মধ্যে সীমাবদ্ধ
বেন অ্যালিসন

@ জন, সাধারণত যখন কেউ এই "বিচ্ছুরণ পরীক্ষা" করেন তখন সাধারণত কেউ দ্বিপক্ষীয় পরীক্ষা করেন। যদি আপনি যদি দেখতে চান যে প্যাটার্নটি সম্ভাবনা অনুসারে প্রত্যাশার চেয়ে আরও অভিন্ন ছিল তবে আপনি কেবল দেখতে চাই যে চি-স্কোয়ার পরীক্ষাটি বিতরণের বাম লেজের মধ্যে পড়েছে কিনা (আপনি যা পছন্দ কাট অফে পছন্দ করেন)।
অ্যান্ডি ডব্লিউ

অ্যান্ডি, আপনার এমন একটি উত্তর সরবরাহ করা উচিত যা ফিট টেস্টের এই দ্বি-পার্শ্বীয় মঙ্গলভাবের বিবরণ দেয়। সাধারণত দুটি পার্শ্বযুক্ত পরীক্ষা কেবল শূন্যের জন্য দুটি পৃথক বিকল্প পরীক্ষা করে তবে এখনও নাল প্রদর্শন করতে পারে না। আপনার প্রস্তাব আকর্ষণীয়।
জন

1

কোলমোগোরভ-স্মারনভ পরীক্ষা কেন ব্যবহার করবেন না? আমি এটাই করব, বিশেষত বিবেচনা করে যে আপনার নমুনার আকারটি বিদ্যুতের অভাবের জন্য ক্ষতিপূরণ দেওয়ার জন্য যথেষ্ট বড়।

বিকল্পভাবে, আপনি কিছু সিমুলেশন করতে পারেন। এটি কঠোর নয়, তবে ডেটা সমানভাবে বিতরণ করা হয়েছে কিনা সে সম্পর্কে এটি কিছু প্রমাণ দেয়।


@ হুবুহু কেএস-এর দ্বি-মাত্রিক এক্সটেনশন সুবিদিত ( এখানে দেখুন )। এই ক্ষেত্রে, আমরা অনুসন্ধান করতে যাচ্ছি যে এই 1000 টি অঙ্কগুলি (স্থানাঙ্ক (এক্স, ওয়াই) দ্বি-মাত্রিক যৌথভাবে ইউনিফর্ম বিতরণ থেকে আঁকতে পারে - কমপক্ষে আমি কীভাবে "সমানভাবে ছড়িয়ে পড়েছি" তা পড়ি। @ জন আমি সম্ভবত আড়ম্বরপূর্ণভাবে প্রকাশ করেছি (গণিত বা ইংরেজি আমার প্রথম ভাষা নয়)। আমার অভিপ্রায়টি হ'ল যে পি-মানটি কেএস এর মতো পরীক্ষার সাহায্যে গণনা করা যেতে পারে, যেখানে পি-মান (বা আপনি যেটিকে সমতুল্য বলুন) সিমুলেশনগুলি করার সময় কেবল অ্যাসিপোটোটিকভাবেই থাকে।


সিমুলেশন কেন কঠোর হবে না?
জন

1
আপনি কী ব্যাখ্যা করতে পারছেন যে কেএস পরীক্ষা - যা অবিচ্ছিন্ন র্যান্ডম ভেরিয়েবলের আইআইডি ফলাফল হিসাবে গণ্য করা আসল সংখ্যার সেটগুলির উদ্দেশ্যে করা হয় - এই স্থানিক ডেটাসেটের ক্ষেত্রে কীভাবে প্রয়োগ করা হবে ?
হোবার

@ শুভ আমি আপনার প্রতিক্রিয়াটির জন্য উত্তর দেওয়ার চেষ্টা করার জন্য আমার উত্তর সম্পাদনা করেছি। সেরা।
আবৌমান

@ জন আমি বোঝাতে চেয়েছি আমি কী বোঝাতে চাইছি। সেরা।
আবউমান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.