দুটি সমানভাবে বিতরিত পয়েন্টের মধ্যে প্রত্যাশিত দূরত্বটি কীভাবে খুঁজে পাবেন?


9

আমি স্থানাঙ্ক নির্ধারণ করতে হলে এবং যেখানে(X1,Y1)(X2,Y2)

X1,X2Unif(0,30) and Y1,Y2Unif(0,40).

আমি তাদের মধ্যে দূরত্বের প্রত্যাশিত মানটি কীভাবে খুঁজে পাব?

আমি ভাবছিলাম, যেহেতু দূরত্বটি (X1X2)2+(Y1Y2)2) প্রত্যাশিত মানটি গণনা করা হবে শুধু (1/30 + 1/30) be 2 + (1/40 + 1/40) ^ 2(1/30+1/30)2+(1/40+1/40)2 ?


আপনার ল্যাটেক্স কোডটি সঠিকভাবে উপস্থাপন করছে না। আমি আশা করি আপনি যা স্থির করেছেন তা ঠিক হয়েছে
পিটার ফ্লুম

প্রায়, তবে এটি আমাকে শেষ পর্যন্ত এখানে পেতে সাহায্য করেছিল, অনেক ধন্যবাদ।
ম্যাথলিট

2
গণিত সাইটে সমান প্রশ্ন: একটি আয়তক্ষেত্রের এলোমেলো পয়েন্টগুলির মধ্যে গড় দূরত্ব । একটি সম্পর্কিত প্রশ্ন: একটি আয়তক্ষেত্রে সমানভাবে এলোমেলো পয়েন্টগুলির সম্ভাবনা যা প্রদত্ত প্রান্তিকের চেয়ে ইউক্লিডিয়ান দূরত্ব কম থাকে । (দুর্ভাগ্যক্রমে, আমি সেখানে তার পরামর্শগুলিতে @ সদ্ব্যবহার করার কাছাকাছি যাইনি I'll আমি এটি করার জন্য কিছুটা সময় বের করার চেষ্টা করব))
কার্ডিনাল

1
এই কার্ডগুলির জন্য, @ কার্ডিনাল ধন্যবাদ। যদিও গণিত সংস্করণে উত্তরটি ব্যাখ্যা করা হয়নি - এটি কেবল এটি উপস্থাপন করে - এটিতে একটি উপকরণের লিঙ্ক রয়েছে, যা পর্যালোচনা করার মতো।
whuber

উত্তর:


2
##problem
x <- runif(1000000,0,30)
y <- runif(1000000,0,40)
Uniform <- as.data.frame(cbind(x,y))
n <- nrow(Uniform)
catch <- rep(NA,n)
for (i in 2:n) {
      catch[i] <-((x[i+1]-x[i])^2 + (y[i+1]-y[i])^2)^.5
}
mean(catch, na.rm=TRUE)
18.35855

আপনি যা সন্ধান করছেন তা যদি আমি সঠিকভাবে বুঝতে পারি তবে সম্ভবত এটি সহায়তা করে। আপনি এলোমেলো পয়েন্টগুলির মধ্যে দূরত্বটি বের করার চেষ্টা করছেন, যার এক্স মানগুলি ইউনিট (0,30) থেকে উত্পন্ন এবং ওয়াই মানগুলি একটি ইউনিট (0,40) থেকে উত্পন্ন হয়। আমি কেবল তাদের প্রতিটি থেকে বিতরণে এক মিলিয়ন আরভি তৈরি করেছি এবং এরপরে x এবং y কে আবদ্ধ করে তাদের প্রত্যেকের জন্য একটি বিন্দু তৈরি করেছি। তারপরে আমি পয়েন্ট ১,০০,০০০ থেকে ৯৯৯,৯৯৯ পয়েন্টের মধ্যে সমস্ত দিক 2 এবং 1 এর মধ্যে দূরত্ব গণনা করেছি। গড় দূরত্ব ছিল 18.35855। আপনি যা খুঁজছিলেন তা যদি এটি না হয় তবে আমাকে জানান।


ফর্ম্যাটিংয়ের জন্য সম্পাদনা করার স্বাধীনতা নিয়েছে।
কৌতূহলী_কাট

2
আপনি মোটামুটি কাছাকাছি এসেছিলেন - সম্ভবত সুযোগ দ্বারা। আসল উত্তরটি হ'ল = । আপনার কোড দুটি সমস্যা আছে: (1) পুনরাবৃত্তি পারস্পরিক স্বতন্ত্র নয়; এবং (2) যুক্তিসঙ্গত নির্ভুলতা পেতে, এটি দ্রুত হওয়ার জন্য কোডিং করা উচিত। সরাসরি হিসাবে সিমুলেশন না কেন । যে হিসাবে আপনি মান ত্রুটি কম্পিউটিং দ্বারা পরীক্ষা করতে পারবেন, চার উল্লেখযোগ্য পরিসংখ্যান (কম সময়) সম্পর্কে আপনি পাবেন । 1108(871+960log(2)+405log(3))18.345919n <- 10^7; distance <- sqrt((runif(n,0,30)-runif(n,0,30))^2 + (runif(n,0,40)-runif(n,0,40))^2)sd(distance) / sqrt(n)
শুক্র

@ শুভঃ আপনি কি আপনার # 1 ব্যাখ্যা করতে পারেন? উদাহরণস্বরূপ বলুন (কেস -২) আমি কোনও প্রদত্ত বিতরণ এবং গণনা করা পার্থক্য থেকে এলোমেলো সংখ্যার জোড়া আঁকলাম এবং একটি অর্থ গ্রহণ করেছি। ভারসাস (কেস -২) আমি একবারে একটি সংখ্যা আঁকতে থাকি এবং শেষ সংখ্যাটির সাথে সম্পর্কিত চলমান পার্থক্য গণনা করতে থাকি এবং তারপরে গড় গড়ে। কেস -২ এবং কেস -২ দ্বারা প্রতিবেদন করা গড় কি পদ্ধতিগতভাবে আলাদা হবে?
কৌতূহলী_কাট

1
@ কুরিয়াস_ক্যাট না, গড় প্রায় একই রকম হবে: তবে স্ট্যান্ডার্ড ত্রুটির গণনা আলাদা হবে। আমাদের কতটা কাছাকাছি আসল মানটি সম্ভবত আসবে সম্ভবত এটি অনুমান করার জন্য সেই গণনা প্রয়োজন। আরও জটিল এসই গণনাটি কার্যকর করার পরিবর্তে, একে অপরের সম্পূর্ণ স্বতন্ত্রভাবে জোড়া পয়েন্টগুলি উত্পন্ন করা সহজ, প্রশ্নটিতে ঠিক যেমনটি নির্ধারিত। (সিমুলেশনটি ভুল হতে পারে এমন অনেকগুলি উপায় রয়েছে - আমি অভিজ্ঞতা থেকে জানি! - সিমুলেশনটি যতটা সম্ভব ঘনিষ্ঠভাবে বাস্তবের নকল করা বুদ্ধিমানের কাজ।)
শুভ

@ শুভ: স্পষ্ট করার জন্য ধন্যবাদ। সুতরাং, ক্লার্ক যদি তার কোডটি বেশি দিন চালাতেন তবে তিনি সম্ভবত আরও দশমিক স্থান অর্জন করতে পারতেন?
কৌতূহলী_কাট

16

জ্যামিতিকভাবে প্রশ্নটি দেখলে বোঝা যায় যে উত্তল সেটের মধ্যে দুটি স্বতন্ত্র, অভিন্ন, এলোমেলো পয়েন্টের মধ্যে প্রত্যাশিত দূরত্বটি এর ব্যাসের চেয়ে কিছুটা কম হতে চলেছে । (এটি কম হওয়া উচিত কারণ এটি দুটি পয়েন্টের জন্য তুলনামূলকভাবে বিরল যেখানে কোণগুলির মতো চরম অঞ্চলে অবস্থিত এবং প্রায়শই ক্ষেত্রে তারা কেন্দ্রের নিকটে থাকবে, যেখানে তারা নিকটে রয়েছে।) যেহেতু এই আয়তক্ষেত্রটির ব্যাস , সুতরাং একা যুক্তি দিয়ে আমরা উত্তরটি চেয়ে একটু কম বলে আশা করব ।5025

দূরত্বের সম্ভাবনা-ওজনযুক্ত মান হিসাবে প্রত্যাশার সংজ্ঞা থেকে একটি সঠিক উত্তর পাওয়া যায়। সাধারণভাবে, দিক এবং একটি আয়তক্ষেত্র বিবেচনা করুন ; আমরা পরে এটি সঠিক আকার পর্যন্ত স্কেল করব ( এবং প্রত্যাশা দ্বারা গুণ করে )। এই আয়তক্ষেত্রের জন্য, স্থানাঙ্কগুলি ব্যবহার করে , অভিন্ন সম্ভাবনার ঘনত্ব হ'ল । এই আয়তক্ষেত্রের মধ্যে গড় দূরত্বটি পরে দেওয়া হয়1λλ=40/3030(x,y)1λdxdy

0λ010λ01(x1x2)2+(y1y2)21λdx1dy11λdx2dy2.

প্রাথমিক ইন্টিগ্রেশন পদ্ধতিগুলি ব্যবহার করা এটি করা সহজবোধ্য তবে বেদনাদায়ক; উত্তরটি পাওয়ার জন্য আমি একটি কম্পিউটার বীজগণিত সিস্টেম ( গণিত ) নিযুক্ত করেছি

[2+2λ521+λ2+6λ21+λ22λ41+λ2+5λArcSinh(λ)+5λ4log(1+1+λ2λ)]/(30λ2).

এর মধ্যে অনেকগুলি ক্ষেত্রে of এর উপস্থিতি বিস্ময়কর নয়: এটি আয়তক্ষেত্রের ব্যাস (এর মধ্যে যে কোনও দুটি পয়েন্টের মধ্যে সর্বোচ্চ সম্ভাব্য দূরত্ব)। লোগারিদমগুলির উপস্থিতি (যার মধ্যে অর্কসিংহ রয়েছে) এছাড়াও উদ্বেগজনক নয় যদি আপনি কখনও সহজ বিমানের পরিসংখ্যানগুলির মধ্যে গড় দূরত্বগুলি অনুসন্ধান করেন: কোনওভাবে এটি সর্বদা প্রদর্শিত হয় (এটির একটি ইঙ্গিতটি সেকেন্ট ফাংশনের অবিচ্ছেদ্য হিসাবে উপস্থিত হয়)। ঘটনাক্রমে, ডিনোমিনেটরে এর উপস্থিতি এবং আয়তক্ষেত্রের সাথে জড়িত সমস্যার সুনির্দিষ্টতার সাথে কোনও সম্পর্কযুক্ত নয় : এটি সর্বজনীন ধ্রুবক।)1+λ2303040

সঙ্গে এবং একটি গুণক দ্বারা স্কেলিং আপ , এই মূল্যায়ণ ।λ=4/3301108(871+960log(2)+405log(3))18.345919


আরও গভীরভাবে অবস্থা বুঝতে ওয়ান ওয়ে গড় দূরত্ব প্লটে বিভক্ত হয় আপেক্ষিক ও ব্যাসের মান তারতম্য জন্য । চূড়ান্ত মানগুলির জন্য ( চেয়ে বেশি বা চেয়ে অনেক বেশি ), আয়তক্ষেত্রটি মূলত এক-মাত্রিক হয়ে যায় এবং আরও প্রাথমিক একীকরণ ইঙ্গিত দেয় যে গড় দূরত্বটি ব্যাসের এক-তৃতীয়াংশ হ্রাস করা উচিত। এছাড়াও, যেহেতু এবং সহ আয়তক্ষেত্রগুলির আকারগুলি একই, তাই ফলটি লোগারিডমিক স্কেলে তৈরি করা স্বাভাবিক , যেখানে এটি প্রায় (বর্গক্ষেত্র) প্রতিসাম্যযুক্ত হওয়া উচিত । এটা এখানে:1+λ2λ01λ1/λλλ=1

পটভূমি

এর সাহায্যে আমরা থাম্বের একটি নিয়ম শিখি : একটি আয়তক্ষেত্রের মধ্যবর্তী গড় দূরত্বটি এর ব্যাসের এবং (প্রায়) মধ্যে হয়, স্কোয়ারিশ আয়তক্ষেত্রের সাথে যুক্ত বৃহত্তর মান এবং লম্বা চর্মসার সাথে যুক্ত ছোট মানগুলি (লিনিয়ার) ) আয়তক্ষেত্র এই চরমের মধ্যবর্তী পয়েন্টটি অনুপাতের অনুপাতযুক্ত আয়তক্ষেত্রগুলির জন্য প্রায় অর্জন করা হয় । এই নিয়মটি মাথায় রেখে আপনি কেবল একটি আয়তক্ষেত্রের দিকে ঝলক দেখতে পারেন এবং এর গড় দূরত্বটি দুটি উল্লেখযোগ্য চিত্রের থেকে অনুমান করতে পারেন ।1/30.330.373:1


এটি কি "ব্যাস" এর পরিবর্তে "তির্যক" হওয়া উচিত? আমি নিটপিক করছি যদি দুঃখিত।
কৌতূহলী_কাট

@ কুরিয়াস_ক্যাট সংজ্ঞা অনুসারে, বিন্দুগুলির সেটগুলির ব্যাস (যে কোনও মেট্রিক স্পেসে) এর যে কোনও দুটি পয়েন্টের মধ্যে দূরত্বের আধিক্য। একটি আয়তক্ষেত্রের জন্য এটি ত্রিভুজটির দৈর্ঘ্য (স্পষ্টতই)।
whuber

ধন্যবাদ! আমি যে বুঝতে পারছি না। আমি ব্যাস একটি নিষ্পাপ ধারণা ব্যবহার করছিলাম।
কৌতূহলী_কাট

একদিকে যেমন: প্রদত্ত অঞ্চলের সমস্ত আয়তক্ষেত্রের জন্য বর্গক্ষেত্রের জন্য গড় দূরত্বটি হ্রাস করা হবে?
কৌতূহলী_কাট

2
আত্মা এই , আমি তোমাকে সঙ্গে "এটা এই উত্তরটি শুরু হতো ইচ্ছুক সমতল ..." (+1 টি)
অঙ্কবাচক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.