ইউনিট বল থেকে এন নমুনাগুলির উত্সের মধ্যবর্তী নিকটতম বিন্দুর সূত্রের ব্যাখ্যা


12

ইন পরিসংখ্যান শেখার উপাদানসমূহ একটি সমস্যা উচ্চ মাত্রিক স্পেস K-NN সঙ্গে হাইলাইট সমস্যার আবির্ভাব ঘটে। আছে ডাটা পয়েন্টের যে অবিশেষে একটি বিতরণ করা হয় -dimensional ইউনিট বল।পিNp

উত্স থেকে নিকটতম ডেটা পয়েন্টের মাঝারি দূরত্বটি এক্সপ্রেশন দ্বারা দেওয়া হয়:

d(p,N)=(1(12)1N)1p

যখন , সূত্রটি বলের অর্ধেক ব্যাসার্ধকে ভেঙে দেয় এবং আমি দেখতে পাচ্ছি যে কীভাবে নিকটতম পয়েন্টটি সীমান্তের কাছে হিসাবে পৌঁছেছে , ফলে এইভাবে গাঁটের পিছনে অন্তর্দৃষ্টি উচ্চ মাত্রায় বিচ্ছিন্ন হয়ে যায়। তবে আমি বুঝতে পারি না কেন সূত্রটির এন এর উপর নির্ভরতা রয়েছে? কেউ দয়া করে স্পষ্ট করতে পারেন?পি N=1p

এছাড়াও বইটি এই বিষয়টি আরও উল্লেখ করে বলেছে: "... প্রশিক্ষণ নমুনার প্রান্তগুলির নিকটে ভবিষ্যদ্বাণী করা আরও বেশি কঠিন। তাদের অবশ্যই পার্শ্ববর্তী নমুনা বিন্দুগুলির মধ্যবর্তী স্থানে বিচ্ছিন্ন হওয়ার পরিবর্তে স্থানান্তর করতে হবে"। এটি একটি গভীর বিবৃতি বলে মনে হচ্ছে তবে এর অর্থ কী তা আমি বুঝতে পারি না। কেউ মন্তব্য করতে পারে?


1
আপনাকে আপনার প্রদর্শিত সমীকরণটি একটু সম্পাদনা করতে হবে। সেই এক্সপোনেন্টটি কেবলমাত্র টির জন্য এখনকার মতো প্রযোজ্য, নাকি আপনি এটি পুরো প্রয়োগ করতে চান ? 111N112
দিলীপ সরওয়াতে

1
এটি "হাইপারস্পিয়ার" (যা মধ্যে মাত্রা বহুগুণ ) পৃথক করতে সহায়তা করবে "ইউনিট বল" (যা মাত্রা ) থেকে। হাইপারস্পিয়ারটি বলের সীমানা । যদি, আপনার শিরোনাম অনুসারে, সমস্ত পয়েন্ট হাইপারস্পিয়ার থেকে নমুনা করা হয় , তবে - সংজ্ঞা অনুসারে - এগুলির সমস্তটির উত্স থেকে দূরত্ব , মধ্যবর্তী দূরত্ব এবং সমস্ত উত্সের সমানভাবে নিকটে থাকে। পি-1পি11Rpp1p11
হোয়বার

@DilipSarwate পুরো প্রয়োগ করা হয় । বইটিতে এমন একটি উদাহরণ রয়েছে যেখানে তাই এন=500,পি=10ডি(পি,এন)0.5212N=500,p=10d(p,N)0.52
0.5

উত্তর:


9

রেডিয়াস এর একটি মাত্রিক হাইপারবলের ভলিউমটি সমানুপাতিক থাকে ।আর আর পিprrp

সুতরাং উত্স থেকে দূরত্বের বেশি পরিমাণের ভলিউমের অনুপাত হ'ল ।r p - ( k r ) pkrrp(kr)prp=1kp

সম্ভাব্যতা যে সব এলোমেলোভাবে নির্বাচিত পয়েন্ট দূরত্বে থেকেও বেশী উৎপত্তি থেকে । নিকটতম এলোমেলো পয়েন্টের মাঝারি দূরত্বটি পেতে, এই সম্ভাবনাটি সমান করুন । সুতরাংকে আর ( 1 - কে পি ) এন 1Nkr(1kp)N (1-কেপি)এন=112

(1kp)N=12
k=(1121/N)1/p.

স্বজ্ঞাতভাবে এটি কিছু প্রকারের অনুভূতি তৈরি করে: যত বেশি এলোমেলো পয়েন্ট রয়েছে ততই আপনি নিকটবর্তীটির উত্সের নিকটবর্তী হওয়ার প্রত্যাশা করেন, সুতরাং আপনার ক্রমহ্রাসমান ফাংশন হওয়ার প্রত্যাশা করা উচিত । এখানে একটি কমছে ফাংশন , তাই বৃদ্ধি ফাংশন হয় এইভাবে, এবং হয় ক্রমহ্রাসমান ফাংশন যেমন এর ম মূল হয়।এন 2 1 / এন এন 1kN21/NN এন1-1121/NN এনপি1121/NNp


আহ, এটি দেখার দুর্দান্ত উপায়। আপনি আমার দ্বিতীয় প্রশ্নে উদ্ধৃতি পুনরায় ব্যাখ্যা করতে সক্ষম হবে?
ব্যবহারকারী 64773

আমি সন্দেহ করি যে এটি উচ্চ মাত্রায়, পূর্বাভাস দেওয়ার পয়েন্টগুলি কার্যকরভাবে প্রশিক্ষণের তথ্য থেকে একটি দীর্ঘ পথ, যেমন একটি গোলকের কিনারায়, সুতরাং আপনি সত্যই আন্তঃবিবাহ করছেন না বরং এক্সট্রাপোলটিং করছেন, এবং তাই অনিশ্চয়তা অনেক বেশি। তবে আমি আসলে জানি না।
হেনরি

আমি এটি পাই না - কেন আমি বুঝতে পারি যে এই অভিব্যক্তিটি কেআর এর চেয়ে সমস্ত পয়েন্টের সম্ভাবনা বেশি, তবে কেন এই সম্ভাবনাটি 1/2 সেট করা মধ্যবর্তী দূরত্ব দেয় ??
ihadanny

1
@ আইহাদান্নি: মান the ব্যাসার্ধের ভগ্নাংশ দেয় যেখানে সমস্ত পয়েন্ট সম্ভাব্যতা আরও দূরে , এবং সুতরাং যেখানে কমপক্ষে এক বিন্দুটির সম্ভাবনাটি , তাই হ'ল নিকটতম বিন্দুর দূরত্বের বিতরণের মধ্যস্থতা। এন1k=(1121/N)1/pN 1-112 কেআর112=12kr
হেনরি

1
মিডিয়ান সংজ্ঞা, অর্ধেক বড় এবং অর্ধেক ছোট।
গ্রান্ট ইজমিরলিয়ান

1

এবং এখন হাত না

  1. আইআইডি এর যেকোন অনুক্রমের জন্য, যেখানে সাধারণ সিডিএফ

    P(min1iNYi>y)=(1F(y))N,
    F
  2. এভাবে যদি আমরা আছে অবিশেষে বিতরণ IID ইউনিট বল মধ্যে মাত্রা, তারপর যেখানে দূরত্বের সাধারণ সিডিএফ হয়, । অবশেষে, সি , ইউনিট বলের মধ্যে সমানভাবে বিতরণ পয়েন্টের জন্য সিডিএফ, , কী? ইউনিট ব্যাসার্ধের বলের মধ্যে বিন্দুটি ব্যাসার্ধ r এর বলের মধ্যে থাকে বলে সম্ভাবনা:NXip

    P(min1iN||Xi||>r)=(1F(r))N,
    F||Xi||,i=1,2,,NFRp

F(r)=P(||Xi||r)=Crp/(C1p)=rp

এইভাবে সমাধান

1/2=P(min1iN||Xi||>r)=(1rp)N

হয়

r=(1(1/2)1/N)1/p.

নমুনার আকারের উপর নির্ভরতা সম্পর্কে আপনার প্রশ্ন, । জন্য সংশোধন, যেমন বল আরো পয়েন্ট দিয়ে পরিপূর্ণ করে দেয় স্বাভাবিকভাবেই মূল ন্যূনতম দূরত্ব ছোট হয়ে করা উচিত নয়।পিNp

অবশেষে, আপনার ভলিউমের অনুপাতের মধ্যে কিছু ভুল আছে। দেখে মনে হচ্ছে -র ইউনিট বলের ভলিউম ।আর পিkRp


0

সংক্ষিপ্ত হিসাবে তবে কথায়:

আমরা মধ্যমা উৎপত্তি নিকটস্থ বিন্দুর দূরত্ব খুঁজতে চান মধ্যে ইউনিট ব্যাসার্ধ উৎপত্তি এ বল অবিশেষে বিতরণ পয়েন্ট মাত্রা। সংক্ষিপ্ততম দূরত্বটি ছাড়িয়ে যাওয়ার সম্ভাবনাটি (এই পরিমাণটি প্রকাশকে কল করুন [1]) হ'ল সংখ্যার স্বাধীনতার কারণে এককভাবে সমানভাবে বিতরণ করা বিন্দু ছাড়িয়ে যাওয়ার সম্ভাবনার শক্তি । দ্বিতীয়টি হ'ল এক বিয়োগের সম্ভাবনা যা এককভাবে বিতরণ করা বিন্দু চেয়ে কম । আধুনিক ব্যাসার্ধ্যের বলের ভলিউম অনুপাত ইউনিট ব্যাসার্ধ বা বল । আমরা এখন [1] হিসাবে প্রকাশ লিখতে পারিNprNthrrrrp

P(min1iN||Xi||>r)=(1rp)N.

সর্বনিম্ন দূরত্বের বিতরণের মধ্যস্থতাটি সন্ধান করতে উপরের সম্ভাব্যতাটি সেট করুন এবং উত্তরটি প্রাপ্ত করার জন্য সমাধান করুন ।1/2r

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.