স্ট্যান্ডার্ড বিচ্যুতি 2D এনালগ?


19

নিম্নলিখিত পরীক্ষাটি বিবেচনা করুন: একদল লোককে শহরের একটি তালিকা দেওয়া হবে এবং বিশ্বের কোনও (অন্যথায় লেবেলযুক্ত) মানচিত্রে সংশ্লিষ্ট অবস্থানগুলি চিহ্নিত করতে বলা হয়েছে। প্রতিটি শহরের জন্য, আপনি মোটামুটি সংশ্লিষ্ট শহরে কেন্দ্রীভূত পয়েন্টগুলির একটি বিস্তৃতি পাবেন। মস্কো বলছে, ইস্তাম্বুল বলে কিছু শহর অন্যত্র ছড়িয়ে ছিটিয়ে দেখবে।

আসুন ধরে নেওয়া যাক যে কোনও প্রদত্ত শহরের জন্য, আমরা পরীক্ষার দ্বারা নির্ধারিত মানচিত্রে শহরের ( অবস্থানের (যেমন স্থানীয় কোনও স্থানাঙ্ক পদ্ধতিতে) প্রতিনিধিত্ব করে 2D নমুনার একটি সেট পেয়েছি বিষয় । আমি এই সেটের পয়েন্টগুলির "বিচ্ছুরণের পরিমাণ" যথাযথ ইউনিটগুলিতে (কিমি) একক সংখ্যা হিসাবে প্রকাশ করতে চাই।{(xi,yi)}(x,y)i

1 ডি সমস্যার জন্য, আমি আদর্শ বিচ্যুতিটি বেছে নেব, তবে সেখানে কি 2D এনালগ রয়েছে যা উপরে বর্ণিত হিসাবে যথাযথভাবে পরিস্থিতির জন্য বেছে নেওয়া যেতে পারে?


একটি বিজয় করছেন?
রকসায়েন্স

উদাহরণ হিসাবে দেওয়া স্থানিক ট্যাগটি আমি স্পষ্টতই স্থানিকভাবে যুক্ত করেছি। যদি আপনি (বা অন্য কেউ) মনে করেন যে এটি বিনা বিকাশযুক্ত এই সংযোজনটি ফিরে ঘটাতে পারেন।
অ্যান্ডি ডাব্লু

উত্তর:


12

আপনি যে জিনিসটি ব্যবহার করতে পারেন তা হ'ল কেন্দ্রীয় বিন্দু থেকে দূরত্ব পরিমাপ, , যেমন পয়েন্টগুলির নমুনা গড় , অথবা সম্ভবত পর্যবেক্ষণকৃত পয়েন্টগুলির সেন্ট্রয়েড। তারপরে বিচ্ছুরণের একটি পরিমাপ হবে সেই কেন্দ্রীয় বিন্দু থেকে গড় দূরত্ব:c=(c1,c2)(x¯,y¯)

1ni=1n||zic||

যেখানে । দূরত্ব পরিমাপের জন্য অনেকগুলি সম্ভাব্য পছন্দ রয়েছে তবে আদর্শ (যেমন ইউক্লিডিয়ান দূরত্ব) একটি যুক্তিসঙ্গত পছন্দ হতে পারে: L 2z- রআমি={এক্সআমি,Yআমি}এল2

||z- রআমি-||=(এক্সআমি-1)2+ +(Yআমি-2)2

যদিও অন্যান্য প্রচুর সম্ভাব্য পছন্দ রয়েছে। Http://en.wikedia.org/wiki/Norm_%28mathematics%29 দেখুন


z- রআমি-2

6

পয়েন্ট প্যাটার্নগুলির স্থানিক বিতরণের জন্য মেট্রিকের একটি ভাল রেফারেন্স ক্রাইমস্ট্যাট ম্যানুয়াল (বিশেষত এই প্রশ্নের জন্য, চতুর্থ অধ্যায়টি আগ্রহী হবে)। প্রস্তাবিত মেট্রিক ম্যাক্রোর অনুরূপ, স্ট্যান্ডার্ড দূরত্বের বিচ্যুতি 2D স্ট্যান্ডার্ড বিচ্যুতির অনুরূপ (কেবলমাত্র পার্থক্য হ'ল আপনি ম্যাক্রো প্রদত্ত প্রথম সূত্রে "এন-2" নয় "এন" দ্বারা ভাগ করবেন)।

আপনার উদাহরণ পরীক্ষাটি আমাকে কিছুটা মনে করিয়ে দেয় যে কীভাবে অধ্যয়নগুলি ভৌগলিক অফেন্ডার প্রোফাইলিংকে মূল্যায়ণ করে , এবং সেইজন্য এই কাজগুলিতে ব্যবহৃত মেট্রিকগুলি আগ্রহী হতে পারে। বিশেষত শর্তাবলী নির্ভুলতা এবং নির্ভুলতা বেশ কিছুটা ব্যবহৃত হয় এবং এটি গবেষণার জন্য প্রাসঙ্গিক। অনুমানগুলির মধ্যে একটি ছোট স্ট্যান্ডার্ড বিচ্যুতি থাকতে পারে (অর্থাত্ নির্ভুল) তবে এখনও খুব কম নির্ভুলতা থাকতে পারে have


1

আমি মনে করি ইউক্লিডিয়ান দূরত্বের নিয়মের পরিবর্তে আপনার 'মহালানোবিস দূরত্ব' ব্যবহার করা উচিত, কারণ এটি ডেটা সেটের সম্পর্কটিকে বিবেচনায় নিয়েছে এবং এটি 'স্কেল-ইনভেয়ারেন্ট'। লিঙ্কটি এখানে:

http://en.wikipedia.org/wiki/Mahalanobis_distance

আপনি 'অর্ধ-স্পেস গভীরতা'ও ব্যবহার করতে পারেন। এটি কিছুটা জটিল তবে অনেক আকর্ষণীয় বৈশিষ্ট্য শেয়ার করে। একটি ডেটা সেট পি এর সাথে সম্পর্কিত একটি প্রদত্ত পয়েন্টের অর্ধ স্পেস গভীরতা (এছাড়াও অবস্থান গভীরতা হিসাবেও পরিচিত) হ'ল a এর মাধ্যমে একটি লাইন দ্বারা নির্ধারিত যে কোনও বন্ধ হাফ প্লেনের মধ্যে থাকা প এর নূন্যতম সংখ্যা। লিঙ্কগুলি এখানে:

http: //www.cs।


1
আপনি যখন নির্দিষ্ট পয়েন্টগুলি সেটটির সাথে "অন্তর্গত" কিনা তা জানার চেষ্টা করছেন তখন আমি মহালানোবিসের দূরত্বগুলি ব্যবহার করে বুঝতে পারি, তবে সেন্ট্রয়েড থেকে গড় ইউক্লিডিয়ান দূরত্বটি সাধারণত ভিন্নতা / স্ট্যান্ডার্ড বিচ্যুতি সম্পর্কিত সাধারণ ধারণার সাথে আরও ঘনিষ্ঠভাবে সম্পর্কিত নয় যা একটিতে ব্যবহৃত হয় অবিচ্ছিন্ন সেটিং?
ম্যাক্রো

2
আপনার কি "ডেটার পারস্পরিক সম্পর্কের বিষয়টি বিবেচনায় নেওয়া" এবং "স্কেল ইনগ্রানিয়েন্ট" বিবৃতিগুলি বিশদভাবে জানাতে আপত্তি আছে? এই প্রশ্নগুলির মধ্যে কোনটির হাতে থাকা প্রশ্নটির মধ্যে কোন প্রবণতা রয়েছে?
অ্যান্ডি ডাব্লু

উচ্চ মাত্রায় স্ট্যান্ডার্ড বিচ্যুতির স্বাভাবিক বর্ধন অবশ্যই ডেটা কেন্দ্র থেকে নির্দিষ্ট পয়েন্টের দূরত্ব গণনা করার উপায় - তবে এখানে আমরা প্রতিটি পয়েন্টকে সাধারণীকরণ করছি যা ক্লাস্টার বিশ্লেষণ বা আউটলেট সনাক্তকরণ সম্পাদনকে সহজ করে তোলে। এছাড়াও, মহালানোবিস দূরত্ব এমন ক্ষেত্রে বেশি অভিযোজিত যেখানে পয়েন্টগুলি বিতরণ অ-গোলাকৃতির হয়। গোলাকৃতিরভাবে প্রতিসম ক্ষেত্রে, এটি সাধারণ বর্ধিত স্ট্যান্ডার্ড বিচ্যুতির সমান - যেখানে ডেটা পয়েন্টের কোভারিয়েন্স ম্যাট্রিক্স পরিচয় ম্যাট্রিক্সকে হ্রাস করে।
ভাইটাল স্ট্যাটিসটিক্স

1

আমি আসলে সম্প্রতি একটি একই সমস্যা মধ্যে দৌড়ে। দেখে মনে হচ্ছে আপনি পয়েন্টটি এলাকা-ভিত্তিতে কতটা ছড়িয়ে ছিটিয়ে রয়েছে তা পরিমাপের একটি উপায় চান। অবশ্যই, প্রদত্ত পরিমাপের জন্য, আপনাকে বুঝতে হবে যে যদি সমস্ত পয়েন্টগুলি একটি সরলরেখায় থাকে তবে উত্তরটি শূন্য হয়, যেহেতু 2 মাত্রিক বৈচিত্র নেই।

আমি যে গণনা করেছি তা থেকে, আমি এটাই সামনে এলাম:

এসএক্সএক্সএসYY-এসএক্সY² এর

এই ক্ষেত্রে, এসএক্সএক্স এবং সায় যথাক্রমে x এবং y এর বৈকল্পিক, অন্যদিকে স্কি এক্স এবং y এর মিশ্রিত পরিবর্তনের মতো ধরণের।

বিশদভাবে বোঝার জন্য, সেখানে এন উপাদান রয়েছে এবং x x এর গড় মানকে উপস্থাপন করে এবং y y এর অর্থ উপস্থাপন করে:এক্সμYμ

এসএক্সএক্স=1এনΣআমি=1এন(এক্স-এক্সμ)² এর
এসYY=1এনΣআমি=1এন(Y-Yμ)² এর
এসএক্সY=1এনΣআমি=1এন(এক্স-এক্সμ)(Y-Yμ)

আশা করি এটি আপনার পক্ষে কাজ করবে।

এছাড়াও, যদি আপনি ভাবছেন যে কীভাবে এটি উচ্চ মাত্রায় করা যায় যেমন ভলিউম স্প্রেড পরিমাপ বা 4 মাত্রায় সার্টারন বাল্ক পরিমাপ করা হয় তবে আপনাকে এ জাতীয় একটি ম্যাট্রিক্স গঠন করতে হবে:

Sxx Sxy Sxz ...

সিক্স সাই সাইজ ...

Szx Szy Szz ...

... ... ... ...

এবং আপনার প্রয়োজনীয় অনেকগুলি মাত্রার জন্য চালিয়ে যান। উপরের প্রদত্ত সংজ্ঞাগুলি দেওয়া হলেও আপনি বিভিন্ন ভেরিয়েবলের জন্য এস মানগুলি বের করতে সক্ষম হবেন।

ম্যাট্রিক্সটি তৈরি হয়ে গেলে, নির্ধারকটি ধরুন, বর্গমূলটি সন্ধান করুন এবং আপনি শেষ করেছেন।


0

জন্য এই নির্দিষ্ট উদাহরণ - যেখানে একটি পূর্ব-নির্ধারিত "সঠিক" উত্তর নেই - আমি চাই পুনরায় কাজ এক্স / y পর্যন্ত cooridnates শহর তারা মানচিত্রে চিহ্ন দিতে বলা হচ্ছে প্রায় পোলার স্থানাঙ্ক যাবে। যথার্থতাটি আবার র‌্যাডিয়াল উপাদান (গড়, এসডি ইত্যাদি) মাপা হয়। পক্ষপাত নির্ণয়ের জন্য একটি "গড় কোণ" ব্যবহার করা যেতে পারে।

নিজের জন্য, আমি এখনও পূর্ব-নির্ধারিত কেন্দ্র বিন্দু না থাকায় একটি ভাল সমাধানের সন্ধান করছি এবং সেন্ট্রয়েড তৈরির জন্য ডেটা ছাড়িয়ে প্রাক পাসের ধারণাটি পছন্দ করি না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.