কোন দূরত্ব ব্যবহার করতে হবে? যেমন, ম্যানহাটন, ইউক্লিডিয়ান, ব্রা-কার্টিস, ইত্যাদি


11

আমি কোনও সম্প্রদায়ের বাস্তুশাস্ত্র নই, তবে এই দিনগুলিতে আমি সম্প্রদায় বাস্তুবিদ্যার ডেটা নিয়ে কাজ করছি।

এই দূরত্বগুলির গণিত বাদে আমি যা বুঝতে পারি না, তা হ'ল প্রতিটি দূরত্ব ব্যবহারের মানদণ্ড এবং কোন পরিস্থিতিতে এটি প্রয়োগ করা যেতে পারে। উদাহরণস্বরূপ, গণনা ডেটা সহ কী ব্যবহার করবেন? কীভাবে দুটি অবস্থানের মধ্যে opeাল কোণকে দূরত্বে রূপান্তর করা যায়? না দুটি জায়গায় তাপমাত্রা বা বৃষ্টিপাত? প্রতিটি দূরত্বের জন্য অনুমানগুলি কী এবং এটি কখন উপলব্ধি করে?


দূরত্বের মেট্রিকগুলি, তাদের অনুমানগুলি, অর্থ এবং প্রয়োগযোগ্যতা বোঝার নির্ভরযোগ্য উপায় হ'ল তাদের সূত্রগুলিতে ধ্যান করা। আপনি জানেন, তুলনামূলক শারীরবৃত্তিতে বিভিন্ন প্রাণী কীভাবে বাঁচে এবং আচরণ করে তা অনুমান করতে পেরেছিল। এছাড়াও, দূরত্বের মেট্রিক্স সম্পর্কে বই / নিবন্ধগুলি পড়ুন।
ttnphns

2
পেডেন্টিক নোট: ব্রা – কার্টিস কোনও দূরত্ব নয় তবে ভিন্নতা।
ফ্রাঙ্ক ডারননকোর্ট

উত্তর:


13

দুর্ভাগ্যক্রমে, বেশিরভাগ পরিস্থিতিতে আপনার প্রশ্নের কোনও পরিষ্কার উত্তর নেই। এটি হ'ল যে কোনও প্রয়োগের জন্য অবশ্যই অনেকগুলি দূরত্বের মেট্রিক রয়েছে যা অনুরূপ এবং সঠিক উত্তর দেবে। সেখানে কয়েক ডজন এবং সম্ভবত শত শত বৈধ দূরত্বের মেট্রিকগুলি সক্রিয়ভাবে ব্যবহৃত হচ্ছে তা বিবেচনা করে, আপনি "ডান" দূরত্বটি খুঁজে পেতে পারেন এমন ধারণাটি কোনও উপযুক্ত দূরত্বের মেট্রিক নির্বাচন করার সমস্যাটি সম্পর্কে চিন্তাভাবনার উপায় নয়।

আমি পরিবর্তে ভুল দূরত্বের মেট্রিক না বাছাইয়ের দিকে মনোনিবেশ করব । আপনি কি চান যে আপনার দূরত্বটি "পরম মাত্রা" প্রতিফলিত করতে পারে (উদাহরণস্বরূপ, আপনি সমান গড় মূল্য রয়েছে এমন স্টকগুলি সনাক্ত করতে দূরত্বটি ব্যবহার করতে আগ্রহী), বা প্রতিক্রিয়াটির সামগ্রিক আকার প্রতিফলিত করতে (যেমন স্টকের দাম যা সময়ের সাথে একইভাবে ওঠানামা করে, তবে সম্পূর্ণ আলাদা কাঁচা মান থাকতে পারে)? পূর্বের দৃশ্যটি ম্যানহাটান এবং ইউক্লিডিয়ানের মতো দূরত্বকে নির্দেশ করবে, যদিও পরবর্তীকালে পারস্পরিক সম্পর্কের দূরত্ব বোঝানো হবে।

আপনি যদি নিজের ডেটাটির সামঞ্জস্য কাঠামো জানেন তবে মহালানোবিসের দূরত্ব সম্ভবত আরও উপযুক্ত। বিশুদ্ধভাবে শ্রেণিবদ্ধ ডেটার জন্য অনেক প্রস্তাবিত দূরত্ব রয়েছে, উদাহরণস্বরূপ, দূরত্বের সাথে মিলে। মিশ্র শ্রেণিবদ্ধ এবং অবিচ্ছিন্নভাবে গওয়ারের দূরত্ব জনপ্রিয়, (যদিও কিছুটা তাত্ত্বিকভাবে আমার মতে অসন্তুষ্ট হওয়া)।

অবশেষে, আমার মতে আপনার বিশ্লেষণ আরও দৃ be় হবে যদি আপনি দেখান যে আপনার ফলাফল এবং সিদ্ধান্তগুলি দূরত্বের মেট্রিকের নির্বাচনের পক্ষে দৃ appropriate় (যথাযথ দূরত্বের উপসেটের মধ্যে)। যদি আপনার বিশ্লেষণ ব্যবহৃত দূরত্বের মেট্রিকের সূক্ষ্ম পরিবর্তনের সাথে তীব্রভাবে পরিবর্তন হয় তবে অসঙ্গতির কারণ চিহ্নিত করতে আরও অধ্যয়ন করা উচিত।


1
আপনি কি বলতে চাইছেন correlation distance? 1- আর ?
ttnphns

1
1rρ[1,1]cos1(ρ)1ρ22ρpractice

আমার শেষ মন্তব্যের প্রশংসা: ক্রজানোভস্কি (1983)। বায়োমেট্রিকা, 70 (1), 235--243। পৃষ্ঠা 236 দেখুন
আহফফস

1
ঠিক আছে ধন্যবাদ. এছাড়াও চেক করুন এই উত্তর দয়া করে। এটি সত্যই প্রমাণিত করে যে r মানকযুক্ত ডেটা (প্রোফাইলগুলির সাথে তুলনা করা হচ্ছে) -এ প্রাপ্ত ইউক্যালিডিয়ান দূরত্বের সাথে একেবারে সম্পর্কিত, যা reflect overall shape of the responseআপনার কথায় আছে।
ttnphns

1
ভাল পোস্ট। আপনি উল্লেখ হিসাবে দুটি মেট্রিক সত্যই সম্পর্কিত। আপনার আলোচনার জন্য আপনার পয়েন্টগুলিকে প্রাসঙ্গিক করার জন্য, মূল পার্থক্যটি হ'ল ইউক্লিডিয়ান দূরত্বের ভেরিয়েবলগুলি (সাধারণত) কেন্দ্রিক হয় না তবে পারস্পরিক সম্পর্ক সূত্রটি তাদের মানক বিচ্যুতি দ্বারা পরিবর্তনশীল এবং স্কেল কেন্দ্র করে। সুতরাং, পারস্পরিক সম্পর্ক লিনিয়ার ট্রান্সফর্মেশনগুলির জন্য অদ্বিতীয়, অন্যদিকে ইউক্লিডিয়ান দূরত্ব অগত্যা নয়।
আহফসস

6

সঠিক দূরত্ব নির্বাচন করা প্রাথমিক কাজ নয়। যখন আমরা কোনও ডেটা সেটে একটি ক্লাস্টার বিশ্লেষণ করতে চাই, তখন বিভিন্ন দূরত্ব ব্যবহার করে বিভিন্ন ফলাফল উপস্থিত হতে পারে, তাই কোন দূরত্বে নির্বাচন করা উচিত সে সম্পর্কে সতর্কতা অবলম্বন করা খুব গুরুত্বপূর্ণ কারণ আমরা একটি ভ্রান্ত ভাল আর্টফ্যাক্ট তৈরি করতে পারি যা তাত্পর্যকে ভালভাবে ক্যাপচার করতে পারে তবে আসলে ছাড়া আমাদের সমস্যা বোধ।

ইউক্লিডিয় যখন আমি ক্রমাগত সংখ্যাসূচক ভেরিয়েবল আছে এবং আমি পরম দূরত্বের প্রতিফলিত করতে চান দূরত্ব উপযুক্ত। এই দূরত্বটি প্রতিটি ভেরিয়েবলকে বিবেচনা করে এবং অতিরিক্ত কাজগুলি অপসারণ করে না, সুতরাং আমার যদি তিনটি ভেরিয়েবল থাকে যা একই ব্যাখ্যা দেয় (পারস্পরিক সম্পর্কযুক্ত), তবে আমি এই প্রভাবটি তিনটি করে ওজন করব। তদুপরি, এই দূরত্বটি স্কেল অবিস্মরণীয় নয়, তাই সাধারণত দূরত্বটি ব্যবহার করার জন্য আমাকে আগে স্কেল করতে হবে।
উদাহরণ বাস্তুশাস্ত্র: আমাদের অনেক অঞ্চল থেকে বিভিন্ন পর্যবেক্ষণ রয়েছে, যার মধ্যে বিশেষজ্ঞরা কিছু মাইক্রোবায়োলজিকাল, শারীরিক এবং রাসায়নিক উপাদানগুলির নমুনা নিয়েছেন। আমরা বাস্তুতন্ত্রের নিদর্শনগুলি খুঁজতে চাই। এই কারণগুলির একটি উচ্চতর সম্পর্ক রয়েছে তবে আমরা জানি যে প্রত্যেকে প্রাসঙ্গিক, তাই আমরা এই অপ্রয়োজনীয়তাগুলি সরাতে চাই না। আমরা ইউনিটগুলির প্রভাব এড়াতে স্কেলড ডেটা সহ ইউক্লিডিয়ান দূরত্ব ব্যবহার করি।

আমার যখন অবিচ্ছিন্ন সংখ্যাগত পরিবর্তনশীল থাকে এবং আমি পরম দূরত্বকে প্রতিবিম্বিত করতে চাই তবে মহালানোবিসের দূরত্ব যথাযথ we তবে আমরা অপ্রয়োজনীয়তা দূর করতে চাই। যদি আমাদের বারবার পরিবর্তনশীল হয় তবে তাদের পুনরাবৃত্তি প্রভাব অদৃশ্য হয়ে যাবে।

পরিবার Hellinger , প্রজাতি প্রোফাইল এবং জ্যা দূরত্ব উপযুক্ত যখন আমরা ভেরিয়েবল মধ্যে পার্থক্য ওপর গুরুত্ব করার বিষয়ে নিশ্চিত, যখন আমরা প্রোফাইলের পার্থক্য করতে চাই। প্রতিটি পর্যবেক্ষণের মোট পরিমাণ অনুসারে এই দূরত্বগুলির ওজন এইভাবে হয় যে পরিবর্তনশীল দ্বারা পরিবর্তনশীল ব্যক্তিরা আরও বেশি মিলিত হলে দূরত্বগুলি ছোট হয়, যদিও পরম পরিমাপের দিকগুলি ছিল একেবারেই আলাদা। সতর্ক থেকো! এই দূরত্বগুলি প্রোফাইলগুলির মধ্যে পার্থক্যটি খুব ভালভাবে প্রতিফলিত করে, তবে মাত্রার প্রভাবটি হারিয়েছে। যখন আমাদের বিভিন্ন নমুনা আকার থাকে তারা এগুলি খুব কার্যকর হতে পারে।
উদাহরণ বাস্তুশাস্ত্র: আমরা অনেক জমির প্রাণিকুলের অধ্যয়ন করতে চাই এবং আমাদের গ্যাস্ট্রোপডের একটি জায়ের একটি ডাটা ম্যাট্রিক্স রয়েছে (কলামগুলিতে সারি ও প্রজাতির নামের নমুনা তৈরি করা)। ম্যাট্রিক্সটি অনেকগুলি শূন্য এবং বিভিন্ন আকারের দ্বারা চিহ্নিত করা হয় কারণ কিছু অঞ্চলে কিছু প্রজাতি থাকে এবং অন্যদের মধ্যে অন্যান্য প্রজাতি থাকে। আমরা হ্যালিঞ্জার দূরত্ব ব্যবহার করতে পারি।

ব্রা-কার্টিস একেবারে অনুরূপ, তবে আমরা যখন প্রোফাইলগুলি আলাদা করতে চাই এবং তুলনামূলক আকার বাড়িয়ে তুলি তখন এটি আরও উপযুক্ত more


ব্যবহারের কেস এবং উদাহরণগুলি পৃথক করার জন্য আপনাকে ধন্যবাদ। এয়ারো শ্রেণিবদ্ধকরণের মডেলটিকে প্রয়োগ করতে এটি খুব সহায়ক বলে মনে হয়েছে।
এস

4

ম্যানহাটনের দূরত্ব সম্পর্কিত: কাউফম্যান, লিওনার্ড এবং পিটার জে রুসিয়েউ। "ডেটাতে গোষ্ঠী সন্ধান করা: গুচ্ছ বিশ্লেষণের একটি ভূমিকা।" (2005)।

ম্যানহাটনের দূরত্বের ব্যবহার সেই পরিস্থিতিতে ব্যবহারের পরামর্শ দেওয়া হয় যেখানে উদাহরণস্বরূপ প্রথম ভেরিয়েবলের 1 এবং দ্বিতীয় ভেরিয়েবলের 3 এর পার্থক্য প্রথম ভেরিয়েবলের 2 এবং দ্বিতীয়টিতে 2 এর পার্থক্যের সমান হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.