বিভিন্ন স্তর থেকে পয়েন্টের আরও একটি সেটের চারপাশে এক সেট পয়েন্টের গুচ্ছগুলি সন্ধান করছেন?


10

আমি দেখতে চাই যে অন্য ধরণের বিল্ডিংয়ের (y) চারপাশে একটি নির্দিষ্ট ধরণের বিল্ডিংয়ের (x) ক্লাস্টারিং রয়েছে কিনা।

দুটি পয়েন্টের ফাইলগুলি বিভিন্ন স্তরে রয়েছে।

আমি এটি ব্যবহার করতে কোন সরঞ্জামটি ব্যবহার করব তা বুঝতে পারি না cannot

উত্তর:


9

আর্কজিআইএস-এ (বা অন্য কোনও জিআইএস, এএফআইকে) -র বাইরে থাকা কোনও সরঞ্জামই কাজটি সঠিকভাবে করতে পারবে না।

এই জাতীয় সমস্যায় আপনাকে "ক্লাস্টারিং" বলতে কী বোঝায় তা নির্ধারণ করতে হবে এবং তারপরে ক্লাস্টারিংয়ের পরিমাপকৃত ডিগ্রি দুর্ঘটনাক্রমে সম্ভাবনা দ্বারা উত্পাদিত হতে পারে কিনা তা নির্ধারণ করার জন্য আপনাকে একটি সম্ভাবনার মডেল তৈরি করতে হবে।

কীভাবে এগোতে হবে একটি উদাহরণ হিসাবে, আপনি ধরণ ভবন মধ্যে টিপিক্যাল দূরত্বের দিক থেকে ক্লাস্টারিং পরিমাপ চয়ন করতে পারে এক্স এবং নিকটতম ধরনের ভবন Y । এটি একটি সহজ গণনা: কেবল পৃথক পয়েন্ট স্তর দ্বারা উভয় বিল্ডিংয়ের প্রতিনিধিত্ব করুন এবং এক্স এর সাথে Y এর একটি স্থানিক সংযুক্তি সম্পাদন করুন। বৈশিষ্ট্য সারণী, যা এখনও প্রতিটি ধরণের এক্স বিল্ডিংয়ের জন্য একটি রেকর্ড রয়েছে, এখন নিকটতম y এর দূরত্ব অন্তর্ভুক্ত করবে । আপনি আপনার পরিমাপ হিসাবে গড় দূরত্ব ব্যবহার করতে পারেন।

এটি সুযোগের ফলস্বরূপ হতে পারে কিনা তা পরীক্ষা করা আরও জটিল। এই সেটিংটি এক বিশ্বাসযোগ্য ব্যাখ্যা যে আগের উপস্থিতি Y টাইপ ভবন উন্নয়ন উৎসাহিত এক্স টাইপ ভবন অপেক্ষাকৃত পাসে Y এর। অন্যথায়, আমরা অনুমান করতে পারি যে এক্স টাইপ বিল্ডিংগুলি যে কোনও জায়গায় নির্মিত হতে পারে যেখানে অন্যান্য বিল্ডিংগুলি উপস্থিত ছিল। এটি নিম্নলিখিত সাধারণ ক্রমানুসারে পরীক্ষার দিকে নিয়ে যায় । সমস্ত সম্ভাব্য অবস্থানের একটি বিন্দু স্তর তৈরি করুন যেখানে এক্স ধরণের বিল্ডিং উপস্থিত থাকতে পারে। এই স্তরটি হ'ল এক্স হিসাবে একই সময়কালে নির্মিত সমস্ত অঞ্চলের বিল্ডিংগুলির অবস্থানগুলি হতে পারেবিল্ডিংগুলি ছিল ( অবশ্যই এক্স ভবনগুলি নিজেরাই, অবশ্যই)। নিকটতম y টাইপ বিল্ডিংয়ের দূরত্ব পেতে স্থান নির্ধারণে y স্তরটিতে যোগ দিন । বিশিষ্ট টেবিলের বাকী গণনা কাজ করে: ভৌগলিক গণনা সম্পন্ন হয়। আপনি যা করবেন তা বার বার এলোমেলো সংখ্যার জেনারেটর ব্যবহার করে এই সমস্ত বিল্ডিংয়ের একটি সাধারণ এলোমেলো নমুনা নিতে, প্রতিটি নমুনা যেমন আপনার কাছে x টাইপ বিল্ডিং রয়েছে ঠিক তত বেশি উপাদান রয়েছে । এই নমুনার জন্য গড় দূরত্ব গণনা করুন। আপনার অনেক গড়-দূরত্বের পরিসংখ্যান না হওয়া পর্যন্ত পুনরাবৃত্তি করুন। যদি এই প্রায় এলোমেলোভাবে প্রাপ্ত গড় দূরত্বগুলি আপনার x এর জন্য নির্ধারিত গড় দূরত্বের চেয়ে বেশি হয়ভবন টাইপ করুন, আপনি উপসংহারে আসতে পারি যে এক্স এর সুযোগ দ্বারা ক্লাস্টার নয়: প্রভাব বাস্তব।

(এই জাতীয় গণনাগুলি যেমন a আর 'এর মতো উপযুক্ত প্ল্যাটফর্মে সবচেয়ে ভাল প্রোগ্রাম করা হয় তবে প্রায় কোনও কম্পিউটিং সফ্টওয়্যারই পরিষেবাতে এমনকি এক্সেলও চাপানো যেতে পারে The প্রোগ্রামিংটি খুব বেশি, লুপগুলি কীভাবে লিখতে হবে এবং নির্বাচন করতে হবে তা জানার চেয়ে একটু বেশি প্রয়োজন এলোমেলোভাবে অ্যারে থেকে উপাদান।)

এই ক্রমোট পরীক্ষার পদ্ধতির প্রাক-প্রোগ্রামযুক্ত সমাধানগুলির চেয়ে উচ্চতর কারণ এটি স্পষ্টভাবে এই অঞ্চলে বিল্ডিং বিকাশের ধরণের জন্য অ্যাকাউন্ট করে। আপনি যদি এটি না করেন তবে আপনি প্রায়শই গুচ্ছবৃদ্ধির "উল্লেখযোগ্য" প্রমাণ পেয়ে যাবেন , তবে আপনি এ থেকে দরকারী কোনও উপসংহারে পৌঁছাতে পারবেন না, কারণ ক্লাস্টারিং অন্যান্য কারণগুলির কারণে হতে পারে যেমন রাস্তার ধরণগুলি, এর অবস্থানগুলি উন্নয়নের জন্য উপযুক্ত সাইট এবং অন্যান্য অনেকগুলি বিষয়।


1
আমি বুঝতে পারি এই উত্তরটি কিছুটা বিমূর্ত। যখন আমার আরও সময় থাকবে আমি একটি বাস্তব চিত্রণ তৈরি করার চেষ্টা করব।
হুশিয়ার

আর যারা ব্যবহার করছেন তাদের জন্য, আমি ক্লাস্টার বিশ্লেষণের জন্য স্পটস্যাট প্যাকেজ ( cran.r-project.org/web/packages/spatstat/index.html ) দেওয়ার পরামর্শ দিচ্ছি
ওমেনাররা

2

অবশ্যই, আপনার ডেটা বিশ্লেষণ পদ্ধতিটি বিশ্লেষণকে অনুপ্রাণিত করে এমন সংক্ষিপ্ত সমস্যার উপর নির্ভর করবে।

তবে এখানে কিছু ধারণা দেওয়া হল:

ইএসআরআই থেকে:

কীভাবে মাল্টি-ডিস্টেন্স স্পেসিয়াল ক্লাস্টার অ্যানালাইসিস: রিপলির কে-ফাংশন (স্পেসিয়াল স্ট্যাটিস্টিকস) কাজ করে , যেখানে সমীকরণের i এবং j আপনার বিল্ডিংকে x এবং y বোঝাতে পারে। রিপলির কে-ফাংশন সম্ভাব্য অনুভূতি সরবরাহ করবে।

কম্পিউটার বিজ্ঞান থেকে:

সহ-অবস্থানের প্যাটার্ন আবিষ্কারের জন্য জটিল অ্যালগরিদম রয়েছে যা আপনি গুগল করতে পারেন।


"সাধারণ প্লট ধারণা" আকর্ষণীয় তবে এটির সাথে তুলনা করার জন্য আপনার কিছু প্রয়োজন: নিজে থেকে এ থেকে দরকারী তথ্য বের করা কঠিন। রিপলির কে ফাংশনও একটি দরকারী সরঞ্জাম, তবে দুর্ভাগ্যক্রমে অনেক ক্ষেত্রে এটি ডেটাসেটের জ্যামিতিকে প্রতিফলিত করে। শহরতলির বা গ্রামীণ অঞ্চলে ঘরগুলি, যা লিনিয়ার বৈশিষ্ট্যগুলি (রাস্তাগুলি) বরাবর শুয়ে থাকে, কে ফাংশনটি কেবল এই কারণে স্পষ্টভাবে "উল্লেখযোগ্য" গুচ্ছ দেখায়। যেমন এটি রাস্তার নিকটে নির্মিত বাড়িগুলি ছাড়া অন্য কোনও কার্যকর বিষয় প্রকাশ করে না!
হোবার

@ রিপলির কে ফাংশনটির সমস্যার ব্যাখ্যার জন্য প্রথমবারের জন্য ধন্যবাদ। ২ য়, সময়ের সাথে সাথে আমরা যখন শেয়ারের দামের একটি প্লট দেখতে পাই তখন আমরা সাধারণ প্রবণতাগুলি উপরে বা নীচে বা এলোমেলোভাবে অনুসন্ধান করতে পারি, এছাড়াও আমরা বার বার বাছাই করতে পারি যে সেখানে বড় হ্রাস বা বৃদ্ধি ঘটেছিল এবং কেন জিজ্ঞাসা করতে পারি। দূরত্বের পরিবর্তনগুলির সাথে কীভাবে ভবনের ঘনত্ব পরিবর্তিত হয় তার একটি প্লট একই পদ্ধতিতে ব্যবহার করা যেতে পারে। এটি ঘনত্বের মধ্যে স্পাইকগুলি অনুসন্ধান করতে ব্যবহৃত হতে পারে, যা এলোমেলো বিতরণের বিরুদ্ধে প্রমাণ, এছাড়াও এটি কৌতূহলী স্পাইকগুলির আরও তদন্তকে ফোকাস করতে ব্যবহার করা যেতে পারে।
বি_দেব

তুমি ঠিক বলছো. আমার বক্তব্যটি হ'ল প্লটটি নিজেই এবং ক্লাস্টারিংয়ের বিষয়ে আমাদের কিছুই বলে না । সম্ভবত একটি ভাল উপমা (শেয়ারের দামের চেয়ে) মার্কিন যুক্তরাষ্ট্রে 2000-20010 রাজ্য দ্বারা কিডনি ক্যান্সারের সংখ্যার সংক্ষিপ্তসার মানচিত্র। এটিও আমাদের (ভৌগলিক) ক্লাস্টারিং সম্পর্কে কিছুই বলে না কারণ এটি রাষ্ট্রগুলির মধ্যে জনসংখ্যার পরিবর্তনের জন্য অ্যাকাউন্ট করে না। একইভাবে, ক্রস-কে প্লটের ব্যাখ্যাযোগ্য হওয়ার জন্য উপযুক্ত স্বাভাবিককরণ বা রেফারেন্স প্রয়োজন। সাধারণ ট্রেন্ডস, স্পাইকস ইত্যাদি কেবল সমস্ত বিল্ডিং অবস্থানের ভৌগলিক নিদর্শনগুলি প্রতিফলিত করে ।
whuber

@ হুবুহু আপনি ঠিক বলেছেন আপনার উপরের মন্তব্যটি পড়ার পরে, আমি সিদ্ধান্ত নিয়েছি যে আমার সিম্পল প্লট আইডিয়াটি কমপক্ষে যেমন বর্ণিত হয়েছিল তেমন বেশি তথ্য সরবরাহ করবে না, তাই আমি মানুষকে বিভ্রান্ত না করার জন্য এটি সরিয়ে দিয়েছি। আমি এখন বিশ্বাস করি যৌথ গণনা পরিসংখ্যানই সমস্যাটির কাছে যাওয়ার সহজতম পদ্ধতি।
খ_দেব

2

আমি নিজে কখনও জিআইএসে ক্লাস্টার বিশ্লেষণ করিনি, তবে আপনি যদি X এবং / অথবা Y এর প্রদত্ত ক্লাস্টারের প্রতিনিধিত্ব করার জন্য পয়েন্ট / বহুভুজ তৈরি করেন তবে এটি আরও সহজ হতে পারে example উদাহরণস্বরূপ, আপনি যদি ওয়াই বিল্ডিং বোঝানোর জন্য পয়েন্ট তৈরি করেন তবে আপনি তখন আপনার উত্সের অবস্থান থেকে নির্দিষ্ট দূরত্বের মধ্যে এক্স বিল্ডিংয়ের সমস্ত পয়েন্ট পেতে পয়েন্ট দূরত্ব সরঞ্জামটি ব্যবহার করুন ।

অন্যথায়, Y প্রকারের বিল্ডিংয়ের আশেপাশে একটি বাফার তৈরি করা এবং এক্স টাইপের সমস্ত বিল্ডিং নির্বাচন করা যদি আপনার আর্কিফোন না থাকে তবে একই ফলাফল অর্জন করবে।


0

এক্সটি বা ওয়াই থেকে প্রাপ্ত কিনা তা সনাক্ত করতে আপনি বাইনারি কলাম (0,1) যুক্ত করে উভয় স্তরকে একত্রিত করতে পারেন identify

জিওডা ব্যবহার করে সেখান থেকে আপনি স্থানীয় স্থানিক অটো-পারস্পরিক সম্পর্ক (ক্লাস্টারিং) সনাক্ত করতে পারবেন এবং নির্ধারণ করতে পারবেন এটি উচ্চ-নিম্ন (একটি স্তর অন্য স্তরের চারদিকে ক্লাস্টার্ড) নিম্ন-উচ্চ (বিপরীত) বা উচ্চ-উচ্চ বা নিম্ন-নিম্ন (স্ব- ক্লাস্টারিং)। এখানে ব্যবহারকারীর গাইড (.pdf)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.