কার্নেল ঘনত্বের উপর ভিত্তি করে ক্লাস্টার পয়েন্টগুলি কীভাবে করবেন?


10

আমার কাছে বাণিজ্যিক জমির ব্যবহারের প্রতিনিধিত্বকারী 36 কে পয়েন্ট সহ একটি বড় ডেটাসেট রয়েছে, প্রতিটি বর্গ ফুটেজযুক্ত ক্ষেত্র সহ। আমি এই ডেটাসেটে একটি কার্নেল ঘনত্ব বিশ্লেষণ চালিয়েছি, পুরো মেট্রো অঞ্চল জুড়ে বাণিজ্যিক স্কোয়ার ফুটেজের ঘনত্ব দেখানোর জন্য একটি রাস্টার তৈরি করেছি। আমার এই রাস্টারটিকে স্থানীয় ম্যাক্সিমার সাথে সম্পর্কিত অঞ্চলে বিভক্ত করা দরকার, যা আমি "কেন্দ্র" বলি। আমি ইতিমধ্যে কেন্দ্রগুলির অবস্থানগুলি নির্ধারণ করেছি এবং এখন আমাকে দুটি কাজের একটি করতে হবে:

  • আমি চিহ্নিত কেন্দ্রগুলির আশেপাশে ক্লাস্টারে পয়েন্টগুলি গ্রুপ করার জন্য একটি পয়েন্ট ক্লাস্টারিং টুল ব্যবহার করুন, যেমন "মেডোইডগুলির চারপাশে বিভাজন"। এই পদ্ধতির সমস্যাটি হ'ল এটি গণনাগতভাবে তীব্র এবং এরপরে আরও বেশি যদি আমি পয়েন্টগুলি আকার অনুযায়ী ওজন করতে একটি ভিন্নতা ম্যাট্রিক্স ব্যবহার করার চেষ্টা করি।

  • যে কোনওভাবে কার্নেলের ঘনত্ব রাস্টারকে (যা প্রায় কোনও ভূখণ্ডের রাস্টার অনুরূপ) প্রতিটি কেন্দ্রের চারপাশে পৃথক "পাহাড়" এর মধ্যে ভাগ করে নিন। তবে আমি এটি করার জন্য কোনও সরঞ্জামের কথা ভাবতে পারি না।

এই সমস্যাটি আমাকে কিছু সময়ের জন্য জর্জরিত করেছে, এবং আমি আশা করেছি যে আমি আর-তে ক্লাস্টারিং পদ্ধতিটি সম্পাদন করতে সক্ষম হব, তবে এটি সময় সাপেক্ষ এবং আমি সময়সীমার বাইরে চলে আসছি। ঘনত্বের রাস্টারগুলিকে তীব্রতার আশেপাশের অঞ্চলে ভাগ করার জন্য বা দ্রুত বড় ডেটাসেটগুলি দ্রুত গুচ্ছ করার জন্য কেউ কি সহজ পদ্ধতি জানেন?


1
এই প্রশ্নটি নিবিড়ভাবে সম্পর্কিত: stats.stackexchange.com/questions/13995/…
হোবার

1
এবং আমার পোস্টও, যেমন এটি দেখা যাচ্ছে।
প্যাট্রিক

আমার মনে হয় প্যাট্রিকের কাছে এটি 1 পিটি হবে .....
বিউইল

উত্তর:


6

একটি ঘনিষ্ঠভাবে সম্পর্কিত পোস্টের পরে আলোচনার ফলে একটি সহজ, কার্যকর সমাধান প্রকাশিত হয়েছে : "পাহাড়" সন্ধান করার জন্য, গ্রিডটিকে উল্টে ডাউন করুন (এর মূল্যবোধকে উপেক্ষা করে) এবং জলাশয়গুলি সন্ধান করুন। পাহাড়গুলি ডুবে গেছে এবং জলাবদ্ধতার সীমানা গ্রিডকে সেই ডুবে ভাগ করে দেয়।


এই সমাধানটি সহজ, দ্রুত এবং ঠিক আমি যা খুঁজছিলাম is ধন্যবাদ।
প্যাট্রিক

3

সবচেয়ে সহজ উত্তর হ'ল প্রান্তিকের নীচে পড়া অঞ্চলগুলি মুখোশের জন্য একটি প্রান্তিক ব্যবহার করা। এটি আপনাকে আপনার কেন্দ্রগুলির চারপাশে স্বতন্ত্র অঞ্চল দিতে হবে। তারপরে সেই অঞ্চলগুলিকে আকারে রূপান্তর করতে সক্ষম হওয়া উচিত।

আপনি স্থানিক পরিসংখ্যান সরঞ্জামগুলিও খুঁজে পেতে পারেন : রাস্টার ডেটাতে ক্লাস্টারিং বিশ্লেষণ একই ধরণের সমস্যার কার্যকর আলোচনা।


হ্যাঁ, এটি একটি খুব প্রাসঙ্গিক আলোচনা! আমি আপনার এমএসসি থিসিসের মাধ্যমে পড়ছি এবং কয়েকটি পদ্ধতির চেষ্টা করব।
প্যাট্রিক 14 ই

2
থ্রেশহোল্ড ব্যবহার করা সম্ভবত এখানে কাজ করবে না, কারণ আমি তত্ক্ষণাত সংলগ্ন অন্যান্য কেন্দ্রগুলি থেকে কেন্দ্রগুলি পৃথক করার চেষ্টা করছি। সিটি কোরে, দুজনের সীমানার খুব বেশি ঘনত্ব থাকবে তবে শহরতলির সীমানায় এর ঘনত্ব খুব কম থাকবে। তবে আমি আশা করছি যে দ্বিতীয় ডেরাইভেটিভ ব্যবহার কার্যকর হবে।
প্যাট্রিক 14 ই

3

আমার মনে হয় আপনার প্রাথমিক সমস্যার দিকে ফিরে যাওয়া উচিত: একটি সম্পূর্ণ মেট্রো অঞ্চলে বাণিজ্যিক স্কোয়ার ফুটেজের ক্লাস্টার সন্ধান করুন।

আমি ধরে নিচ্ছি যে আপনার পয়েন্টগুলি স্কোয়ার ফুটেজের মান সহ পার্সেলের সেন্ট্রয়েড? আমি ধরে নিলাম আপনার কাছে প্রতিটি পার্সেলের মোট স্কোয়ার ফুটেজ সহ পার্সেলের বহুভুজ স্তরও থাকতে পারে? এটি আপনাকে স্কয়ার ফুটেজ বাণিজ্যিক এবং স্কোয়ার ফুটেজের জন্য যথাক্রমে কেস সেট (সেন্ট্রয়েড) এবং একটি জনসংখ্যা (পার্সেল বহুভুজ) দেয়।

স্যাটস্ক্যান http://www.satscan.org/ ধরুন এবং কেবলমাত্র পয়সন-বিতরণ মডেল চালান এবং আপনার বাণিজ্যিক স্কোয়ার ফুটেজ ক্লাস্টারগুলি খুব দ্রুত ক্রমে পাবেন। (আপনি জমির স্কোয়ার ফুটেজগুলি আপনার জনসংখ্যা হিসাবে বাড়ির জায়গার স্কোয়ার ফুটেজের চেয়েও ব্যবহার করতে পারেন That এটি আরও ভাল জনসংখ্যা হতে পারে))


আপনি ঠিক বলেছেন যে পয়েন্টগুলি সেন্ট্রয়েড, তবে দুর্ভাগ্যক্রমে ডেটাসেটটি প্রতিটি কাউন্টির পার্সেল স্তর থেকে অন্যরা সংগ্রহ করেছিলেন এবং কেবল পয়েন্ট হিসাবে বিতরণ করেছিলেন। তবে স্যাটস্ক্যানটি দেখতে বেশ কার্যকর সফটওয়্যারটির মতো, তাই আমি অন্যান্য অ্যাপ্লিকেশনগুলির জন্য মনে রাখব না।
প্যাট্রিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.