আরটি ব্যবহার করে ল্যাট / লম্বা জোড় থেকে পয়েন্টের গ্রুপ তৈরি করছেন?


11

আমার কাছে একটি ডাটাবেস রয়েছে যাতে আগ্রহের পয়েন্টগুলির অবস্থান সনাক্ত করতে ল্যাট / লং জোড়া রয়েছে। আমি আগ্রহের পয়েন্টগুলি 10 টি গ্রুপে গ্রুপ করতে চাই The গ্রুপটি ভৌগলিকভাবে স্থানীয় হওয়া উচিত এবং ঠিক 10 পয়েন্ট থাকা উচিত। প্রতিটি গ্রুপের ন্যূনতম অঞ্চল হওয়া উচিত।

আমি আর এর বিভিন্ন বাস্তবায়ন দেখেছি কিন্তু এর মধ্যে কোনওটিই (যা আমি দেখতে পাচ্ছি) আপনাকে একটি নির্দিষ্ট ক্লাস্টারের আকার নির্দিষ্ট করার অনুমতি দেয় না।

আমি পূর্বে স্থির ক্লাস্টার আকারে মানচিত্রের পয়েন্টগুলি গোছানো জিজ্ঞাসা করেছি ? তবে আমি মনে করি না যে আমি ভাল উত্তর পেতে আমার প্রশ্নে যথেষ্ট সঠিক ছিলাম।


ভৌগলিকভাবে স্থানীয় - আমার মনে হয় আমার অর্থ এই যে গ্রুপগুলি উল্লেখযোগ্যভাবে ওভারল্যাপ করা উচিত নয়। আমার অ্যাপ্লিকেশনটিতে (নিরীক্ষণের উদ্দেশ্যে দলগুলিতে লোকদের বরাদ্দ করা) প্রতিটি গ্রুপ শারীরিক ক্ষেত্রে যতটা সম্ভব ছোট ছিল এটি আদর্শ হবে।
সর্বনিম্ন এলাকা - আবারও, গ্রুপ অঞ্চলটি সর্বনিম্ন রাখার চেষ্টা করছে। আমি মনে করি এটি প্রতিটি গ্রুপের ক্ষেত্রকে একটি নির্দিষ্ট প্রান্তিকের নীচে রাখার মতো পরিমাণে নির্ধারণ করা যেতে পারে (কয়েক ডজন ছোট গ্রুপ এবং একটি বড় একটি এড়াতে)।


2
আপনি যা সন্ধান করছেন এটি কিছুটা সুনির্দিষ্ট হতে সহায়তা করবে। আপনি কীভাবে "ভৌগোলিকভাবে স্থানীয়" এবং "সর্বনিম্ন অঞ্চল" মাপবেন?
হোবল

কিছু পরিস্থিতিতে, "ন্যূনতম অঞ্চল" এবং "ঠিক 10 পয়েন্ট" পারস্পরিক একচেটিয়া হবে না? আপনি উভয়কে কীভাবে ব্যবহার করতে পারবেন, উদাহরণস্বরূপ, আপনার কাছে 1 মাইল "ন্যূনতম অঞ্চল", এবং 1 টি বৈশিষ্ট্য রয়েছে যার 10 মাইলের মধ্যে কোনও বৈশিষ্ট্য নেই (একটি বহিরাগত, সম্ভবত)?
রায়ানকডালটন

আমি আশা করি কিছু ব্যতিক্রম হবে তবে এগুলি ম্যানুয়ালি মোকাবেলা করা যেতে পারে। আমার একটি স্থির আকারের ডেটা সেট রয়েছে এবং কয়েকটি গ্রুপে ম্যানুয়ালি ফিড করতে আপত্তি নেই, তবে আমি সত্যিই বাকীগুলির জন্য একটি স্বয়ংক্রিয় সমাধান চাই :)
গ্রিম হিল্টন

সম্পর্কিত: gis.stackexchange.com / ক্র্যাশনস / 15906/…
whuber

বর্ণনাটি এখনও "হ্যান্ড-ওয়েভি" একটি স্বয়ংক্রিয় পদ্ধতিতে সমাধানযোগ্য solve আপনি কি ডেটা পাবলিক করতে পারবেন?
ব্র্যাডহার্ডস

উত্তর:


1

আমি মনে করি আপনি সম্ভবত কে-নিকটতম প্রতিবেশী সরঞ্জামটি সন্ধান করছেন। আপনার ডেটাসেটের সমস্ত পয়েন্টের 10 নিকটতম প্রতিবেশী সনাক্ত করতে এই ধরণের সরঞ্জাম ব্যবহার করা যেতে পারে। এর জন্য কয়েকটি পৃথক বিকল্প রয়েছে বলে মনে হচ্ছে (কিছু বিভিন্ন অ্যালগোরিদম ব্যবহার করে বা কিছুটা ভিন্ন কার্যকারিতা সহ) এবং আমি নিশ্চিত নই যে কোনটি সেরা বিকল্প হবে। তবে এখানে কয়েকটি লিঙ্ক দেওয়া হল:

http://stat.ethz.ch/R-manual/R-patched/library/class/html/knn.html http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/ শ্রেণিবদ্ধকরণ / কেএনএন

অল্প সংক্ষেপে ওভারল্যাপ নেই এমন পয়েন্টগুলির শ্রেণিবিন্যাসে পেতে পয়েন্টের ক্লাস্টারগুলির অনুরূপ সেট রয়েছে এমন পয়েন্টগুলির ক্লাস্টারগুলি সনাক্ত করতে আপনাকে ক্লাস্টারিং অ্যালগরিদম বা ক্লাস্টার এনসেম্বল সরঞ্জামের সাথে ফলাফলগুলি একত্রিত করার প্রয়োজন হতে পারে। আউটপুটটির সাথে আপনাকে কিছুটা ম্যানুয়াল ফিডলিং করার প্রয়োজন হতে পারে তবে এটি আপনাকে কাজের একটি বড় অংশ স্বয়ংক্রিয় করতে দেয়

কিছু লিঙ্ক: http://jmlr.csail.mit.edu/papers/volume3/strehl02a/strehl02a.pdf http://cran.r-project.org/web/packages/clue/vignettes/clue.pdf

আপনি একটি কে-মানে ক্লাস্টারিং সরঞ্জামও সন্ধান করতে পারবেন যা এই সমস্ত পদক্ষেপ এক ধাপে করবে এবং একটি ক্লাস্টার নিয়মে 10 পয়েন্ট কার্যকর করবে (কেবলমাত্র পয়েন্টের মোট সংখ্যা 10 দ্বারা বিভক্ত করুন এবং এটি পছন্দসই ক্লাস্টারের সংখ্যা হিসাবে নির্বাচন করুন) যন্ত্রটি).


এছাড়াও, আমি ইআরআই টিউটোরিয়ালটি আর এর জন্য সহায়ক পেয়েছি: ahandel.myweb.uga.edu/resources.htm
জিজিবেলে
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.