আরে ক্লাস্টারিং স্থানিক ডেটা


12

আমার কাছে সমুদ্র পৃষ্ঠের তাপমাত্রা (এসএসটি) মাসিক ডেটার একটি সেট রয়েছে এবং আমি অনুরূপ এসএসটি নিদর্শনগুলির সাথে অঞ্চলগুলি সনাক্ত করতে কিছু ক্লাস্টার পদ্ধতি প্রয়োগ করতে চাই। আমার কাছে 1985 থেকে 2009 অবধি চলমান মাসিক ডেটা ফাইলগুলির একটি সেট রয়েছে এবং প্রথম পদক্ষেপ হিসাবে প্রতি মাসে ক্লাস্টারিং প্রয়োগ করতে চাই।

প্রতিটি ফাইলে 358416 পয়েন্টের জন্য গ্রিডড ডেটা থাকে যেখানে প্রায় 50% জমি হয় এবং এটি 99.99 মানের চিহ্নযুক্ত যা এনএ হবে। ডেটা ফর্ম্যাটটি হ'ল:

   lon     lat   sst
-10.042  44.979  12.38
 -9.998  44.979  12.69
 -9.954  44.979  12.90
 -9.910  44.979  12.90
 -9.866  44.979  12.54
 -9.822  44.979  12.37
 -9.778  44.979  12.37
 -9.734  44.979  12.51
 -9.690  44.979  12.39
 -9.646  44.979  12.36

আমি ক্লারা ক্লাস্টারিং পদ্ধতিটি চেষ্টা করেছি এবং কিছু দৃশ্যত দুর্দান্ত ফলাফল পেয়েছি তবে এটি আমার কাছে মনে হয় যা কেবলমাত্র গোষ্ঠীকরণ (গ্রুপিং) আইসলাইনস। তাহলে আমি নিশ্চিত নই যে স্থানিক ডেটা বিশ্লেষণের জন্য এটিই সেরা ক্লাস্টারিং পদ্ধতি।

এই জাতীয় ডেটাসেটগুলির জন্য উত্সর্গীকৃত অন্য কোনও ক্লাস্টারিং পদ্ধতি রয়েছে কি? কিছু রেফারেন্স পড়া শুরু করা ভাল হবে।

আগাম ধন্যবাদ.


2
আপনার cran.r-project.org/web/views/Spatial.html পরীক্ষা করা উচিত । এমন কয়েকটি প্যাকেজ রয়েছে যার নামেই ক্লাস্টার রয়েছে যা সম্ভবত আগ্রহী হবে।
অ্যান্ডি ডব্লিউ

ক্লাস্টার স্পেসিয়াল ডেটাতে আপনি কোনও ভাল আর প্যাকেজ পেয়েছেন?
কাপ্তান

@kaptan দুর্ভাগ্যবশত আমি না এবং এটি এক
pacomet

(x,y,T)R3R

উত্তর:


2

স্কেলেবল ক্লাস্টারিং, ডিভাইড এবং বিজয় পদ্ধতির জন্য সমান্তরাল ক্লাস্টারিং এবং ইনক্রিমেন্টাল একেক পদ্ধতির রয়েছে। আপনি সাধারণ ক্লাস্টারিং পদ্ধতি ব্যবহার করার পরে এটি সাধারণ পদ্ধতির জন্য। আমি সত্যিই প্রশংসিত ক্লাস্টারিংয়ের একটি ভাল পদ্ধতি হ'ল ডিবিএসসিএন (আওয়াজ সহ অ্যাপ্লিকেশনগুলির ঘনত্ব-ভিত্তিক স্পেসিয়াল ক্লাস্টারিং) এটি সর্বাধিক ব্যবহৃত ক্লাস্টারিং অ্যালগরিদমের মধ্যে একটি।


ঠিক আছে, আমি ডিবিএসসিএএন সন্ধান করব এবং চেষ্টা করব। ধন্যবাদ
প্যাসোমেট

যদি কোনও উত্তর আপনাকে সহায়তা করে বা আপনি অন্য কোনও উপায় খুঁজে বের করেন তবে আমাদের দেওয়া আরও ভাল so অথবা প্রশ্নটি বন্ধ করার জন্য একটি উত্তর চয়ন করুন, thx।
404 ড্রিমার_এমএম

আমি উত্তর দিতে বিলম্বের জন্য দুঃখিত, তবে মূল বিষয়টি হ'ল আমি ডাবসস্ক্যান চেষ্টা করার জন্য খুব বেশি সময় পাইনি এবং প্রথম প্রয়াসের ফলে মেমরির সমস্যা দেখা দিয়েছে। আর বলছে এটি ভেক্টর বরাদ্দ করতে পারে না। আমি 4 কিলোমিটার ব্যবধানযুক্ত গ্রিড দিয়ে 779191 পয়েন্ট দিয়ে শুরু করি যা জমি (বৈধ নয়) এসএসটি পয়েন্টগুলি সরিয়ে দেওয়ার সময় 300000 পয়েন্টে শেষ হয়। হয়তো আমি সঠিক পন্থা পাচ্ছি না, কোনও ইঙ্গিত প্রশংসা করা হবে।
প্যাসোমেট

1
হাই, আমি এখনও কোনও সমাধান খুঁজে পাচ্ছি না। আমি ডিবিএসসিএন সম্পর্কে কিছু ডক্স পড়েছি এবং এ সম্পর্কে কিছু প্রশ্ন রয়েছে। আর এর সাথে নূন্যতম দূরত্ব কীভাবে পাওয়া যাবে? যেহেতু আমার ডেটা ত্রি-মাত্রিক দ্রাঘিমাংশ, অক্ষাংশ এবং তাপমাত্রা, তাই আমার কোন "দূরত্ব" ব্যবহার করা উচিত? যে দূরত্বটির সাথে কোন মাত্রা সম্পর্কিত? তাপমাত্রা? গুচ্ছের জন্য সর্বনিম্ন পয়েন্টের সংখ্যা নির্ধারণের জন্য কি কোনও পদ্ধতি আছে? গুগল অনুসন্ধান করে আমি আমার মতো ডেটাসেটে ডাবসক্যান ব্যবহারের জন্য আর উদাহরণ খুঁজে পাইনি, আপনি কি এই জাতীয় উদাহরণ সহ কোনও ওয়েবসাইট জানেন? সুতরাং আমি পড়তে পারি এবং আমার ক্ষেত্রে খাপ খাইয়ে নিতে চেষ্টা করতে পারি। আবার ধন্যবাদ
প্যাসোমেট

0

স্থানিক বিশ্লেষণের জন্য একটি সুন্দরভাবে ডকুমেন্টেড পাইথন লাইব্রেরি যেখানে কিছু ক্লাস্টারিং রয়েছে তা পাইসাল

ডেভলপমেন্ট স্টেজের আরেকটি পাইথন লাইব্রেরি যা স্থানিক ক্লাস্টারিংয়ের উপর দৃষ্টি নিবদ্ধ করে তা হ'ল ক্লাস্টারপি (পিডিএফ স্লাইড উপস্থাপনা)

ক্লাস্টারিং অ্যালগোরিদমগুলির আরও সীমিত পছন্দের সাথে তবে দুর্দান্ত ম্যাপিং ইন্টারফেসের সাথে জিইউআই সফ্টওয়্যার জিওগ্রোপার


ধন্যবাদ, আমি পাইথন নিয়ে কখনও কাজ করি নি। আমি একটি আর সমাধান সন্ধান করার চেষ্টা করব
6:51
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.