পয়েন্টের বৈচিত্র্যকে দেখার জন্য হিটম্যাপ তৈরি করতে কেউ কি কোনও অ্যালগরিদমের পরামর্শ দিতে পারেন? উচ্চ প্রজাতির বৈচিত্র্যের ক্ষেত্রগুলির ম্যাপিংয়ের জন্য উদাহরণ প্রয়োগ হবে। কিছু প্রজাতির জন্য, প্রতিটি উদ্ভিদ ম্যাপ করা হয়েছে, ফলে উচ্চ পয়েন্ট গণনা হয়, তবে অঞ্চলের বৈচিত্র্যের দিক দিয়ে খুব কম অর্থ পাওয়া যায়। অন্যান্য ক্ষেত্রগুলিতে সত্যই উচ্চ বৈচিত্র্য রয়েছে।
নিম্নলিখিত ইনপুট ডেটা বিবেচনা করুন:
x y cat
0.8 8.1 B
1.1 8.9 A
1.6 7.7 C
2.2 8.2 D
7.5 0.9 A
7.5 1.2 A
8.1 1.5 A
8.7 0.3 A
1.9 2.1 B
4.5 7.0 C
3.8 4.0 D
6.6 4.8 A
6.2 2.4 B
2.2 9.1 B
1.7 4.7 C
7.5 7.3 D
9.2 1.2 A
এবং ফলস্বরূপ মানচিত্র:
উপরের বাম চতুর্ভুজগুলিতে একটি উচ্চ বৈচিত্র্যময় প্যাচ রয়েছে, যখন নীচের ডান চতুর্ভুজগুলিতে উচ্চ পয়েন্ট ঘনত্বের ক্ষেত্র রয়েছে তবে নিম্ন বৈচিত্র্য রয়েছে। বৈচিত্র্যটি কল্পনা করার দুটি উপায় হ'ল traditionalতিহ্যবাহী হিটম্যাপ ব্যবহার করা বা প্রতিটি বহুভুতে প্রতিনিধিত্ব করা বিভাগগুলির সংখ্যা গণনা করা। নীচের চিত্রগুলি যেমন দেখায়, এই পদ্ধতির সীমিত ব্যবহার রয়েছে, যেহেতু হিটম্যাপটি নীচের ডানদিকে সর্বাধিক তীব্রতা দেখায়, এবং বাইনিং পদ্ধতির ঠিক একই রকম দেখাবে যদি সেখানে কেবল একটি বিভাগ থাকে (এটি আকারের আকার বাড়িয়ে সম্বোধন করা যেতে পারে) বহুভুজের টুকরো, তবে তারপরে ফলাফলটি অকারণে দানাদার হয়ে যায়)।
এই পদ্ধতির জন্য আমি যে পদ্ধতির কথা ভেবেছিলাম তা হ'ল definedতিহ্যবাহী হিটম্যাপ অ্যালগরিদমকে সংজ্ঞায়িত ব্যাসার্ধের মধ্যে বিভিন্ন বিভাগের পয়েন্ট সংখ্যা দ্বারা প্রাইম করা এবং তারপরে হিটম্যাপ তৈরির সময় সেই সংখ্যাটিকে ওজন হিসাবে বিবেচনা করা। তবে, আমি মনে করি এটি অপ্রয়োজনীয় নিদর্শনগুলির জন্য ঝুঁকিপূর্ণ হতে পারে যেমন পারস্পরিক শক্তিবৃদ্ধি খুব তীক্ষ্ণ ফলাফলের দিকে নিয়ে যায়। এছাড়াও, একই ধরণের ঘনিষ্ঠভাবে ম্যাপ করা পয়েন্টগুলি কেবলমাত্র একই পরিমাণে নয়, উচ্চ ঘনত্ব হিসাবে প্রদর্শিত হতে থাকবে।
আরেকটি পদ্ধতির (সম্ভবত আরও ভাল তবে আরও কম্পিউটারের ব্যয়বহুল) হবে:
- ডেটাসেটে বিভাগের মোট সংখ্যা গণনা করুন
- আউটপুট চিত্রের প্রতিটি পিক্সেলের জন্য:
- প্রতিটি বিভাগের জন্য:
- নিকটতম প্রতিনিধি বিন্দু (r) এর দূরত্ব গণনা করুন [সম্ভবত কিছু ব্যাসার্ধের দ্বারা সীমাবদ্ধ যার প্রভাব ছাড়াই নগণ্য]
- 1 / আর 2 এর সমানুপাতিক ওজন যুক্ত করুন
- প্রতিটি বিভাগের জন্য:
ইতিমধ্যে কি অ্যালগরিদম রয়েছে যা আমি এটি করতে সচেতন নই, বা বৈচিত্র্যকে কল্পনা করার অন্যান্য উপায়গুলি?
সম্পাদন করা
টমিস্লাভ মিউকের পরামর্শ অনুসরণ করে, আমি প্রতিটি বিভাগের জন্য হিটম্যাপগুলি গণনা করেছি এবং নীচের সূত্রটি (কিউজিআইএস রাস্টার ক্যালকুলেটর) ব্যবহার করে এগুলি স্বাভাবিক করেছি:
((heatmap_A@1 >= 1) + (heatmap_A@1 < 1) * heatmap_A@1) +
((heatmap_B@1 >= 1) + (heatmap_B@1 < 1) * heatmap_B@1) +
((heatmap_C@1 >= 1) + (heatmap_C@1 < 1) * heatmap_C@1) +
((heatmap_D@1 >= 1) + (heatmap_D@1 < 1) * heatmap_D@1)
নিম্নলিখিত ফলাফল সহ (তার উত্তরের মন্তব্যসমূহ):