পয়েন্টের বৈচিত্র্যটি কল্পনা করতে হিটম্যাপ অ্যালগরিদম


18

পয়েন্টের বৈচিত্র্যকে দেখার জন্য হিটম্যাপ তৈরি করতে কেউ কি কোনও অ্যালগরিদমের পরামর্শ দিতে পারেন? উচ্চ প্রজাতির বৈচিত্র্যের ক্ষেত্রগুলির ম্যাপিংয়ের জন্য উদাহরণ প্রয়োগ হবে। কিছু প্রজাতির জন্য, প্রতিটি উদ্ভিদ ম্যাপ করা হয়েছে, ফলে উচ্চ পয়েন্ট গণনা হয়, তবে অঞ্চলের বৈচিত্র্যের দিক দিয়ে খুব কম অর্থ পাওয়া যায়। অন্যান্য ক্ষেত্রগুলিতে সত্যই উচ্চ বৈচিত্র্য রয়েছে।

নিম্নলিখিত ইনপুট ডেটা বিবেচনা করুন:

x    y      cat
0.8  8.1    B
1.1  8.9    A
1.6  7.7    C
2.2  8.2    D
7.5  0.9    A
7.5  1.2    A
8.1  1.5    A
8.7  0.3    A
1.9  2.1    B
4.5  7.0    C
3.8  4.0    D
6.6  4.8    A
6.2  2.4    B
2.2  9.1    B
1.7  4.7    C
7.5  7.3    D
9.2  1.2    A

এবং ফলস্বরূপ মানচিত্র:

গ্রিড প্লট

উপরের বাম চতুর্ভুজগুলিতে একটি উচ্চ বৈচিত্র্যময় প্যাচ রয়েছে, যখন নীচের ডান চতুর্ভুজগুলিতে উচ্চ পয়েন্ট ঘনত্বের ক্ষেত্র রয়েছে তবে নিম্ন বৈচিত্র্য রয়েছে। বৈচিত্র্যটি কল্পনা করার দুটি উপায় হ'ল traditionalতিহ্যবাহী হিটম্যাপ ব্যবহার করা বা প্রতিটি বহুভুতে প্রতিনিধিত্ব করা বিভাগগুলির সংখ্যা গণনা করা। নীচের চিত্রগুলি যেমন দেখায়, এই পদ্ধতির সীমিত ব্যবহার রয়েছে, যেহেতু হিটম্যাপটি নীচের ডানদিকে সর্বাধিক তীব্রতা দেখায়, এবং বাইনিং পদ্ধতির ঠিক একই রকম দেখাবে যদি সেখানে কেবল একটি বিভাগ থাকে (এটি আকারের আকার বাড়িয়ে সম্বোধন করা যেতে পারে) বহুভুজের টুকরো, তবে তারপরে ফলাফলটি অকারণে দানাদার হয়ে যায়)।

তাপ মানচিত্র এখানে চিত্র বর্ণনা লিখুন

এই পদ্ধতির জন্য আমি যে পদ্ধতির কথা ভেবেছিলাম তা হ'ল definedতিহ্যবাহী হিটম্যাপ অ্যালগরিদমকে সংজ্ঞায়িত ব্যাসার্ধের মধ্যে বিভিন্ন বিভাগের পয়েন্ট সংখ্যা দ্বারা প্রাইম করা এবং তারপরে হিটম্যাপ তৈরির সময় সেই সংখ্যাটিকে ওজন হিসাবে বিবেচনা করা। তবে, আমি মনে করি এটি অপ্রয়োজনীয় নিদর্শনগুলির জন্য ঝুঁকিপূর্ণ হতে পারে যেমন পারস্পরিক শক্তিবৃদ্ধি খুব তীক্ষ্ণ ফলাফলের দিকে নিয়ে যায়। এছাড়াও, একই ধরণের ঘনিষ্ঠভাবে ম্যাপ করা পয়েন্টগুলি কেবলমাত্র একই পরিমাণে নয়, উচ্চ ঘনত্ব হিসাবে প্রদর্শিত হতে থাকবে।

আরেকটি পদ্ধতির (সম্ভবত আরও ভাল তবে আরও কম্পিউটারের ব্যয়বহুল) হবে:

  1. ডেটাসেটে বিভাগের মোট সংখ্যা গণনা করুন
  2. আউটপুট চিত্রের প্রতিটি পিক্সেলের জন্য:
    • প্রতিটি বিভাগের জন্য:
      • নিকটতম প্রতিনিধি বিন্দু (r) এর দূরত্ব গণনা করুন [সম্ভবত কিছু ব্যাসার্ধের দ্বারা সীমাবদ্ধ যার প্রভাব ছাড়াই নগণ্য]
      • 1 / আর 2 এর সমানুপাতিক ওজন যুক্ত করুন

ইতিমধ্যে কি অ্যালগরিদম রয়েছে যা আমি এটি করতে সচেতন নই, বা বৈচিত্র্যকে কল্পনা করার অন্যান্য উপায়গুলি?

সম্পাদন করা

টমিস্লাভ মিউকের পরামর্শ অনুসরণ করে, আমি প্রতিটি বিভাগের জন্য হিটম্যাপগুলি গণনা করেছি এবং নীচের সূত্রটি (কিউজিআইএস রাস্টার ক্যালকুলেটর) ব্যবহার করে এগুলি স্বাভাবিক করেছি:

((heatmap_A@1 >= 1) + (heatmap_A@1 < 1) * heatmap_A@1) +
((heatmap_B@1 >= 1) + (heatmap_B@1 < 1) * heatmap_B@1) +
((heatmap_C@1 >= 1) + (heatmap_C@1 < 1) * heatmap_C@1) +
((heatmap_D@1 >= 1) + (heatmap_D@1 < 1) * heatmap_D@1)

নিম্নলিখিত ফলাফল সহ (তার উত্তরের মন্তব্যসমূহ): স্বাভাবিক অঙ্ক


1
আপনার দ্বিতীয় পদ্ধতির ঠিক আছে বলে মনে হচ্ছে, এটি বেশিরভাগই একটি পরিসংখ্যানের সমস্যা, তাই আমি CRAN এ সম্পর্কিত আর রুটিনগুলি সন্ধান শুরু করব । যদিও বিভিন্ন গ্রিড মাপের সাথে পরীক্ষা করবে এবং চাকাটি পুনরায় উদ্ভাবন এড়ানোর জন্য জীববৈচিত্র্যের 'অফিসিয়াল' পদক্ষেপগুলি সন্ধান করবে।
হরিণ হান্টার

উত্তর:


4

প্রতিটি পৃথক বিভাগের জন্য হিটম্যাপ তৈরির চেষ্টা করুন।

তারপরে হিটম্যাপগুলি যোগ করুন এবং বিভাগগুলির সংখ্যা ব্যবহার করে এটিকে সাধারণ করুন।

এটি অন্বেষণে মূল্যবান হতে পারে।


এই পরামর্শের উপর ভিত্তি করে আমি আমার প্রশ্নের মধ্যে একটি ভিজ্যুয়ালাইজেশন যুক্ত করেছি, এবং ফলাফলটি ভাল দেখাচ্ছে! অসুবিধাটি হ'ল আপনি যদি শত বা হাজার হাজার বিভাগ নিয়ে কাজ করে থাকেন তবে ra সমস্ত রাস্টারদের সংরক্ষণ করা একটি সমস্যা হয়ে দাঁড়াবে।
rudivonstaden

এটি ভাবার জন্য আসুন, আপনি প্রতিটি বিভাগের পরে সংযুক্ত হিটম্যাপে প্রতিটি নতুন হিটম্যাপ যুক্ত করলে সমস্যা হবে না। প্রশ্নটি এরপরে কোন পদ্ধতির প্রয়োগ করতে কম্পিউটারের দ্রুততর হবে - রাস্টার অঙ্কগুলি বা পিক্সেল-বাই-পিক্সেল গণনা।
rudivonstaden

আমি ভয় করি যে এই উত্তরটির বৈচিত্র্যের সাথে কোনও সম্পর্ক নেই। ফলস্বরূপ যোগফল (এবং সাধারণকরণ) এর মধ্যে একাধিক গ্রুপের একটি খুব ঘন অঞ্চলটি ঘন হিসাবে নয় তবে একটি গোষ্ঠীর সাথে একই অঞ্চল হিসাবে দেখাবে।
অ্যান্ডি ডব্লু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.