আমার ভিজ্যুয়ালাইজ করার জন্য আমার কিছু ডেটা রয়েছে এবং কীভাবে এটি করা যায় তা নিশ্চিত নয়। আমার কাছে বেস আইটেমগুলির কিছু সেট আছে respective সম্পর্কিত ফ্রিকোয়েন্সি এবং । এখন আমাকে আমার পদ্ধতিটি কীভাবে খুব কম ফ্রিকোয়েন্সি আইটেমগুলি "সন্ধান করে" (অর্থাত্ 1-ফলাফল) ভালভাবে প্লট করতে হবে। আমার প্রথমদিকে পয়েন্ট-প্লটগুলির সাথে ফ্রিকোয়েন্সিটির এক্স অক্ষ এবং 0-1 এর অক্ষ ছিল, তবে এটি ভয়ঙ্কর লাগছিল (বিশেষত দুটি পদ্ধতির ডেটার সাথে তুলনা করার সময়)। অর্থাৎ প্রতিটি আইটেম ফলাফল (0/1) থাকে এবং এর ফ্রিকোয়েন্সি অনুসারে অর্ডার করা হয়।এফ = { চ 1 , ⋯ , চ এন } হে ∈ { 0 , 1 } এন কুই ∈ প্রশ্ন
একটি একক পদ্ধতির ফলাফলের সাথে এখানে উদাহরণ রয়েছে:
আমার পরবর্তী ধারণাটি ছিল অন্তরগুলিতে ডেটা বিভক্ত করা এবং অন্তরগুলির সাথে স্থানীয় সংবেদনশীলতা গণনা করা, তবে এই ধারণার সমস্যাটি হ'ল ফ্রিকোয়েন্সি বিতরণ অগত্যা অভিন্ন নয়। তাহলে আমি কীভাবে সেরা অন্তরগুলি বাছাই করব?
বিরল (যেমন, খুব কম-ফ্রিকোয়েন্সি) আইটেমগুলি খুঁজে পাওয়ার কার্যকারিতা চিত্রিত করতে এই ধরণের ডেটা ভিজ্যুয়ালাইজ করার আরও ভাল / আরও কার্যকর উপায় সম্পর্কে কি কেউ জানেন?
সম্পাদনা: আরও কংক্রিট হতে, আমি একটি নির্দিষ্ট জনগোষ্ঠীর জৈবিক ক্রম পুনর্গঠন করার জন্য কিছু পদ্ধতির সক্ষমতা প্রদর্শন করছি। সিমুলেটেড ডেটা ব্যবহার করে যাচাইয়ের জন্য, এর প্রাচুর্য (ফ্রিকোয়েন্সি) নির্বিশেষে আমাকে বৈকল্পিকগুলির পুনর্গঠন করার দক্ষতা দেখাতে হবে। সুতরাং এই ক্ষেত্রে আমি মিস করেছি এবং খুঁজে পাওয়া আইটেমগুলি তাদের ফ্রিকোয়েন্সি অনুসারে ভিজ্যুয়ালাইজ করছি। এই প্লটটিতে পুনর্গঠিত রূপগুলি অন্তর্ভুক্ত করবে না যা ।