আমি কিছু জিনোমিক কভারেজ ডেটা পরীক্ষা করছি যা মূলত পূর্ণসংখ্যার দীর্ঘ তালিকা (কয়েক মিলিয়ন মান), প্রতিটি জিনোমে এই অবস্থানটি কতটা ভাল (বা "গভীর") আচ্ছাদিত তা বলেছে।
আমি এই ডেটাতে "উপত্যকাগুলি" সন্ধান করতে চাই, অর্থাত্ যে অঞ্চলগুলি আশেপাশের পরিবেশের তুলনায় উল্লেখযোগ্যভাবে "নিম্ন"।
দ্রষ্টব্য যে আমি যে উপত্যকাগুলি খুঁজছি তার আকার 50 টি বেস থেকে কয়েক হাজার পর্যন্ত হতে পারে।
এই উপত্যকাগুলি খুঁজতে আপনি কোন ধরণের দৃষ্টান্ত ব্যবহারের পরামর্শ দিচ্ছেন?
হালনাগাদ
তথ্যের জন্য কিছু গ্রাফিকাল উদাহরণ:
আপডেট 2
একটি উপত্যকা কী তা সংজ্ঞায়িত করা অবশ্যই আমি যে সমস্যার সাথে লড়াই করছি of এগুলি আমার কাছে সুস্পষ্ট:
তবে আরও কিছু জটিল পরিস্থিতি রয়েছে। সাধারণভাবে, আমি বিবেচনা করি এমন 3 টি মানদণ্ড রয়েছে: ১. বিশ্ব গড় হিসাবে উইন্ডোতে (গড়? সর্বোচ্চ?) কভারেজ। 2. এর আশেপাশের আশেপাশে উইন্ডোতে (...) কভারেজ। 3. ইপিএসে দক্ষিন কোরিয়ায় কিভাবে জানালা: যদি আমি একটি ছোট বিঘত জন্য খুব কম কাভারেজ দেখুন এটা আকর্ষণীয়, যদি আমি একটি দীর্ঘ স্প্যান জন্য খুব কম কাভারেজ দেখুন এটি আকর্ষণীয়, আমি যদি স্বল্প স্প্যান জন্য আস্তে কম কাভারেজ দেখুন এটা না সত্যিই আকর্ষণীয় , তবে যদি আমি দীর্ঘ সময়ের জন্য হালকা কম কভারেজ দেখতে পাই - এটি .. সুতরাং এটি স্যাপের দৈর্ঘ্যের এবং এটির কভারেজের সংমিশ্রণ। এটি যত দীর্ঘ হয়, তত বেশি আমি কভারেজটি হতে দেই এবং এখনও এটিকে একটি উপত্যকা হিসাবে বিবেচনা করি।
ধন্যবাদ,
ডেভ