জৈবিক পটভূমি
সময়ের সাথে সাথে কিছু উদ্ভিদ প্রজাতি প্রতিটি জিনের অতিরিক্ত অনুলিপি অর্জন করে তাদের পুরো জিনোমগুলি নকল করে। এই সেটআপটির অস্থিরতার কারণে, এর মধ্যে অনেকগুলি জিনগুলি মুছে ফেলা হয় এবং জিনোম নিজেই পুনর্বিন্যাস হয় এবং স্থির হয়, আবার নকল তৈরির জন্য প্রস্তুত। এই সদৃশ ইভেন্টগুলি স্পেসিফিকেশন এবং আক্রমণের ইভেন্টগুলির সাথে সম্পর্কিত এবং তত্ত্বটি হ'ল সদৃশ উদ্ভিদগুলিকে তাদের নতুন পরিবেশের সাথে দ্রুত মানিয়ে নিতে সহায়তা করে।
লুপিনাস, ফুলের উদ্ভিদের একটি জেনাস, এন্ডিসকে সবচেয়ে দ্রুত স্পেসিফিকেশন ইভেন্টে সনাক্ত করা হয়েছিল এবং এর চেয়ে আরও ঘনিষ্ঠভাবে সম্পর্কিত জিনাস, বাপ্তিসিয়ার চেয়ে তার জিনোমে আরও নকল রয়েছে cop
এবং এখন গাণিতিক সমস্যা:
লুপিনাসের সদস্য এবং ব্যাপটিসিয়ার সদস্যের জিনোমগুলি ধারাবাহিকভাবে তৈরি করা হয়েছে, প্রতিটি প্রজাতির 25,000 জিনের কাঁচা তথ্য সরবরাহ করে। জ্ঞাত ফাংশনগুলির জিনগুলির একটি ডাটাবেসের বিরুদ্ধে অনুসন্ধান করে, জিনগুলি কী কী কার্য সম্পাদন করতে পারে তার জন্য আমার এখন "সেরা অনুমান" রয়েছে - উদাহরণস্বরূপ, জেন 1298 "ফ্রুকটোজ বিপাক, লবণের চাপ প্রতিক্রিয়া, ঠান্ডা চাপ প্রতিক্রিয়া" এর সাথে যুক্ত হতে পারে। আমি জানতে চাই, বাপটিসিয়া এবং লুপিনাসের মধ্যে যদি নকলের ঘটনা ঘটে থাকে, জিনের ক্ষতি এলোমেলোভাবে ঘটেছিল কিনা, অথবা নির্দিষ্ট ক্রিয়াকলাপ সম্পাদনকারী জিনগুলি বেশি রাখার বা মুছে ফেলার সম্ভাবনা বেশি ছিল কিনা।
আমার কাছে একটি স্ক্রিপ্ট রয়েছে যা নীচে দেখানো মত একটি টেবিল আউটপুট দেবে। এল * হ'ল ফাংশনের সাথে যুক্ত সমস্ত লুপিনাস জিনের একটি গণনা। L 1+ হ'ল ফাংশনটির সাথে যুক্ত লুপিনাস জিনের একটি গণনা যেখানে কমপক্ষে একটি সদৃশ অনুলিপি উপস্থিত থাকে। আমি এটি এল 2+, এল 3+ ইত্যাদি উত্পাদন করতে পারি, যদিও সিকোয়েন্সিং প্রক্রিয়াটির কারণে এল 1+ এল 2+ এর চেয়ে অনেক বেশি নির্ভরযোগ্য একটি গ্রুপ।
Function | L * | L 1+ | B * | B 1+ |
fructose metabolism | 1000 | 994 | 1290 | 876 |
salt stress | 56 | 45 | 90 | 54 |
etc.
আমি যা করতে চাই তা প্রতিটি জিনের ক্রিয়াকলাপের জন্য, লুপিনাস এবং ব্যাপটিসিয়ায় যথাযথভাবে প্রত্যাশার চেয়ে ডুপ্লিকেট সহ আরও কম সংখ্যক জিন রয়েছে কিনা, এবং প্রত্যাশিত পর্যবেক্ষণের অনুপাতে লুপিনাস বাপ্তিসিয়ার থেকে পৃথক কিনা তা পরীক্ষা করা।
আমার এখন পর্যন্ত সবচেয়ে ভাল জিনিস
বিভিন্ন প্রজাতির উপর পূর্ববর্তী গবেষণাগুলি প্রতিটি সারিতে ক্রমবর্ধমান পরীক্ষা করার জন্য একাধিক স্যাম্পলিংয়ের জন্য ফিশারের নির্ভুল পরীক্ষা এবং এফডিআর সংশোধন সহ সমৃদ্ধ বিশ্লেষণ ব্যবহার করেছে।
এটির উন্নতি করা ভাল হবে; আমি নিশ্চিত না যে এটি করানোর সর্বোত্তম পদ্ধতির মতো শোনাচ্ছে।
গ্লেেন_বি ডেটা বিশ্লেষণ করতে একটি জিএলএম ব্যবহার করার পরামর্শ দিয়েছেন; আমি জেএমপি 8-তে জিএলএমগুলির সাথে প্রায় খেলা করেছি, যা আকর্ষণীয় ছিল তবে আমি সেগুলি সত্যই বুঝতে না পেরে স্বীকার করব।
এটি বলেছিল, আমি এখন পরিবর্তে আর ব্যবহার করার চেষ্টা করছি।
আমি এটি কিসের জন্য ব্যবহার করছি?
এটি মূলত আমি একটি সংক্ষিপ্ত গবেষণা প্রকল্পের অংশ হিসাবে হব বলে মনে করা হয়েছিল যে আমি বিশ্ববিদ্যালয়ে করছি, তবে এখন এটি একটি বিশাল জিনোম টীকা প্রকল্পে ছড়িয়ে পড়েছে। কেন? কারণ বায়োইনফরম্যাটিকস দুর্দান্ত। A, T, C এবং G এর স্ট্রিং নিতে সক্ষম হয়ে লক্ষ লক্ষ বছর আগে ঘটে যাওয়া ইভেন্টগুলির তথ্য নির্ধারণের জন্য এটি ব্যবহার করে আশ্চর্যজনক।
বলা বাহুল্য, আমি আমার নিজের কাজ হিসাবে সদয়ভাবে সরবরাহ করা কোনও উত্তর চেষ্টা করে জমা করতে যাচ্ছি না। আমি যদি জমা দেওয়া কাজের জন্য এখানে প্রস্তাবিত কোনও পদ্ধতি ব্যবহার করি তবে আমি কাগজে একটি স্বীকৃতি অন্তর্ভুক্ত করতে পেরে খুশি হব।