জিন সদৃশ স্তর দ্বারা সমৃদ্ধ বিশ্লেষণ


11

জৈবিক পটভূমি

সময়ের সাথে সাথে কিছু উদ্ভিদ প্রজাতি প্রতিটি জিনের অতিরিক্ত অনুলিপি অর্জন করে তাদের পুরো জিনোমগুলি নকল করে। এই সেটআপটির অস্থিরতার কারণে, এর মধ্যে অনেকগুলি জিনগুলি মুছে ফেলা হয় এবং জিনোম নিজেই পুনর্বিন্যাস হয় এবং স্থির হয়, আবার নকল তৈরির জন্য প্রস্তুত। এই সদৃশ ইভেন্টগুলি স্পেসিফিকেশন এবং আক্রমণের ইভেন্টগুলির সাথে সম্পর্কিত এবং তত্ত্বটি হ'ল সদৃশ উদ্ভিদগুলিকে তাদের নতুন পরিবেশের সাথে দ্রুত মানিয়ে নিতে সহায়তা করে।

লুপিনাস, ফুলের উদ্ভিদের একটি জেনাস, এন্ডিসকে সবচেয়ে দ্রুত স্পেসিফিকেশন ইভেন্টে সনাক্ত করা হয়েছিল এবং এর চেয়ে আরও ঘনিষ্ঠভাবে সম্পর্কিত জিনাস, বাপ্তিসিয়ার চেয়ে তার জিনোমে আরও নকল রয়েছে cop

এবং এখন গাণিতিক সমস্যা:

লুপিনাসের সদস্য এবং ব্যাপটিসিয়ার সদস্যের জিনোমগুলি ধারাবাহিকভাবে তৈরি করা হয়েছে, প্রতিটি প্রজাতির 25,000 জিনের কাঁচা তথ্য সরবরাহ করে। জ্ঞাত ফাংশনগুলির জিনগুলির একটি ডাটাবেসের বিরুদ্ধে অনুসন্ধান করে, জিনগুলি কী কী কার্য সম্পাদন করতে পারে তার জন্য আমার এখন "সেরা অনুমান" রয়েছে - উদাহরণস্বরূপ, জেন 1298 "ফ্রুকটোজ বিপাক, লবণের চাপ প্রতিক্রিয়া, ঠান্ডা চাপ প্রতিক্রিয়া" এর সাথে যুক্ত হতে পারে। আমি জানতে চাই, বাপটিসিয়া এবং লুপিনাসের মধ্যে যদি নকলের ঘটনা ঘটে থাকে, জিনের ক্ষতি এলোমেলোভাবে ঘটেছিল কিনা, অথবা নির্দিষ্ট ক্রিয়াকলাপ সম্পাদনকারী জিনগুলি বেশি রাখার বা মুছে ফেলার সম্ভাবনা বেশি ছিল কিনা।

আমার কাছে একটি স্ক্রিপ্ট রয়েছে যা নীচে দেখানো মত একটি টেবিল আউটপুট দেবে। এল * হ'ল ফাংশনের সাথে যুক্ত সমস্ত লুপিনাস জিনের একটি গণনা। L 1+ হ'ল ফাংশনটির সাথে যুক্ত লুপিনাস জিনের একটি গণনা যেখানে কমপক্ষে একটি সদৃশ অনুলিপি উপস্থিত থাকে। আমি এটি এল 2+, এল 3+ ইত্যাদি উত্পাদন করতে পারি, যদিও সিকোয়েন্সিং প্রক্রিয়াটির কারণে এল 1+ এল 2+ এর চেয়ে অনেক বেশি নির্ভরযোগ্য একটি গ্রুপ।

Function            | L *  | L 1+ | B *  | B 1+ |
fructose metabolism | 1000 | 994  | 1290 | 876  |
salt stress         | 56   | 45   | 90   | 54   |
etc.

আমি যা করতে চাই তা প্রতিটি জিনের ক্রিয়াকলাপের জন্য, লুপিনাস এবং ব্যাপটিসিয়ায় যথাযথভাবে প্রত্যাশার চেয়ে ডুপ্লিকেট সহ আরও কম সংখ্যক জিন রয়েছে কিনা, এবং প্রত্যাশিত পর্যবেক্ষণের অনুপাতে লুপিনাস বাপ্তিসিয়ার থেকে পৃথক কিনা তা পরীক্ষা করা।

আমার এখন পর্যন্ত সবচেয়ে ভাল জিনিস

বিভিন্ন প্রজাতির উপর পূর্ববর্তী গবেষণাগুলি প্রতিটি সারিতে ক্রমবর্ধমান পরীক্ষা করার জন্য একাধিক স্যাম্পলিংয়ের জন্য ফিশারের নির্ভুল পরীক্ষা এবং এফডিআর সংশোধন সহ সমৃদ্ধ বিশ্লেষণ ব্যবহার করেছে।

এটির উন্নতি করা ভাল হবে; আমি নিশ্চিত না যে এটি করানোর সর্বোত্তম পদ্ধতির মতো শোনাচ্ছে।

গ্লেেন_বি ডেটা বিশ্লেষণ করতে একটি জিএলএম ব্যবহার করার পরামর্শ দিয়েছেন; আমি জেএমপি 8-তে জিএলএমগুলির সাথে প্রায় খেলা করেছি, যা আকর্ষণীয় ছিল তবে আমি সেগুলি সত্যই বুঝতে না পেরে স্বীকার করব।

এটি বলেছিল, আমি এখন পরিবর্তে আর ব্যবহার করার চেষ্টা করছি।

আমি এটি কিসের জন্য ব্যবহার করছি?

এটি মূলত আমি একটি সংক্ষিপ্ত গবেষণা প্রকল্পের অংশ হিসাবে হব বলে মনে করা হয়েছিল যে আমি বিশ্ববিদ্যালয়ে করছি, তবে এখন এটি একটি বিশাল জিনোম টীকা প্রকল্পে ছড়িয়ে পড়েছে। কেন? কারণ বায়োইনফরম্যাটিকস দুর্দান্ত। A, T, C এবং G এর স্ট্রিং নিতে সক্ষম হয়ে লক্ষ লক্ষ বছর আগে ঘটে যাওয়া ইভেন্টগুলির তথ্য নির্ধারণের জন্য এটি ব্যবহার করে আশ্চর্যজনক।

বলা বাহুল্য, আমি আমার নিজের কাজ হিসাবে সদয়ভাবে সরবরাহ করা কোনও উত্তর চেষ্টা করে জমা করতে যাচ্ছি না। আমি যদি জমা দেওয়া কাজের জন্য এখানে প্রস্তাবিত কোনও পদ্ধতি ব্যবহার করি তবে আমি কাগজে একটি স্বীকৃতি অন্তর্ভুক্ত করতে পেরে খুশি হব।


1
আপনার অন্যান্য প্রশ্নের আমার আগের উত্তরে আমি যে সমস্যার কথা উল্লেখ করেছি সেটিকে নোট করুন - যখন অন্য গুরুত্বপূর্ণ ভেরিয়েবলগুলি কেবলমাত্র একটি ভেরিয়েবলের বিরুদ্ধে পরীক্ষা করা সম্পর্কে (আমি সিম্পসনের প্যারাডক্সের উইকিপিডিয়া নিবন্ধের দিকে ইঙ্গিত করেছিলাম) - ফিশারের সঠিক পরীক্ষাটি তার কাছাকাছি আসেনি।
গ্লেন_বি -রিনস্টেট মনিকা

বায়োইনফরমেটিক্স হয় শীতল !! সাইটে স্বাগতম!
কাইল

আমি শীঘ্রই ফিরে আসব এবং আরও বিস্তৃত উত্তর দেব, তবে আর এর উপযুক্ত ফাংশনগুলি লগলিন, লগলম (প্যাকেজ এমএএসএস, যা আর এর সাথে আসে তবে ডিফল্টরূপে ইনস্টল করা হয় না) এবং নিজেই গ্ল্যাম হবে। এই মডেলগুলির বোধগম্যতা একাধিক রিগ্রেশন এবং
আনোভা বোঝার সাথে অনেকটা মিল থাকবে

উত্তর:


1

যদিও আমি একমত যে ফিশারের পরীক্ষা (বা অনুরূপ কিছু) এখানে সর্বাধিক প্রাকৃতিক পদ্ধতির হতে পারে, এটি সম্পর্কে কীভাবে:

  1. প্রতিটি অনন্য জিনের জন্য, আপনি এল এবং বি এর সদৃশ সংখ্যার পার্থক্য নির্ধারণ করুন
  2. এই পার্থক্যের দ্বারা জিনগুলি অর্ডার করুন। এখন প্রজাতির মধ্যে সর্বাধিক পার্থক্য দেখানো জিনগুলি আপনার তালিকার শীর্ষে থাকবে।
  3. জিনের আদেশকৃত তালিকায় একটি জিন সেট সমৃদ্ধকরণ পরীক্ষা প্রয়োগ করুন। উদাহরণস্বরূপ, আপনি আমার প্যাকেজ টিএমড থেকে একটি পরিবর্তিত ফিশারের পদ্ধতি ব্যবহার করতে পারেন , যার জন্য আপনাকে আপনার জিন সেটগুলি সংজ্ঞায়িত করতে হবে (এটি বেশ সহজবোধ্য হওয়া উচিত)। মনে রাখবেন যে ফিশারের পদ্ধতি ফিশারের পরীক্ষার সাথে সম্পর্কিত নয়।

পরিবর্তিত ফিশারের পরীক্ষা (লেখকরা সেরনো ডাব যারা প্রথমে এ প্রসঙ্গে বর্ণনা করেছেন ) কোনও জিনের তালিকাভুক্ত তালিকাটিকে ইনপুট হিসাবে গ্রহণ করবে যতক্ষণ আপনি এগুলিকে কিছু দরকারী বিভাগে গ্রুপ করতে পারেন।

এই পদ্ধতির সুবিধাটি হ'ল পি-মান বাদে, আপনি সহজেই সমৃদ্ধকরণের প্রভাবের আকারটি গণনা করতে পারেন এবং এটি কল্পনা করতে পারেন (উদাহরণস্বরূপ, জিনের আদেশিত তালিকার উপর একটি আরওসি বক্ররেখা হিসাবে)। আপনি যে জীববিজ্ঞানটি অধ্যয়ন করছেন তার জন্য আপনি যা সত্যই লক্ষ্য করেন তা আপনাকে আরও একটি ভাল ধারণা দেয়।


0

আপনি যেমন বলেছিলেন, আপনি দুটি স্বতন্ত্র প্রশ্ন জিজ্ঞাসা করছেন।

প্রশ্ন 1 "প্রদত্ত জিনের ক্রিয়াকলাপের জন্য L * / L1 + B * / B1 + এর থেকে আলাদা অনুপাত"

আপনি ইতিপূর্বে যেমনটি খুঁজে পেয়েছিলেন সারি জুড়ে ডেটা ব্যবহার করে ফিশারের সঠিক পরীক্ষার সাথে এটির সর্বোত্তম জবাব দেওয়া যেতে পারে।

প্রশ্ন 2 "অনুপাত: জিন যেখানে একটি একক অনুলিপি / জিন যেখানে একাধিক অনুলিপি থাকে, জিন কার্যের মধ্যে আলাদা?"

আমি মনে করি এটি ফিশারের সঠিক পরীক্ষার সাথে সর্বোত্তম জবাবও দেওয়া হতে পারে। জিনের ক্রিয়াকলাপের জন্য আপনি L * / L1 + এর বিপরীতে L * / L1 + এর অনুপাতটি পরীক্ষা করতে পারেন 2 তারপরে জিন ফাংশন 1 বনাম জিন ফাংশন 3 ইত্যাদি etc.

এই সেটগুলির প্রশ্নের কোনওটিই এগুলিতে পাওয়া যায় না যে সেগুলি যথাযথভাবে প্রত্যাশার চেয়ে দ্রুত রক্ষণাবেক্ষণ / মুছে ফেলা হচ্ছে কিনা তা কেবল একে অপরের থেকে আলাদা হারে মুছে ফেলা / রক্ষণাবেক্ষণ করা হচ্ছে কিনা। তারা সুযোগের চেয়ে আলাদা হারে মুছে ফেলা / রক্ষণাবেক্ষণ করা হচ্ছে কিনা তা জানতে, আপনাকে কেবল সুযোগ দ্বারা প্রভাবিত হচ্ছেন এমন অনেকগুলি ডিএনএ অঞ্চলের জন্য সিঙ্গেলোকপি / গুণকোষের অনুপাতটি জানতে হবে। যদি আপনি এই জাতীয় অঞ্চলগুলি খুঁজে পেতে পারেন তবে আপনি একটি "ফাংশন গ্রুপ" দিয়ে শেষ করবেন যেখানে ফাংশনটি "কিছুই নয়"। আপনি তারপরে আপনার অন্যান্য জিন ফাংশন গোষ্ঠীর সাথে একইভাবে তুলনা করতে চাই যেমন আমি প্রশ্ন 2 তে বর্ণনা করেছি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.