বেস জোড়াগুলির একটি নির্দিষ্ট ক্রম সন্ধানের সম্ভাবনা


10

সম্ভাবনার কথা চিন্তা করা আমাকে সর্বদা উপলব্ধি করে যে আমি গণনায় কতটা খারাপ ...

বেস অক্ষরের একটি ক্রম বিবেচনা করুন A ,এন , প্রতিটি সমান সম্ভাবনা প্রদর্শিত। সম্ভাব্যতা যে এই ক্রম দৈর্ঘ্য স্বার্থে বেস জোড়া নির্দিষ্ট ক্রম ধারণ করে কি আর এন ?একজন,টি,সি, এবং জিRএন

আছে পৃথক (সমান সম্ভাবনা) সম্ভব সিকোয়েন্স। সম্পূর্ণ অনুক্রমের শুরুতে আগ্রহের ক্রম দিয়ে শুরু করুন; এর মতো 4 এন - আর সিকোয়েন্সগুলি সম্ভব। আমরা n + 1 - r বিভিন্ন জায়গায় আমাদের আগ্রহের ক্রমটি শুরু করতে পারি । অতএব, আমার উত্তর ( এন + 1 - আর ) / 4 আর4এন4এন-Rএন+ +1-R(এন+ +1-R)/4R

এই সম্ভাবনাটি বাড়ছে , যা আমার কাছে বোধগম্য। N > 4 আর + আর - 1 এ এই সম্ভাবনাটি 1 ছাড়িয়ে গেছে । তবে তা হতে পারে না। সম্ভাবনাটি সীমাতে 1 টির কাছে পৌঁছা উচিত (আমার কাছে মনে হয়), তবে এটি অতিক্রম করবেন না।এনএন>4R+ +R-1

আমি ধরে নিই যে আমি কিছু গণনা করছি। আমি কী মিস করছি? ধন্যবাদ।

(এফওয়াইআই, হোম ওয়ার্ক নয়, পরীক্ষার প্রস্তুতির একটি খেলনার উদাহরণ my আমার আণবিক জীববিজ্ঞানী বন্ধু একটি প্রশ্ন উত্থাপন করেছে))


এটি ঠিক যে এটির ছাড়িয়ে যাওয়া উচিত নয় যেহেতু এটি সম্ভাবনার
অক্ষগুলি

উত্তর:


5

আসুন দিয়ে এই সমস্যার একটি ছোট সংস্করণ বিবেচনা করুন । পাঁচটি অক্ষরের ক্রমটি কী কী লক্ষ্য রাখবে ... সি জি টি ? এটি সহজ: সমস্ত ক্রমের 4 - 4 এই স্ট্রিং দিয়ে শুরু হয়, এর সাথে আরও 4 - 4 শেষ হয় এবং কোনও ক্রম উভয়ই শুরু করে না এবং এই স্ট্রিং দিয়ে শেষ হয় না। অতএব সুযোগ 2 × 4 - 4এন=5...একজনসিজিটি...4-44-42×4-4

অন্যদিকে, কী? আবার, 4 - 4 সিকোয়েন্সগুলি এই স্ট্রিং দিয়ে শুরু হয়, একই স্ট্রিংয়ের সাথে একই অনুপাত শেষ হয় এবং 4 - 5 সমস্ত সিকোয়েন্স উভয়ই করে । অতএব, অন্তর্ভুক্তি-বাদ দেওয়ার নীতি দ্বারা, উত্তরটি 2 × 4 - 4 - 4 - 5...একজনএকজনএকজনএকজন...4-44-52×4-4-4-5

সাধারণভাবে, উত্তরটি স্ট্রিংয়ের কাঠামোর উপর নির্ভর করে। , আরো নির্দিষ্ট হতে যখন আপনার জন্য একটি স্ট্রিং (থেকে ঠিক আছে, বলার আর বাকি) স্ক্যান করছি , আপনি সমস্ত অক্ষর উপেক্ষা পর্যন্ত আপনি যে প্রাথমিক দেখতে একটি । এর পর, তিনটি সম্ভাবনার আছে: পরবর্তী অক্ষরে জন্য একটি ম্যাচ হয় সি , পরবর্তী এক জন্য একটি অ মিল সি কিন্তু একটি হল একটি (যাতে আপনি অপেক্ষা-জন্য-আন ফিরে একটি রাষ্ট্র), অথবা পরেরটিটি একটি অ-ম্যাচ হলেও এটি একটি , আপনাকে সবেমাত্র-শ- একটি- রাজ্যে রাখে। বিপরীতে, A C T A C G এর জন্য অনুসন্ধান বিবেচনা করুনএকজনসিজিটিএকজনসিসিএকজনএকজনএকজনএকজনএকজনসিটিএকজনসিজি। ধরুন আপনি এর উপসর্গটি দেখেছেন । পরবর্তী চরিত্রটি জি হলে মিলবে । যখন এটি কোনও মিল না হয়, (i) একটি সি আপনাকে প্রথমে অপেক্ষার জন্য একটি রাজ্যে রাখে, (ii) একটি আপনি সি এর জন্য সন্ধান করছেন , এবং (iii) একটি টি এর অর্থ আপনি ইতিমধ্যে দেখেছেন একটি সি টি এবং আপনি ইতিমধ্যে একটি ম্যাচের অর্ধেক পথ (এবং দ্বিতীয় খুঁজছেন )। প্রাসঙ্গিক "কাঠামো" লক্ষ্যবস্তুতে সাবস্ট্রিংগুলির নিদর্শনগুলি নিয়ে গঠিত যা লক্ষ্যটির উপসর্গের সাথে মেলে। যে কারণে সম্ভাবনাগুলি লক্ষ্য স্ট্রিংয়ের উপর নির্ভর করে।একজনসিটিএকজনসিজিসিএকজনএকজনসিটি...একজনসিটিএকজন

এফএসএ ডায়াগ্রামগুলি আমি সময়টিতে মুদ্রা ও টেইলগুলির একটি ধরণের মুদ্রা-টাসসগুলিতে আঘাত করার জন্য নেওয়া একটি জবাবের পক্ষে এই ঘটনাটি বুঝতে সহায়তা করতে পারি adv


3

একটি অশোধিত পড়তা হবে । আপনি সম্ভাব্যতা আপনার ক্রম একটি নির্দিষ্ট অবস্থানে ঘটবে না এটা অবস্থানগুলি (মিথ্যাভাবে অভিমানী স্বাধীনতা) সংখ্যা, যা ক্ষমতায় করা না নিতে এন - R + + 1 না এন - , এবং এই একটি সন্নিকর্ষ তার ঘটছে না তাই আপনার এটি 1 থেকে বিয়োগ করা উচিত । 1-(1-1/4R)এন-R+ +1এন-R+ +1এন-R1

একটি সুনির্দিষ্ট গণনা আপনি যে সুনির্দিষ্ট প্যাটার্নটি খুঁজছেন তার উপর নির্ভর করবে। A টি সি জি টি এর চেয়ে বেশি হওয়ার সম্ভাবনা বেশি ।একজনএকজনএকজনএকজনএকজনএকজনটিসিজিটি


হয়তো এটা শুধু আমার, কিন্তু এর বুঝতে কিভাবে সমীকরণ নির্মাণ করা হয়েছিল পরিপ্রেক্ষিতে একটু পরিস্কার বলে মনে হয়। 1-(1-(1/4)R)এন-(R-1)

@ জো রোক - আমি সন্দেহ করি এটি ব্যক্তিগত। আপনি পৃষ্ঠাটি থেকে পড়তে পারেন পৃষ্ঠায় মাধ্যমে 400 একটি বইয়ের, তুমি কি পড়েছ 400 - 300 + + 1 = 101 পৃষ্ঠা বা 400 - ( 300 - 1 ) = 101 পৃষ্ঠাগুলি? 300400400-300+ +1=101400(3001)=101
হেনরি

কোনও উদ্বেগ নেই, আমি কেবল সমস্যাটি সম্পর্কে আমার অন্তর্দৃষ্টি দিয়ে যাচ্ছিলাম। আমরা, intuitively একটি সমীকরণ আহরণ যদি হতে , তারপর যখন কেউ তা ব্যাখ্যা করার চেষ্টা আমার মনে হয় এটা যে হিসাবে এটি ছেড়ে বদলে তা প্রক্রিয়া সহজ করার জন্য সেরা একটি - বো + সি - + ডি (যদিও এটি অবশ্যই বিবেচনার পরে আরও স্বজ্ঞাত হতে পারে)। আপনার অন্তর্দৃষ্টি কোনও ক্ষেত্রেই আলাদা হতে পারে :)(a(b(c1+d)))ab+c1+d

2

আপনি এমন ক্রমগুলি দ্বিগুণ করছেন যা আপনার লক্ষ্য অনুচ্ছেদে কয়েকবার অন্তর্ভুক্ত রয়েছে, উদাহরণস্বরূপ উভয় অবস্থানে এবং অবস্থান বিতে! = এ। এজন্য আপনার ভুল সম্ভাবনা 1 এর বেশি হতে পারে


অনেক ভালো করেছ ! +1
মাইকেল আর। চেরনিক 12'17

1

সমস্যার একটি মার্কভ চেইন উপস্থাপনা ব্যবহার করে কোনও নির্দিষ্ট অনুচ্ছেদের সঠিক সম্ভাবনা পাওয়া সম্ভব। চেইনটি কীভাবে তৈরি করা যায় তার নির্দিষ্টকরণগুলি সুদের নির্দিষ্ট অনুচ্ছেদের উপর নির্ভর করে, তবে আমি কীভাবে এটি করব তার কয়েকটি উদাহরণ দেব couple


মার্কভ চেইনের মাধ্যমে সঠিক সম্ভাবনা: A,T,C,G এর ফলাফলগুলির একটি পৃথক ক্রম বিবেচনা করুন যেখানে অনুক্রমের ফলাফলগুলি বিনিময়যোগ্য, এবং ধরুন আমরা দৈর্ঘ্যের k এর কিছু স্তরগুলিতে আগ্রহী । কোন প্রদত্ত মান জন্য n যাক W ঘটনা যে সুদ সাবস্ট্রিং ঘটে হবে | Ha ঘটনা যে গত হতে a ফলাফল আছে প্রথম a<k সুদের সাবস্ট্রিং অক্ষর (কিন্তু কোন এই তুলনায় আরো) । আমরা নিম্নলিখিত ইভেন্টগুলি কে + 1 এর নিম্নোক্ত পার্টিশনটি দিতে ব্যবহার করিk+1 সুদের সম্ভাব্য রাজ্য:

State 0W¯H0,   State 1W¯H1,   State 2W¯H2,   State 3W¯H3,   State k1W¯Hk1,State kW.  

যেহেতু ফলাফলগুলির ক্রমটি আদান-প্রদানযোগ্য হিসাবে ধরে নেওয়া হয় আমাদের স্ব-স্ব স্ব ফলাফলগুলি তাদের নিজ নিজ সম্ভাবনার উপর শর্তসাপেক্ষে রয়েছে θA+θT+θC+θG=1 । আপনার আগ্রহের প্রক্রিয়াটি একটি বিচ্ছিন্ন সময়ের মার্কভ চেইন হিসাবে প্রতিনিধিত্ব করা যেতে পারে যা State 0 থেকে শুরু হয় n=0 এবং সম্ভাব্যতা ম্যাট্রিক্স অনুসারে রূপান্তর যা আগ্রহের নির্দিষ্ট স্ট্রিংয়ের উপর নির্ভর করে। একটি রূপান্তর ম্যাট্রিক্স সবসময় হতে হবে (k+1)×(k+1)উপরোক্ত রাজ্যগুলি ব্যবহার করে সংক্রমণের সম্ভাবনার প্রতিনিধিত্বকারী ম্যাট্রিক্স। যদি আগ্রহের স্ট্রিংগুলি না পৌঁছে যায় তবে প্রতিটি রূপান্তর হয় আপনাকে স্ট্রিংয়ের আরও এক ধাপ এগিয়ে আনতে পারে বা এটি আপনাকে পূর্ববর্তী অবস্থায় ফিরিয়ে আনতে পারে যা নির্দিষ্ট স্ট্রিংয়ের উপর নির্ভর করে। একবার স্ট্রিংগুলি পৌঁছে গেলে, এটি চেইনের একটি শোষণকারী অবস্থা, যা আগ্রহের ঘটনাটি ঘটেছে তা উপস্থাপন করে।

উদাহরণস্বরূপ, যদি সুদের সাবস্ট্রিং হয় একজনএকজনএকজনএকজনএকজনএকজন তারপর রূপান্তরটি ম্যাট্রিক্স হল:

পি=[1-θএকজনθএকজন000001-θএকজন0θএকজন00001-θএকজন00θএকজন0001-θএকজন000θএকজন001-θএকজন0000θএকজন01-θএকজন00000θএকজন0000001।]

বিপরীতে, যদি আগ্রহের স্তরগুলি একজনসিটিএকজনজিসি তবে ট্রানজিশন ম্যাট্রিক্স হ'ল:

পি=[1-θএকজনθএকজন00001-θএকজন-θসিθএকজনθসি00001-θএকজন-θটিθএকজন0θটি0001-θএকজন000θএকজন001-θএকজন-θসি-θজিθএকজনθসি00θজি01-θএকজন-θসিθএকজন0000θসি0000001।]

এনপি(ওয়াট|এন)={পিএন}0,এন<


Rএন

#Create function to give n-step transition matrix for n = 1...N
#We will use the example of the substring of interest "AAAAAA"

#a is the probability of A
#t is the probability of T
#c is the probability of C
#g is the probability of G
#N is the last value of n
PROB <- function(N,a,t,c,g) { TOT <- a+t+c+g;
                              a <- a/TOT; 
                              t <- t/TOT; 
                              c <- c/TOT; 
                              g <- g/TOT; 

                              P <- matrix(c(1-a, a, 0, 0, 0, 0, 0,
                                            1-a, 0, a, 0, 0, 0, 0,
                                            1-a, 0, 0, a, 0, 0, 0,
                                            1-a, 0, 0, 0, a, 0, 0,
                                            1-a, 0, 0, 0, 0, a, 0,
                                            1-a, 0, 0, 0, 0, 0, a,
                                              0, 0, 0, 0, 0, 0, 1),
                                          nrow = 7, ncol = 7, 
                                          byrow = TRUE);
                              PPP <- array(0, dim = c(7,7,N));
                              PPP[,,1] <- P;
                              for (n in 2:N) { PPP[,,n] <- PPP[,,n-1] %*% P; } 
                              PPP }

#Calculate probability for N = 100 for equiprobable outcomes
N <- 100;
a <- 1/4;
t <- 1/4;
c <- 1/4;
g <- 1/4;
PROB(N,a,t,c,g)[1,7,N];

[1] 0.01732435

একজনএকজনএকজনএকজনএকজনএকজনএন=1000.01732435

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.