সমস্যার একটি মার্কভ চেইন উপস্থাপনা ব্যবহার করে কোনও নির্দিষ্ট অনুচ্ছেদের সঠিক সম্ভাবনা পাওয়া সম্ভব। চেইনটি কীভাবে তৈরি করা যায় তার নির্দিষ্টকরণগুলি সুদের নির্দিষ্ট অনুচ্ছেদের উপর নির্ভর করে, তবে আমি কীভাবে এটি করব তার কয়েকটি উদাহরণ দেব couple
মার্কভ চেইনের মাধ্যমে সঠিক সম্ভাবনা: A,T,C,G এর ফলাফলগুলির একটি পৃথক ক্রম বিবেচনা করুন যেখানে অনুক্রমের ফলাফলগুলি বিনিময়যোগ্য, এবং ধরুন আমরা দৈর্ঘ্যের k এর কিছু স্তরগুলিতে আগ্রহী । কোন প্রদত্ত মান জন্য n যাক W ঘটনা যে সুদ সাবস্ট্রিং ঘটে হবে | Ha ঘটনা যে গত হতে a ফলাফল আছে প্রথম a<k সুদের সাবস্ট্রিং অক্ষর (কিন্তু কোন এই তুলনায় আরো) । আমরা নিম্নলিখিত ইভেন্টগুলি কে + 1 এর নিম্নোক্ত পার্টিশনটি দিতে ব্যবহার করিk+1 সুদের সম্ভাব্য রাজ্য:
State 0State 1State 2State 3⋮State k−1State kW¯∩H0, W¯∩H1, W¯∩H2, W¯∩H3, ⋮W¯∩Hk−1,W.
যেহেতু ফলাফলগুলির ক্রমটি আদান-প্রদানযোগ্য হিসাবে ধরে নেওয়া হয় আমাদের স্ব-স্ব স্ব ফলাফলগুলি তাদের নিজ নিজ সম্ভাবনার উপর শর্তসাপেক্ষে রয়েছে θA+θT+θC+θG=1 । আপনার আগ্রহের প্রক্রিয়াটি একটি বিচ্ছিন্ন সময়ের মার্কভ চেইন হিসাবে প্রতিনিধিত্ব করা যেতে পারে যা State 0 থেকে শুরু হয় n=0 এবং সম্ভাব্যতা ম্যাট্রিক্স অনুসারে রূপান্তর যা আগ্রহের নির্দিষ্ট স্ট্রিংয়ের উপর নির্ভর করে। একটি রূপান্তর ম্যাট্রিক্স সবসময় হতে হবে (k+1)×(k+1)উপরোক্ত রাজ্যগুলি ব্যবহার করে সংক্রমণের সম্ভাবনার প্রতিনিধিত্বকারী ম্যাট্রিক্স। যদি আগ্রহের স্ট্রিংগুলি না পৌঁছে যায় তবে প্রতিটি রূপান্তর হয় আপনাকে স্ট্রিংয়ের আরও এক ধাপ এগিয়ে আনতে পারে বা এটি আপনাকে পূর্ববর্তী অবস্থায় ফিরিয়ে আনতে পারে যা নির্দিষ্ট স্ট্রিংয়ের উপর নির্ভর করে। একবার স্ট্রিংগুলি পৌঁছে গেলে, এটি চেইনের একটি শোষণকারী অবস্থা, যা আগ্রহের ঘটনাটি ঘটেছে তা উপস্থাপন করে।
উদাহরণস্বরূপ, যদি সুদের সাবস্ট্রিং হয় এ এ এ এ এ এ তারপর রূপান্তরটি ম্যাট্রিক্স হল:
পি = ⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢1 - θএকজন1 - θএকজন1 - θএকজন1 - θএকজন1 - θএকজন1 - θএকজন0θএকজন0000000θএকজন0000000θএকজন0000000θএকজন0000000θএকজন0000000θএকজন1।⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
বিপরীতে, যদি আগ্রহের স্তরগুলি এ সিটিএ জি সি তবে ট্রানজিশন ম্যাট্রিক্স হ'ল:
পি = ⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢1 - θএকজন1 - θএকজন- θসি1 - θএকজন- θটি1 - θএকজন1 - θএকজন- θসি- θজি1 - θএকজন- θসি0θএকজনθএকজনθএকজন0θএকজনθএকজন00θসি00θসি0000θটি0000000θএকজন0000000θজি000000θসি1।⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
এনপি ( ডাব্লু| n)={ পিএন}0 , কেএন < কে
R
এন
#Create function to give n-step transition matrix for n = 1...N
#We will use the example of the substring of interest "AAAAAA"
#a is the probability of A
#t is the probability of T
#c is the probability of C
#g is the probability of G
#N is the last value of n
PROB <- function(N,a,t,c,g) { TOT <- a+t+c+g;
a <- a/TOT;
t <- t/TOT;
c <- c/TOT;
g <- g/TOT;
P <- matrix(c(1-a, a, 0, 0, 0, 0, 0,
1-a, 0, a, 0, 0, 0, 0,
1-a, 0, 0, a, 0, 0, 0,
1-a, 0, 0, 0, a, 0, 0,
1-a, 0, 0, 0, 0, a, 0,
1-a, 0, 0, 0, 0, 0, a,
0, 0, 0, 0, 0, 0, 1),
nrow = 7, ncol = 7,
byrow = TRUE);
PPP <- array(0, dim = c(7,7,N));
PPP[,,1] <- P;
for (n in 2:N) { PPP[,,n] <- PPP[,,n-1] %*% P; }
PPP }
#Calculate probability for N = 100 for equiprobable outcomes
N <- 100;
a <- 1/4;
t <- 1/4;
c <- 1/4;
g <- 1/4;
PROB(N,a,t,c,g)[1,7,N];
[1] 0.01732435
এ এ এ এ এ এএন = 1000.01732435