আমি এইচএমএম মডেল নির্বাচনের জন্য বিআইসি ব্যবহার করতে চাই:
BIC = -2*logLike + num_of_params * log(num_of_data)
সুতরাং আমি কীভাবে এইচএমএম মডেলের পরামিতিগুলির সংখ্যা গণনা করব। একটি সাধারণ 2-রাষ্ট্রের এইচএমএম বিবেচনা করুন, যেখানে আমাদের নিম্নলিখিত তথ্য রয়েছে:
data = [1 2 1 1 2 2 2 1 2 3 3 2 3 2 1 2 2 3 4 5 5 3 3 2 6 6 5 6 4 3 4 4 4 4 4 4 3 3 2 2];
model = hmmFit(data, 2, 'discrete');
model.pi = 0.6661 0.3339;
model.A =
0.8849 0.1151
0.1201 0.8799
model.emission.T =
0.2355 0.5232 0.2259 0.0052 0.0049 0.0053
0.0053 0.0449 0.2204 0.4135 0.1582 0.1578
logLike = hmmLogprob(model,data);
logLike = -55.8382
তাই আমি মনে করি:
Nparams = size(model.A,2)*(size(model.A,2)-1) +
size(model.pi,2)-1) +
size(model.emission.T,1)*(size(model.emission.T,2)-1)
Nparams = 13
সুতরাং শেষে আমাদের আছে:
BIC = -2*logLike + num_of_params*log(length(x))
BIC = 159.6319
আমি একটি সমাধান পেয়েছি যেখানে num_of_params
(সরল মার্কভ মডেলের জন্য) সূত্রটি দেখতে পাওয়া যায় :
Nparams = Num_of_states*(Num_of_States-1) - Nbzeros_in_transition_matrix
তাহলে সঠিক সমাধান কী? আমি কি রূপান্তর বা নির্গমন ম্যাট্রিক্সে কিছু শূন্যতার সম্ভাবনা বিবেচনা করি?
==== 07.15.2011 থেকে আপডেট হয়েছে ====
আমি মনে করি আমি ডেটা মাত্রার প্রভাব সম্পর্কে কিছু স্পষ্টতা দিতে পারি ("গাউসিয়ান মিশ্রণ বিতরণ" উদাহরণ ব্যবহার করে)
এক্স একটি এন-বাই-ডি ম্যাট্রিক্স যেখানে (এন-সারি পর্যবেক্ষণের সাথে মিলিত হয়; ডি-কলামগুলি ভেরিয়েবলের সাথে মিলিত হয় (এনডিমেন্স)।
X=[3,17 3,43
1,69 2,94
3,92 5,04
1,65 1,79
1,59 3,92
2,53 3,73
2,26 3,60
3,87 5,01
3,71 4,83
1,89 3,30 ];
[n d] = size(X);
n = 10; d =2;
মডেলটিতে জিএমএমের জন্য নিম্নলিখিত সংখ্যক পরামিতি থাকবে:
nParam = (k_mixtures – 1) + (k_mixtures * NDimensions ) + k_mixtures * Ndimensions %for daigonal covariance matrices
nParam = (k_mixtures – 1) + (k_mixtures * NDimensions ) + k_mixtures * NDimensions * (NDimensions+1)/2; %for full covariance matrices
আমরা যত এক্স আচরণ যদি 1-মাত্রিক তথ্য চেয়ে আমরা আছে num_of_data = (n*d)
, তাই জন্য 2-মাত্রিক ডাটা আছে num_of_data = n
।
দ্বি-মাত্রিক ডেটা: এনপ্রাম = 11; লগলাইক = -11.8197; বিআইসি = 1.689
1-মাত্রিক ডেটা: এনপ্রাম = 5; লগলাইক = -24.8753; বিআইসি = -34.7720
আমার এইচএমএম নিয়ে খুব কম অনুশীলন আছে have (5000, 6000 এবং আরও বেশি পরামিতি) সহ এইচএমএম থাকা কি স্বাভাবিক?