আমি কীভাবে স্বাধীন উপাদান বিশ্লেষণের জন্য উপাদানগুলির সংখ্যা নির্বাচন করব?

11

স্বতন্ত্র উপাদান বিশ্লেষণে অনুরোধ করার জন্য উপাদানগুলির সংখ্যার বিষয়ে কোনও প্রাকৃতিক অনুমানের অনুপস্থিতিতে, আমি একটি নির্বাচন প্রক্রিয়া স্বয়ংক্রিয়ভাবে দেখছি। আমি মনে করি যে যুক্তিসঙ্গত উপাদানগুলির মধ্যে পারস্পরিক সম্পর্কের জন্য বৈশ্বিক প্রমাণকে ন্যূনতম সংখ্যার যুক্তিসঙ্গত মানদণ্ড হতে পারে। এই পদ্ধতির সিউডোকোড এখানে:

for each candidate number of components, n:
    run ICA specifying n as requested number of components
    for each pair (c1,c2) of resulting components:
        compute a model, m1: lm(c1 ~ 1)
        compute a model, m2: lm(c1 ~ c2)
        compute log likelihood ratio ( AIC(m2)-AIC(m1) ) representing the relative likelihood of a correlation between c1 & c2
    compute mean log likelihood ratio across pairs
Choose the final number of components as that which minimizes the mean log likelihood of component relatedness

আমি মনে করি এটি স্বয়ংক্রিয়ভাবে সংখ্যার "সত্য" সংখ্যার চেয়ে বড় প্রার্থীদের শাস্তি দেওয়া উচিত কারণ এই জাতীয় প্রার্থীদের ফলে প্রাপ্ত আইসিএগুলিকে একক সত্যিকারের উপাদানগুলি একাধিক আনুমানিক উপাদানগুলিতে তথ্য বিতরণ করতে বাধ্য করা উচিত, উপাদানগুলির জোড় জুড়ে পারস্পরিক সম্পর্কের গড় প্রমাণকে বাড়িয়ে তুলতে হবে।

এটা কোনো কিছু হলো? যদি তাই হয় তবে উপরে প্রস্তাবিত গড় লগ সম্ভাবনা পদ্ধতির চেয়ে আনুমানিক উপাদানগুলিতে সামগ্রিকভাবে সম্পর্কিত সামগ্রিক মেট্রিক অর্জনের একটি দ্রুততর উপায় আছে (যা তুলনামূলকভাবে কম গণনামূলকভাবে ধীর হতে পারে)? যদি এই পদ্ধতির কোনও অর্থ না আসে তবে একটি ভাল বিকল্প পদ্ধতিটি দেখতে কেমন হতে পারে?

ica

— মাইক লরেন্স
সূত্র

6

আইসিএর কাছে ভেরিয়াল এনসেম্বল লার্নিং পদ্ধতির এই "স্বয়ংক্রিয় প্রাসঙ্গিকতা সনাক্তকরণ" করতে পারে। এটি স্বয়ংক্রিয়ভাবে এমন উপাদানগুলি বন্ধ করে দেয় যা বায়েশিয়ান প্রমাণের সাথে সীমাবদ্ধতা উন্নত করার প্রয়োজন হয় না।

এখানে উপলব্ধ জেমস মিসকিনের থিসিসটি দেখুন , যা কৌশলটি প্রবর্তন করে।

এটি জন উইন (অন্য একটি পিএইচডি যা বয়েসিয়ান এনসেম্বল লার্নিংকে অ্যালগোরিদম পাস করার বার্তার মাধ্যমে প্রয়োগ করে) দ্বারা জাভাতে খুব নিখুঁতভাবে প্রয়োগ করা হয়েছে ।

কৌশলটি শিখতে, আমি সি -++ এ উইনের অ্যালগরিদম বাস্তবায়নের সিদ্ধান্ত নিয়েছি যা এখান থেকে প্রাপ্ত হতে পারে (সক্রিয় উন্নয়ন)।

— টম
সূত্র

2

টম যেমন বলেছে, কোনও সম্ভাব্য মডেলের উপাদানগুলির একটি ছোট উপসেট নির্বাচন করার জন্য স্বয়ংক্রিয় প্রাসঙ্গিকতা নির্ধারণ একটি ভাল পদ্ধতি।

আইসিএর জন্য আরেকটি পদ্ধতি হ'ল পূর্বে একটি ভারতীয় বুফে প্রক্রিয়া ব্যবহার করা - নোলস এবং ঘড়ামণি "অসীম স্পার্স ফ্যাক্টর বিশ্লেষণ এবং অসীম স্বতন্ত্র উপাদান বিশ্লেষণে" এটি করেন।

— user1149913
সূত্র