কোনও প্রদত্ত সিস্টেমের মডেল করতে কোনও জেনেটিক অ্যালগরিদমের জন্য সঠিক সংখ্যার পরামিতি কীভাবে নির্বাচন করতে পারেন?
উদাহরণস্বরূপ, বলুন যে আপনি গাড়ির উত্পাদন অনুকূল করতে চান, এবং আপনার এক হাজার বিভিন্ন কর্মীর প্রত্যেকের জন্য বিভিন্ন কার্যক্রমে প্রতি ঘন্টা দক্ষতার 1000 পরিমাপ রয়েছে। সুতরাং, আপনার কাছে 1,000,000 ডেটা পয়েন্ট রয়েছে। এগুলির বেশিরভাগই আপনার কারখানার সামগ্রিক দক্ষতার সাথে দুর্বলভাবে সম্পর্কযুক্ত হওয়ার সম্ভাবনা রয়েছে তবে এতটা দুর্বল নয় যে আপনি বলতে পারেন যে এগুলি পরিসংখ্যানগত আত্মবিশ্বাসের সাথে অপ্রাসঙ্গিক। আপনার জিএর জন্য কীভাবে ইনপুটগুলি বাছাই করা যায় যাতে আপনার 1,000,000+ ডিগ্রি না থাকে, ফলস্বরূপ খুব ধীর অভিযাত্রা হয় না বা কোনও রূপান্তর হয় না?
বিশেষত, বৈশিষ্ট্যগুলি প্রাক-বাছাই করতে বা নির্বাচিতভাবে মুছে ফেলার জন্য কেউ কীভাবে অ্যালগরিদম ব্যবহার করতে পারে?
একটা পদক্ষেপ আমি নিজেকে এই দৃশ্যকল্প মধ্যে ব্যবহার করেছেন প্যারামিটার নির্বাচন নিজেই অভিব্যক্ত, তাই আমি মত বাবা থাকতে পারে হয় {a,b,c}
, {b,d,e,q,x,y,z}
এবং তাই। আমি তখন বৈশিষ্ট্যগুলি যুক্ত করতে বা বাদ দেওয়ার জন্য বাচ্চাদের পরিবর্তন করতে চাই। এটি কয়েক ডজন বৈশিষ্ট্যের জন্য ভাল কাজ করে। তবে সমস্যাটি হ'ল বিপুল সংখ্যক স্বাধীনতার ডিগ্রি থাকলে এটি অদক্ষ। 10^n
সেক্ষেত্রে আপনি সংমিশ্রণের দিকে তাকিয়ে আছেন (উপরের উদাহরণে 10^1,000,000
), যা কোনও প্রকারের কার্যকর পারফরম্যান্স পেতে বৈশিষ্ট্যগুলির কিছু প্রাক-ফিল্টারিংকে সমালোচনা করে তোলে।