জেনেটিক অ্যালগরিদমের জন্য পরামিতিগুলির নির্বাচন


9

কোনও প্রদত্ত সিস্টেমের মডেল করতে কোনও জেনেটিক অ্যালগরিদমের জন্য সঠিক সংখ্যার পরামিতি কীভাবে নির্বাচন করতে পারেন?

উদাহরণস্বরূপ, বলুন যে আপনি গাড়ির উত্পাদন অনুকূল করতে চান, এবং আপনার এক হাজার বিভিন্ন কর্মীর প্রত্যেকের জন্য বিভিন্ন কার্যক্রমে প্রতি ঘন্টা দক্ষতার 1000 পরিমাপ রয়েছে। সুতরাং, আপনার কাছে 1,000,000 ডেটা পয়েন্ট রয়েছে। এগুলির বেশিরভাগই আপনার কারখানার সামগ্রিক দক্ষতার সাথে দুর্বলভাবে সম্পর্কযুক্ত হওয়ার সম্ভাবনা রয়েছে তবে এতটা দুর্বল নয় যে আপনি বলতে পারেন যে এগুলি পরিসংখ্যানগত আত্মবিশ্বাসের সাথে অপ্রাসঙ্গিক। আপনার জিএর জন্য কীভাবে ইনপুটগুলি বাছাই করা যায় যাতে আপনার 1,000,000+ ডিগ্রি না থাকে, ফলস্বরূপ খুব ধীর অভিযাত্রা হয় না বা কোনও রূপান্তর হয় না?

বিশেষত, বৈশিষ্ট্যগুলি প্রাক-বাছাই করতে বা নির্বাচিতভাবে মুছে ফেলার জন্য কেউ কীভাবে অ্যালগরিদম ব্যবহার করতে পারে?

একটা পদক্ষেপ আমি নিজেকে এই দৃশ্যকল্প মধ্যে ব্যবহার করেছেন প্যারামিটার নির্বাচন নিজেই অভিব্যক্ত, তাই আমি মত বাবা থাকতে পারে হয় {a,b,c}, {b,d,e,q,x,y,z}এবং তাই। আমি তখন বৈশিষ্ট্যগুলি যুক্ত করতে বা বাদ দেওয়ার জন্য বাচ্চাদের পরিবর্তন করতে চাই। এটি কয়েক ডজন বৈশিষ্ট্যের জন্য ভাল কাজ করে। তবে সমস্যাটি হ'ল বিপুল সংখ্যক স্বাধীনতার ডিগ্রি থাকলে এটি অদক্ষ। 10^nসেক্ষেত্রে আপনি সংমিশ্রণের দিকে তাকিয়ে আছেন (উপরের উদাহরণে 10^1,000,000), যা কোনও প্রকারের কার্যকর পারফরম্যান্স পেতে বৈশিষ্ট্যগুলির কিছু প্রাক-ফিল্টারিংকে সমালোচনা করে তোলে।

উত্তর:


11

প্রথমত - উদাহরণটি খুব উপযুক্ত বলে মনে হচ্ছে না কারণ আপনি সম্ভবত এটি সমাধান করার জন্য কিছু রিগ্রেশন বা শাস্ত্রীয় এমএল পদ্ধতি ব্যবহার করবেন। দ্বিতীয়ত - আপনি বৈশিষ্ট্য নির্বাচনের সাধারণ সমস্যা (কিরা, রেন্ডেল, 1992) বা বৈশিষ্ট্য নির্বাচন (হল, হোমস, 2003) বা পরিবর্তনশীল নির্বাচন (গায়ন, এলিসিফ, 2003) বা ভেরিয়েবল সাবসেট নির্বাচন (স্টেকিং, স্কেবিচ, 2005) উল্লেখ করছেন বা বৈশিষ্ট্য নিষ্কাশন (হিলিয়ন, ম্যাসন, রক্স, 1988) বা মাত্রা হ্রাস (রোয়েস, শৌল, 200) বা রাষ্ট্র বিমূর্ততা (অমরেল, 1968)। এই সমস্যাটি কেবল জেনেটিক অ্যালগরিদমের সাথেই নয়, উচ্চ মাত্রিক ডেটা নিয়ে কাজ করার সময় প্রায় সমস্ত মেশিন লার্নিং কৌশলগুলির ক্ষেত্রেই প্রাসঙ্গিক।

এখানে তিনটি কেস আলাদা করা যায়: রাষ্ট্র বিমূর্ততা হিসাবে পরিচিত এই সমস্যার শেষ উদাহরণটি সাধারণত প্রক্রিয়া মডেলিংয়ের সাথে সম্পর্কিত (যা আপনার উদাহরণের সাথে উপযুক্ত, তবে জিএ প্রসঙ্গে নয়) context আপনার প্রশ্নটি আক্ষরিকভাবে নেওয়ার সময় প্রথম তিনটি, অর্থাৎ বৈশিষ্ট্য নির্বাচন , বৈশিষ্ট্য নির্বাচন বা ভেরিয়েবল নির্বাচন সবচেয়ে প্রাসঙ্গিক বলে মনে হয়। এই প্রসঙ্গে একটি সাধারণ সমাধান হ'ল এমআরএমআর পদ্ধতির (পেং, লং, ডিং, ২০০৫) । আমার অভিজ্ঞতা থেকে এটি সর্বদা অবিচ্ছিন্ন ডেটার সাথে ভালভাবে কাজ করে না - তবে পারস্পরিক তথ্য যেমন অন্য সহগগুলির সাথে প্রতিস্থাপন করা যায় যেমন উদাহরণস্বরূপ পারস্পরিক সম্পর্ক। আর একটি সম্ভাব্য পদ্ধতি হ'ল ক্রস-বৈধতা (পিকার্ড, কুক, 1984) ব্যবহার করাএই জন্য আপনার প্রতিটি আলাদা আলাদা বৈশিষ্ট্য ব্যবহার করে একাধিক মডেল থাকতে পারে এবং ক্রস-বৈধকরণের কৌশলগুলির সাহায্যে মডেল নির্বাচনের মাধ্যমে আপনি সেরা মডেলটি চয়ন করেন, যা আপনাকে প্রদত্ত কার্যটির জন্য কোন বৈশিষ্ট্যগুলি সর্বোত্তমভাবে কাজ করে তার তথ্য দেয়।

বৈশিষ্ট্য নিষ্কাশন এবং dimensionality কমানো ক্ষেত্রে না শুধুমাত্র প্রাথমিক বৈশিষ্ট্য নির্বাচন করতে তাদের সমন্বয় অনুমতি দেয়, কিন্তু। এই ক্ষেত্রে একটি সুপরিচিত উদাহরণ সমাধান হ'ল পিসিএ অ্যালগরিদম (পিয়ারসন, ১৯০১) , যা ব্যাখ্যা দেয় ভিন্নতার ক্ষেত্রে, ইনপুট বৈশিষ্ট্যের লিনিয়ার সংমিশ্রণ বৈশিষ্ট্যগুলির সেট।

আরও মনে রাখবেন, এমন অনেকগুলি মডেল রয়েছে যা নিজেরাই বৈশিষ্ট্য নিষ্কাশন কাজটি পরিচালনা করে। কয়েকটি উদাহরণ হ'ল : ক্রমবর্ধমান নিউরাল গ্যাস নেটওয়ার্ক (ফ্রিটজেক, 1995) , ল্যাসো (তিবশিরানী, ২০১১) , আরএফই এসভিএম (জেং, চেন, টাও, ২০০৯) , সিদ্ধান্ত গাছ (কুইনলান, 1986)

তথ্যসূত্র:


3

আমি এর আগে কখনও এটি করিনি, এবং স্পষ্টতই বলা তথ্যে অ্যাক্সেস নেই, তবে এটি করার একটি সম্ভাব্য ভাল উপায় হ'ল ক্লাস্টারিংয়ের মাধ্যমে । প্রতিটি কর্মচারীর জন্য, আমাদের কাছে একটি এন-ডাইমেনশনাল ভেক্টর রয়েছে, যেখানে প্রতিটি মাত্রা একটি আলাদা টাস্কের কোওরস্পান্ড করে। তারপরে, আমরা একসাথে "অনুরূপ" কর্মচারীদের গ্রুপ করতে ক্লাস্টার ব্যবহার করতে পারি; তবে এটি সম্পূর্ণভাবে আপনার ডেটার উপর নির্ভরশীল হতে চলেছে, অর্থাত্ এটি সম্পূর্ণ সম্ভব যে কেবলমাত্র 1000 জন কর্মচারীকে ক্লাস্টারিংয়ের ফলে এমন সমস্ত কর্মচারীদের গোষ্ঠী পাওয়া যাবে যা আসলে সম্পর্কিত নয় এবং তাই আমরা জনসংখ্যা হ্রাস পেতে পারি, তথ্য হ্রাস ব্যয়ে হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.