দুটি জেনেটিক অ্যালগরিদমের তুলনা করা


9

আমার জেনেটিক অ্যালগরিদমের দুটি বাস্তবায়ন রয়েছে যা সমান আচরণ করার কথা। তবে প্রযুক্তিগত বিধিনিষেধের কারণে যা তাদের আউটপুট সমাধান করা যায় না ঠিক একই ইনপুট দেওয়া হয়।

তবুও আমি দেখাতে চাই যে কোনও পারফরম্যান্সের উল্লেখযোগ্য পার্থক্য নেই।

বিভিন্ন প্রাথমিক এলোমেলো সংখ্যার বীজ ব্যবহার করে দুটি অ্যালগরিদমের প্রত্যেকটির জন্য একই কনফিগারেশন সহ আমার 20 রান রয়েছে। প্রতিটি চালানোর জন্য এবং প্রজন্ম ন্যূনতম ত্রুটি জনসংখ্যা সবচেয়ে ভাল ব্যক্তির সুস্থতা রেকর্ড করা হয়েছে। অ্যালগরিদম একটি অভিজাত সংরক্ষণের ব্যবস্থা নিযুক্ত করে, তাই সেরা ব্যক্তির ফিটনেস একঘেয়েভাবে হ্রাস পাচ্ছে। একটি রান 1000 প্রজন্ম নিয়ে গঠিত, সুতরাং আমার কাছে প্রতি রানের 1000 মান রয়েছে। আমি আরও ডেটা পেতে পারি না, কারণ গণনাগুলি খুব ব্যয়বহুল।

আমার কোন পরীক্ষাটি নিয়োগ করা উচিত? একটি সহজ উপায় সম্ভবত চূড়ান্ত প্রজন্মের ত্রুটির তুলনা করা হবে (আবার, আমি এখানে কোন পরীক্ষাটি ব্যবহার করব)? তবে কেউ সাধারণ রূপান্তর আচরণের তুলনা করার বিষয়েও ভাবতে পারে।


ঠিক যেমন একটি স্পষ্টকরণ: কোনও জেনেটিক অ্যালগরিদম কোনও সমাধানের জন্য এলোমেলোভাবে অনুসন্ধান করে এমনটি হয় না, যাতে কোনও রানের প্রাথমিক বিভাগটি কোনও উপযুক্ত সমাধান উত্পাদন করার সম্ভাবনা না করে? এছাড়াও, "জনসংখ্যার সর্বনিম্ন ত্রুটি" বলতে আপনার অর্থ কী? যদি আপনি কোনও জ্ঞানের সত্যিকারের মান এবং একটি রানের ১০০০ মানগুলির মধ্যে যে কোনও সমাধানের মধ্যে ন্যূনতম পার্থক্য বোঝাতে চান, তবে তা কি রানের ফলাফলের পক্ষপাতিত্বমূলক ইঙ্গিত নয়? সর্বোপরি, অনুশীলনে আপনি প্রতিটি দৌড়ের চূড়ান্ত সমাধান গ্রহণ করবেন এবং এর আগে থাকা সমস্ত কিছুকে প্রত্যাখাত করবেন, তাই না?
হোবার

ত্রুটি করে আমি মূলত 1 / ফিটনেস বোঝায় তাই আমি একটি প্রজন্মের সেরা ব্যক্তির মান সম্পর্কে কথা বলছি। আমি প্রতিটি প্রজন্মের সেরা ব্যক্তির ফিটনেস মান রেকর্ড করেছি। সুতরাং আমার কাছে 1000 * 20 * 2 নম্বর রয়েছে, প্রতিটি একটি নির্দিষ্ট রানের একটি নির্দিষ্ট প্রজন্মের সেরা ব্যক্তির "ফিটনেস" এর সাথে সম্পর্কিত।
nisc

আমার ধারণা প্রাথমিক প্রশ্নটি
ভ্রান্ত

উত্তর:


9

স্টোকাস্টিক অ্যালগোরিদম পরীক্ষা করা বরং কৌতুকজনক হতে পারে!

আমি সিস্টেমে জীববিজ্ঞানে কাজ করি এবং একটি মডেল অনুকরণ করার জন্য অনেকগুলি স্টোকাস্টিক সিমুলেটর উপলব্ধ। এই সিমুলেটরগুলির পরীক্ষা করা জটিল কারণ একক মডেল থেকে যে কোনও দুটি উপলব্ধি সাধারণত পৃথক হবে।

ইন dsmts আমরা হিসাব আছে (বিশ্লেষণী) প্রত্যাশিত মান এবং একটি নির্দিষ্ট মডেল ভ্যারিয়েন্স। এরপরে আমরা কোনও অনুকরণ পরীক্ষা করি যা নির্ধারণের জন্য যে কোনও সিমুলেটর সত্য থেকে পৃথক কিনা। ইউজারগাইডের 3 নং বিভাগটি বিশদ দেয়। মূলত আমরা গড় মানগুলির জন্য একটি টি-টেস্ট করি এবং বৈকল্পগুলির জন্য চি-স্কোয়ার্ড পরীক্ষা করি।

আপনার ক্ষেত্রে, আপনি দুটি সিমুলেটর তুলনা করছেন যাতে আপনার পরিবর্তে কেবল দুটি স্যাম্পলড টি-পরীক্ষা ব্যবহার করা উচিত।


আমি সমস্ত প্রজন্মের তথ্য কীভাবে ব্যবহার করব?
নিসক

সবচেয়ে সহজ উপায় হ'ল একাধিক পরীক্ষা করা, অর্থাত্ প্রতিটি প্রজন্মের পরীক্ষা করা, তারপরে একটি Bonferroni বা fdr সংশোধন ব্যবহার করুন।
csgillespie

প্রতিটি প্রজন্মের সাথে তুলনা করার সময়, আমাকে 1/1000 * 0.05 এর তাত্পর্যপূর্ণ স্তরে পরীক্ষা করতে হবে? এটা কি কিছুটা কঠোর নয়?
নিসক

সত্য, তবে আপনি প্রচুর পরীক্ষাও করছেন - সব কিছুই থাকতে পারে না;) আপনি পি-মানগুলি র‌্যাঙ্ক করতে পারতেন, সম্ভাব্য ত্রুটিগুলি কোথায় ঘটতে পারে তা গাইড হিসাবে তাদের ব্যবহার করুন।
csgillespie

1
বনফেরনি সংশোধনের পরিবর্তে আপনি সর্বদা আরও শক্তিশালী বনফেরনির হলম ব্যবহার করতে পারেন। আমার যে কোন সরকারী এখানে দেখুন: stats.stackexchange.com/questions/575/…
হেনরিক

4

হতে পারে আপনি একই অ্যালগরিদমের দুটি রানের মধ্যবর্তী গড় পার্থক্যটি পৃথক পৃথক অ্যালগরিদম থেকে দুটি রানের মধ্যে গড় পার্থক্য পরিমাপ করতে পারেন। কীভাবে এই পার্থক্যটি পরিমাপ করা যায় তা সমস্যার সমাধান করে না তবে এটি আরও ট্র্যাকটেবল সমস্যা হতে পারে। এবং সময় সিরিজের স্বতন্ত্র মানগুলি একে অপরের বিরুদ্ধে মূল্যায়ন করার জন্য পৃথক ডেটাপয়েন্ট হিসাবে বিবেচনা করার পরিবর্তে পার্থক্য গণনায় ফিড দেয় (আমি মনে করি না যে নবম ধাপে নির্দিষ্ট পার্থক্যটি আপনি সত্যই চান সম্পর্কে বিবৃতি দিতে)।

আপডেট সম্পর্কিত বিবরণ - ভাল আপনি চূড়ান্ত ত্রুটি ছাড়িয়ে সময় সিরিজের কোন বৈশিষ্ট্যে আগ্রহী? আমার ধারণা আপনি সমাধান করার জন্য তিনটি ভিন্ন প্রশ্ন পেয়েছেন:

  1. আপনার জন্য কী মিল রয়েছে, অর্থাৎ আপনি যখন বলে যে আপনি দুটি পদ্ধতি পৃথকভাবে বিশ্বাস করেন না তখন আপনার অর্থ কী?
  2. আপনি এটি কীভাবে মাপ করবেন - এর উত্তর 1 পরে দেওয়া যেতে পারে এবং
  3. আপনার দুটি পদ্ধতির মধ্যে গুরুত্বপূর্ণ পার্থক্যের জন্য আপনি কীভাবে পরীক্ষা করতে পারেন?

আমি প্রথম পোস্টে যা বলছিলাম তা হ'ল (1) এর উত্তর সম্ভবত 1000 প্রজন্মের প্রতিটিতে পৃথক পার্থক্য বিবেচনা করে না। এবং যে আমি প্রতিটি সময় সিরিজ বা সময় সিরিজের মধ্যে অন্তত সাদৃশ্য জন্য একটি স্কেলার মান সঙ্গে আসতে পরামর্শ দেব। তবেই আপনি প্রকৃত পরিসংখ্যান প্রশ্নে (যা আমি তিনটি পয়েন্ট সম্পর্কে কমপক্ষে জানি) তবে আমি যখন অনুরোধ করেছি ঠিক তেমন অনুরূপ প্রশ্নে একটি জোড়যুক্ত টি-টেস্ট ব্যবহার করার পরামর্শ দেওয়া হয়েছিল, যখন উপাদান প্রতি স্কেলারের মান রয়েছে)।


যুক্তিসঙ্গত শোনায়, আরও বিশদ?
নিসক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.