বিশৃঙ্খলা সংখ্যাসূচক মডেলগুলির রিগ্রেশন টেস্টিং


10

যখন আমাদের কাছে একটি সংখ্যাসূচক মডেল থাকে যা একটি আসল শারীরিক ব্যবস্থা উপস্থাপন করে এবং বিশৃঙ্খলা প্রদর্শন করে (যেমন তরল ডায়নামিক্স মডেল, জলবায়ু মডেল), তখন আমরা কীভাবে জানতে পারি যে মডেলটি যেমনটি করা উচিত তেমন পারফর্ম করছে? আমরা সরাসরি মডেলের আউটপুট দুটি সেট তুলনা করতে পারি না, কারণ প্রাথমিক অবস্থার এমনকি ছোট পরিবর্তনগুলি নাটকীয়ভাবে পৃথক সিমুলেশনের আউটপুটগুলিকে পরিবর্তন করতে পারে। আমরা মডেল আউটপুটকে পর্যবেক্ষণের সাথে সরাসরি তুলনা করতে পারি না, কারণ আমরা পর্যবেক্ষণের প্রাথমিক অবস্থার সাথে পর্যাপ্ত পরিমাণে জানতে পারি না, এবং সংখ্যাসমূহের সান্নিধ্যে যাইহোক সিস্টেমের মাধ্যমে প্রচারিত হওয়া ছোটখাটো পার্থক্য দেখা দিতে পারে।

এই প্রশ্নটি আংশিকভাবে বৈজ্ঞানিক কোড ইউনিট পরীক্ষার বিষয়ে ডেভিড কেচসনের প্রশ্নের দ্বারা অনুপ্রাণিত : আমি বিশেষত আগ্রহী যে এই জাতীয় মডেলগুলির জন্য রিগ্রেশন টেস্টগুলি কীভাবে প্রয়োগ করা যেতে পারে। যদি একটি সামান্য প্রাথমিক অবস্থার পরিবর্তন বড় আউটপুট পরিবর্তন হতে পারে (যা এখনও বাস্তবে পর্যাপ্ত উপস্থাপনা হতে পারে), তবে আমরা প্যারামিটারগুলি সংশোধন করে বা নতুন সংখ্যাসূচক রুটিন প্রয়োগের ফলে যে পরিবর্তনগুলি করব সেগুলি থেকে কীভাবে পৃথক করতে পারি?

উত্তর:


7

এই জাতীয় ক্ষেত্রে আপনি যে তুলনা করতে পারবেন তা হ'ল আপনার সমাধানের পরিসংখ্যান: গড়, উচ্চতর মুহূর্ত, সীমানা পেরিয়ে তাপের প্রবাহ এবং অন্যান্য অবিচ্ছেদ্য পরিমাণ। নাভিয়ার-স্টোকস সমীকরণগুলির জন্য টারবুলেন্স মডেলগুলি নিয়ে আলোচনা করা অনেকগুলি কাগজের একটিতে একবার দেখুন, উদাহরণস্বরূপ: তারা পাওয়ার স্পেকট্রা, এনটালপি, এনট্রোপি, এনস্ট্রোফি এবং অন্যান্য শব্দের প্লটগুলি দিয়ে পূর্ণ হয়েছে যা আপনি এর আগে কখনও শোনেন নি they । সবগুলি প্রবাহের কিছু অবিচ্ছেদ্য পরিমাণ এবং এগুলি অন্যান্য সিমুলেশন এবং / বা পরীক্ষাগুলি থেকে গুণিত একই অখণ্ড পরিমাণের সাথে তুলনা করা হয়।


আপনি একটি ভাল উদাহরণ কাগজ সম্পর্কে জানেন? আপনার উত্তরের একটি ভাল সংযোজন হবে।
nnot101

আমার মাথার উপরের অংশটি বন্ধ নয় - আমি কোনও টারবুলেন্স মডেলিং ব্যক্তি নই। আমি টম হিউজের সাম্প্রতিক কয়েকটি কাগজপত্র দিয়ে শুরু করব এবং সেখান থেকে কাজ করব।
ওল্ফগ্যাং ব্যাঙ্গার্থ

আমি মনে করি এটি একটি গতিশীল ব্যবস্থার শাসনব্যবস্থা নির্ধারণের জন্য সংক্ষিপ্ত পরিসংখ্যানগুলি ব্যবহার করার একটি উত্তম উদাহরণ: "গোলমাল ননলাইনার ইকোলজিকাল ডায়নামিক সিস্টেমগুলির জন্য পরিসংখ্যানগত
অনুক্রম

4

যদি আপনার কোডটি আপনার অন্তর্নিহিত সমস্যার অ-বিশৃঙ্খলাবদ্ধ ব্যবস্থায় চলতে পারে, বিশেষত অ-বিশৃঙ্খল ব্যবস্থা যেখানে আপনি উত্পাদিত সমাধানের পদ্ধতিটি ব্যবহার করতে পারেন, আপনার যদি এই ব্যবস্থাগুলিতে চালিত হয় এমন রিগ্রেশন টেস্টগুলি লিখতে হবে যদিও তারা আপনার কাছে অন্যথায় আকর্ষণীয় না হয় if । যদি এই পরীক্ষাগুলি ব্যর্থ হয়, তবে আপনি তাত্ক্ষণিকভাবে জানেন যে আপনার সর্বশেষ কোডের পরিবর্তনে কিছু ভুল হয়েছে। তারপরে আপনি আরও শারীরিকভাবে প্রাসঙ্গিক সমস্যার দিকে এগিয়ে যেতে পারেন।


আমি মনে করি না যে পুরো জলবায়ু মডেলগুলি এভাবে চালানো যেতে পারে তবে সম্ভবত প্রধান উপাদানগুলি পারে। সুপার-ইউনিট পরীক্ষার মতো কিছু। চমৎকার ধারণা.
nnot101

2
তবে সেটাই কথা। আপনার রিগ্রেশন পরীক্ষাগুলিতে ভাল কোড কভারেজ থাকতে হবে (gcov এবং এর মতো আপনার বন্ধুরাও) এবং দ্রুত চালানো উচিত। যদি আপনি আপনার প্রতিদিনের রিগ্রেশন টেস্ট হিসাবে একটি পুরো জলবায়ু মডেল চালাচ্ছেন তবে আমার সন্দেহ হয় আপনি অনেক সময় নষ্ট করছেন।
বিল বার্থ

আমি মনে করি যে আমি আরও বেশি চিন্তা করছিলাম: আপনি প্রথমে পরীক্ষাটি চালাবেন এবং তারপরে একটি মেট্রিকের গুচ্ছ সংরক্ষণ করুন (যেমন ওল্ফগ্যাংয়ের উত্তরে উল্লিখিত হয়েছে)। তারপরে আপনি পরিবর্তনগুলি করেন, এবং পরীক্ষাগুলি আবার চালাবেন এবং আপনি গতবার যেগুলি সঞ্চয় করেছেন তার সাথে একই ম্যাট্রিকগুলি তুলনা করুন। আপনি যদি মডেলটি (বা মডেল সুপার-উপাদান) উন্নত করেছেন, তবে তাত্ত্বিকভাবে, মেট্রিকগুলির সমস্তটির উন্নতি করা উচিত, বা কমপক্ষে নাটকীয়ভাবে খারাপ হওয়া উচিত নয় (যদি আপনি আগে অতিরিক্ত ফিট না হন তবে আপনি বিষয়টিকে সিদ্ধান্ত নিতে পারেন) । আমার ধারণা, এই অর্থে পরীক্ষাটি অনেক বেশি গুণগত, তবে তারা এখনও খুব কার্যকর হতে পারে।
nnot101

এই উত্তরে আলোচনা হিসাবে , আমি মনে করি।
nnot101

2

প্রথমত, আমি আপনার শেষ বাক্যটিতে ফোকাস করতে যাচ্ছি, আপনি যখন প্রশ্নটি করছেন তার মধ্যে কয়েকটি ভিন্ন বিষয়কে স্পর্শ করছেন, তবে আমি মনে করি এটি আপনি যা জিজ্ঞাসা করছেন তা যথেষ্টভাবে ধারণ করে ures আপনি যদি সংখ্যা সংক্রান্ত রুটিনগুলি পরিবর্তন করছেন, আপনি পুরানোটি থেকে নতুন রুটিনটি যাচাই না করা পর্যন্ত আপনার প্রাথমিক অবস্থা বা সিস্টেমের পরামিতিগুলি পরিবর্তন করা উচিত নয়। দুর্বল স্তরে আমি আপনার সমাধানের সাথে কিছু সময়ের গড় মানগুলির তুলনা করে দেখছি এবং সেগুলি চুক্তিতে রয়েছে (এমনকি ক্ষণস্থায়ী আচরণগুলি একে অপরের থেকে বিশৃঙ্খলার মধ্যে বিচ্ছিন্ন হয়ে উঠলেও)। শক্তিশালী স্তরে, আপনি দুটি রুটিন সম্পূর্ণ ক্ষণস্থায়ী আচরণ পুনরুত্পাদন করতে আশা করবে। এর মধ্যে আপনি কোনটি চান এবং কোনটি গ্রহণযোগ্য তা নির্ভর করে আপনি কোন প্রশ্ন জিজ্ঞাসা করছেন এবং সমাধানগুলি থেকে আপনি কী সিদ্ধান্তে পৌঁছাচ্ছেন তার উপর নির্ভর করে।

কোনও মডেল "যেমনটি করা উচিত তেমন পারফরম্যান্স" করছেন কিনা তা বলার বিষয়টি সম্পূর্ণ ভিন্ন প্রশ্ন an আপনার চয়ন করা সংখ্যাসূচক রুটিনগুলির সাথে এর কোনও যোগসূত্র নেই। আপনি কীভাবে আপনার মডেলটি তৈরি করেন, আপনার সরলকরণ অনুমানগুলি থেকে আপনার পরিমাপ / প্যারামিটারের গণনা পর্যন্ত, আপনার সমস্যার সমস্ত পদার্থবিজ্ঞানের উপর ভিত্তি করে আপনার সিদ্ধান্ত নেওয়া উচিত এবং আশা করা যায় অনুরূপ ক্ষেত্রে পূর্বের কাজ করা উচিত। আপনি কোনও ল্যাব সেটিং-এ পুনরুত্পাদন করা একটি সাধারণ কেস সহ একটি মডেলকে বৈধতা দিতে সক্ষম হতে পারেন, তবে এমন অনেক সময় আছে যখন তা অ-তুচ্ছও হয়। আপনি যদি কোনও আকারের ক্রমের মধ্যে একটি গুরুত্বপূর্ণ সিস্টেমের প্যারামিটার নির্ধারণ করতে না পারেন তবে ক্ষণস্থায়ী স্থানীয় আচরণে আপনি যে ক্ষুদ্র বিবরণ গণনা করছেন তাতে কেউ বিশ্বাস করবে বলে আপনি আশা করতে পারবেন না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.