প্রতিটি সারোগেট মডেলের জন্য গ্রিড অনুসন্ধান করার পরে, আপনি কয়েকটি জিনিস পরীক্ষা করতে পারেন এবং করা উচিত:
- অনুকূলিত পরামিতিগুলির প্রকরণ (এখানে এবং সি )।
অনুকূল পরামিতি স্থিতিশীল? যদি তা না হয় তবে আপনি খুব সমস্যায় পড়তে পারেন।γC
- অভ্যন্তরীণ এবং বাহ্যিক ক্রস বৈধতার রিপোর্ট করা কর্মক্ষমতা তুলনা করুন।
যদি অভ্যন্তরীণ (অর্থাত সুরকরণ) ক্রস বৈধতা বাইরের (চূড়ান্ত মডেলের বৈধতা) এর চেয়ে অনেক ভাল দেখায়, তবে আপনিও সমস্যায় পড়েছেন: আপনি অত্যধিক মানানসই। একটি যথেষ্ট ঝুঁকি আছে, যে সুরযুক্ত প্যারামিটারগুলি মোটেও অনুকূল নয়। তবে, যদি বাইরের ক্রস বৈধতা সঠিকভাবে সম্পন্ন হয় (সমস্ত পরীক্ষার সেটগুলি সংশ্লিষ্ট সরোগেট মডেলগুলির চেয়ে সত্যই স্বাধীন) তবে কমপক্ষে আপনার কাছে এখনও মডেলের পারফরম্যান্সের একটি পক্ষপাতহীন (!) অনুমান আছে। তবে আপনি নিশ্চিত হতে পারবেন না যে এটি সর্বোত্তম।
- সর্বোচ্চটি কতটা উচ্চারণযোগ্য? কর্মক্ষমতা suboptimal পরামিতি জন্য দ্রুত হ্রাস? অনুকূল পারফরম্যান্স কতটা ভাল?
মডেল নির্বাচনের মাধ্যমে ওভারফিটিংয়ের বিষয়ে অনেক কিছুই বলা যায়। যাইহোক, এটি মনে রাখা ভাল যে বৈকল্পিক এবং আশাবাদী পক্ষপাত উভয়ই আঘাত করতে পারে
- বৈকল্পিকতার অর্থ হ'ল আপনি দুর্ঘটনাক্রমে সত্যিকারের সর্বোত্তম হাইপার-প্যারামিটারগুলি থেকে দূরে আসতে পারেন।
- তবে পক্ষপাতও ক্ষতি করতে পারে: আপনি যদি বেশি মানানসই হন তবে আপনি এমন পরিস্থিতিতে দৌড়াতে পারেন যেখানে অনেকগুলি মডেল অভ্যন্তরীণ ক্রস বৈধতার সাথে নিখুঁত দেখায় (তবে তারা সত্যিকারের নয়)। সেক্ষেত্রে টিউনিংটি বিপথগামী হতে পারে কারণ এটি মডেলগুলির মধ্যে পার্থক্যকে স্বীকৃতি দেয় না।
- পক্ষপাত যদি হাইপার-প্যারামিটারের উপর নির্ভর করে তবে আপনি বড় সমস্যায় পড়েছেন।
আপনি যদি একটি উদাহরণে আগ্রহী হন এবং আপনি জার্মান পড়তে পারেন তবে আমি আমার ডিপ্লোম থিসিসটি অনলাইনে রাখতে পারতাম।
আমার অভিজ্ঞতায় হাইপারপ্যারামিটারগুলি টিউন করা ওভারফিটের জন্য একটি অত্যন্ত কার্যকর ধারণা ...
এখন, আপনি যদি বুঝতে পারেন যে আপনি অত্যধিক মানানসই, আপনার কাছে প্রধানত দুটি বিকল্প রয়েছে:
- রিপোর্ট করুন যে অপটিমাইজেশনের অত্যধিক মানসিকতায় সমস্যা ছিল তবে আপনি একটি যথাযথ বহিরাগত বৈধতা করেছেন যার ফলস্বরূপ ... (বহিস্থ ক্রস বৈধকরণের ফলাফল)।
- মডেলটির জটিলতা সীমাবদ্ধ করুন। এটি করার একটি উপায় হাইপার-প্যারামিটারগুলি ঠিক করা:
প্রতিটি ট্রেনিং সেটে হাইপার-প্যারামিটারগুলি সুর করার বিকল্প হিসাবে, আপনি (হাইপার) পরামিতিগুলি পূর্বনির্ধারিত করতে পারেন (অর্থাত্ সেগুলি আগেই ঠিক করুন)। আমি আমার মডেলগুলির পক্ষে যতটা সম্ভব সম্ভব করি যতটা আমার কাছে সাধারণত আপনার চেয়ে কম মামলা হয়, নীচে দেখুন।
তবে, এই ফিক্সিংটি অবশ্যই সত্যই এবং সততার সাথে আগেই করা উচিত: উদাহরণস্বরূপ আমি কোনও সহকর্মীকে অনুরূপ ডেটা সেট (স্বতন্ত্র পরীক্ষা) এর অপ্টিমাইজড পরামিতিগুলির জন্য জিজ্ঞাসা করেছি বা পরামিতিগুলিতে গ্রিড অনুসন্ধান সহ প্রাক-পরীক্ষা-নিরীক্ষা করব। সেই প্রথম পরীক্ষার পরে কিছু পরীক্ষামূলক প্যারামিটারগুলি ঠিক করার জন্য ব্যবহৃত হয় বাস্তব পরীক্ষার জন্য এবং ডেটা বিশ্লেষণের জন্য মডেল পরামিতি। আরও ব্যাখ্যা জন্য নীচে দেখুন।
অবশ্যই স্বয়ংক্রিয়ভাবে অনুকূলিত মডেলগুলিতে (ডাবল বা নেস্টেড বৈধতা) সঠিক পরীক্ষা করা সম্ভব, তবে আপনার নমুনা আকারটি দুবার ডেটা বিভক্ত করতে দেয় না ।
এই পরিস্থিতিতে, কোনও ধরণের স্বয়ংক্রিয়ভাবে অপ্টিমাইজড মডেলটির উপর ওভারপোস্টিমিস্টিক অনুমানের প্রতিবেদন করার চেয়ে মডেলিংয়ের পরামিতিগুলি কীভাবে বেছে নেওয়া যায় সে সম্পর্কে পেশাদার অভিজ্ঞতা ব্যবহার করে তৈরি করা মডেলটির জন্য সৎ হিসাবের প্রতিবেদন করা আইএমএইচওর চেয়ে আরও ভাল।
পরিস্থিতি সম্পর্কে অন্য দৃষ্টিভঙ্গি হ'ল আপনাকে বাণিজ্য করতে হবে
- প্যারামিটার অপ্টিমাইজেশনের জন্য আরও একটি গুচ্ছ কেস সেট করার কারণে খারাপ কর্মক্ষমতা (ছোট প্রশিক্ষণের নমুনা আকার => আরও খারাপ মডেল, তবে "অনুকূল" পরামিতি)
- বিশেষজ্ঞের দ্বারা সাবপটিমাল প্যারামিটার ফিক্সিংয়ের কারণে খারাপ কর্মক্ষমতা (তবে বৃহত্তর প্রশিক্ষণের ডেটাতে)।
একই প্রশ্নে কিছু অনুরূপ ধারণা: /stats//a/27761/4598
প্যারামিটারগুলি এবং ডিকরান মার্সুপিয়ালের মন্তব্যগুলি ঠিক করার বিষয়ে
আমি হাইপার-প্যারামিটার শব্দটি ব্যবহার করছি যেহেতু ডিকরান মার্সুপিয়াল এটি তার কাগজে ব্যবহার করেছে (তার উত্তরের লিঙ্ক)
আমি বর্ণালি ডেটা নিয়ে কাজ করি। এটি এমন এক পরিমাপ যা ডেটা বিশ্লেষণ এবং মডেলিংয়ে প্রায়শই প্রাক-প্রক্রিয়াজাতকরণের বেশ কিছু অংশ থাকে। এটি হাইপার-প্যারামিটার হিসাবে দেখা যেতে পারে (উদাহরণস্বরূপ বেসলাইনের জন্য বহুপদী কী অর্ডার ব্যবহার করা উচিত? কোন পরিমাপ চ্যানেলগুলি অন্তর্ভুক্ত করা উচিত?)। আপনার এসভিএম প্যারামিটারের আরও কাছাকাছি থাকা অন্যান্য সিদ্ধান্ত রয়েছে যেমন, "আসল" মডেলটি প্রশিক্ষণের আগে পিসিএ মাত্রিকতা হ্রাসের জন্য করা হয় তবে কতগুলি মূল উপাদান ব্যবহার করতে হবে? এবং কখনও কখনও আমি এসভিএম শ্রেণিবিন্যাসও ব্যবহার করি, সুতরাং এসভিএম পরামিতিগুলির বিষয়ে আমাকে সিদ্ধান্ত নিতে হবে।
এখন, হাইপার-প্যারামিটারগুলি ঠিক করার সর্বোত্তম উপায় আইএমএইচও হ'ল যদি অ্যাপ্লিকেশন থেকে আসা কোনও কারণ থাকে। উদাহরণস্বরূপ আমি সাধারণত শারীরিক / রাসায়নিক / জৈবিক কারণে (যেমন নমুনা সম্পর্কে জ্ঞান এবং সেই থেকে বর্ণালী বর্ণনামূলক আচরণ সম্পর্কে জ্ঞান) কী ধরণের বেসলাইন ব্যবহার করব তা স্থির করি। তবে, আমি এই জাতীয় যুক্তি সম্পর্কে অবগত নই যা এসভিএম প্যারামিটারগুলির সাথে সহায়তা করে ...
আমি উপরে উল্লিখিত প্রাক-পরীক্ষাগুলির ক্ষেত্রে নিম্নরূপ দেখায়:
- আমরা একগুচ্ছ কোষের ডেটা নিয়ে থাকি (বিভিন্ন সেল লাইন আলাদা করতে চাই)।
স্পেকট্রা বিশ্লেষণ করা হয়, পুনরাবৃত্তি ডাবল ক্রস বৈধকরণ এসভিএম চালিত হয় (গণনা সার্ভারে একটি বা দুটি রাত কাটিয়েছিলেন)।
- γC
- আমি একটি নির্দিষ্ট অত্যধিক মান্যতাও পর্যবেক্ষণ করি: বাইরের ক্রস বৈধকরণ টিউনিংয়ের ফলাফলগুলির মতো ততটা ভাল নয়। আশানুরূপ হিসাবে এটি।
- তবুও, হাইপার-প্যারামিটারগুলির টিউনিংয়ের পরিসীমা নিয়ে পারফরম্যান্সের মধ্যে পার্থক্য রয়েছে এবং টিউনিং গ্রিডের পারফরম্যান্সটি যুক্তিসঙ্গতভাবে মসৃণ দেখাচ্ছে। ভাল.
আমার উপসংহারটি হ'ল: যদিও আমি নিশ্চিত হতে পারি না যে চূড়ান্ত হাইপার-পরামিতিগুলি সর্বোত্তম হয় তবে বাইরের ক্রস বৈধতা আমাকে সারোগেট মডেলগুলির কর্মক্ষমতা সম্পর্কে সঠিক অনুমান দেয়।
পরীক্ষামূলক অংশ চলাকালীন, আমরা পরীক্ষামূলক সেট-আপের কিছু পরিবর্তন সম্পর্কে সিদ্ধান্ত নিয়েছি (যে জিনিসগুলি যা শব্দগুলির শব্দে শব্দ করার জন্য সংকেতকে প্রভাবিত করে না, তবে এটি যন্ত্রটির স্বয়ংক্রিয়করণে আরও এক ধাপ এগিয়ে যায়)
আমরা পরীক্ষামূলক সেটিংস উন্নতি করি এবং নতুন বর্ণালী অর্জন করি। কোষগুলি হওয়ায় তাদের নতুনভাবে বেড়ে ওঠা দরকার। অর্থাৎ নতুন ডেটা সেট এমনকি স্বতন্ত্র সংস্কৃতি ব্যাচ bat
এখন আমি সিদ্ধান্তটির মুখোমুখি: আমি কি অভ্যন্তরীণ ক্রস বৈধতা "এড়িয়ে চলা" উচিত এবং কেবলমাত্র পুরানো ডেটা দিয়ে নির্ধারিত হাইপার-প্যারামিটারগুলির সাথে যেতে পারি?
- উপরে উল্লিখিত হিসাবে, আমি এই পূর্ব নির্ধারিত হাইপার-পরামিতি অনুকূল নয় যে ঝুঁকিটি চালাই।
- তবে অভ্যন্তরীণ (টিউনিং) ক্রস বৈধকরণের মাধ্যমে সত্যই সর্বোত্তম হাইপার-প্যারামিটারগুলি পাওয়া নিশ্চিত হওয়া যায় না।
- তবে, পুরানো ডেটাতে টিউনিং স্থিতিশীল ছিল।
- অপ্টিমাইজেশন করা আমি কম নমুনাগুলিতে প্রশিক্ষণ দেব: যেহেতু আমার কাছে খুব কম কয়েকটি নমুনা (টিএম) আছে তাই আমি যদি আরও দুটি নমুনা ক্রস বৈধকরণের জন্য আলাদা রাখি তবে আমি আরও খারাপ মডেলগুলি পাওয়ার আশা করতে পারি।
সুতরাং সেক্ষেত্রে আমি স্থির প্যারামিটার নিয়ে যাওয়ার সিদ্ধান্ত নিয়েছি (অনুরূপ তথ্যের উপর অভিজ্ঞতার দ্বারা এবং ভবিষ্যতে আমাদের বড় বড় ডেটা সহ এই সিদ্ধান্তগুলি পুনরায় যাচাই করে অন্যান্য বিষয়গুলির সাথে আমাদের "হোমওয়ার্ক" করতে হবে তা জেনেও)।
মনে রাখবেন যে গুরুত্বপূর্ণ জিনিসটি আমি বাইরেরটি নয়, অভ্যন্তরীণ ( টিউনিং ক্রস বৈধকরণ) এড়িয়ে চলেছি । ফিক্সড হাইপার-প্যারামিটারগুলির সাথে আমি সম্ভবত সাবওটিমাল মডেলটির পারফরম্যান্সের একটি পক্ষপাতহীন অনুমান পাই। এটি সত্য যে এই অনুমানটি উচ্চ বৈকল্পের সাপেক্ষে, তবে এই বৈকল্পিকটি মূলত আমি অভ্যন্তরীণ টিউনিং করি বা না করি তা একই same
বাইরের ক্রস বৈদিকরণ এড়িয়ে যাওয়া আমি একটি টিউনযুক্ত মডেলের একটি আশাবাদী পক্ষপাতদুষ্ট অনুমান পেতে পারি - যা প্রয়োগ এবং ডেটার উপর নির্ভর করে মূল্যহীন হতে পারে (যদি খুব বেশি পরিমাণে আশাবাদী হয়) এবং আশাবাদী পক্ষপাত স্পষ্টত অগ্রহণযোগ্য হতে পারে।