কে-ভাঁজ ক্রস বৈধকরণে গ্রিড অনুসন্ধান


16

আমি 10-ভাঁজ ক্রস বৈধতা সেটিংসে 120 টি নমুনার ডেটাসেট করেছি। বর্তমানে, আমি গ্রিড অনুসন্ধানের মাধ্যমে গামা এবং সি এর মান বাছাই করতে প্রথম হোল্ডআউটটির প্রশিক্ষণ ডেটাটি বেছে নিয়েছি এবং এটিতে একটি 5-গুণ ক্রস-বৈধকরণ করছি। আমি আরবিএফ কার্নেল দিয়ে এসভিএম ব্যবহার করছি। যেহেতু আমি নির্ভুলতা রিপোর্ট করার জন্য একটি দশ 10 ক্রস-বৈধতা করছি, প্রত্যাহার করুন, আমি কি প্রতিটি হোল্ডআউটের প্রশিক্ষণ ডেটাতে এই গ্রিড অনুসন্ধানটি সম্পাদন করব (10 টি হোল্ডআউট রয়েছে, যার প্রত্যেকটিতে 10% পরীক্ষা এবং 90% প্রশিক্ষণ ডেটা রয়েছে)? খুব বেশি সময় ব্যয় করা হবে না?

যদি আমি প্রথম হোল্ডআউটটির গামা এবং সি ব্যবহার করি এবং কে-ফোল্ড ক্রস-বৈধকরণের বাকি 9 টি হোল্ডআউটগুলির জন্য এটি ব্যবহার করি তবে এটি লঙ্ঘন কারণ আমি ট্রেনের ডেটা ব্যবহার করে গামা এবং সি পেতে এবং আবার ব্যবহার করতে পারি দ্বিতীয় হোল্ডআউটে পরীক্ষার হিসাবে ট্রেনের ডেটা অংশ?


এই প্রশ্নের আরও তথ্যের প্রয়োজন। আপনি কোন মডেল ফিট? এই মডেলটিতে গামা এবং সি কী? আরও, আপনি মন্তব্য সম্পাদনা করে এই তথ্যটি দিতে পারেন, এবং মন্তব্য সহ নয়।
সম্ভাব্যতা

উত্তর:


14

হ্যাঁ, এটি লঙ্ঘন হবে কারণ বাহ্যিক ক্রস-বৈধকরণের 2-10 ভাঁজগুলির পরীক্ষার ডেটাগুলি ভাঁজ 1 এর প্রশিক্ষণ ডেটার অংশ হত যা কার্নেলের মান এবং নিয়মিতকরণ পরামিতি নির্ধারণ করার জন্য ব্যবহৃত হত। এর অর্থ হ'ল পরীক্ষার তথ্য সম্পর্কে কিছু তথ্য সম্ভাব্যভাবে মডেলটির ডিজাইনে ফাঁস হয়ে গেছে, যা পারফরম্যান্স মূল্যায়নের ক্ষেত্রে একটি আশাবাদী পক্ষপাতিত্ব দেয়, এটি হাইপার-প্যারামিটারগুলির সেটিংয়ের ক্ষেত্রে অত্যন্ত সংবেদনশীল মডেলদের পক্ষে সর্বাধিক আশাবাদী ie এটি সর্বাধিক দৃ an়ভাবে একটি অনাকাঙ্ক্ষিত বৈশিষ্ট্যযুক্ত মডেলগুলির পক্ষে।

এই ডাটাবেসগুলি ছোট ডেটাসেটগুলির জন্য শক্তিশালী হতে পারে, যেমন মডেল নির্বাচনের মানদণ্ডের আকারটি ছোট ডেটাসেটগুলির পক্ষে সবচেয়ে বড়, যা মডেল নির্বাচনের মানদণ্ডকে অতিরিক্ত ফিট করার জন্য উত্সাহ দেয়, যার অর্থ পরীক্ষার তথ্যগুলি আরও ফাঁস হতে পারে মাধ্যম.

আমি এক বা দু'বছর আগে এই বিষয়ে একটি কাগজ লিখেছিলাম যেহেতু আমি পূর্ণ নেস্টেড ক্রস-বৈধকরণের পক্ষপাতিত্বের বিচ্যুতির পরিমাণ দেখে চমকে দিয়েছি, যা শ্রেণিবদ্ধকারী সিস্টেমগুলির মধ্যে পারফরম্যান্সের পার্থক্যকে খুব সহজেই সরিয়ে দিতে পারে। কাগজটি "মডেল সিলেকশনে ওভার-ফিটিং এবং পারফরম্যান্স মূল্যায়নের পরবর্তী নির্বাচন বায়াস" গ্যাভিন সি। কাওলি, নিকোলা এলসি টালবোট; জেএমএলআর 11 (জুলাই): 2079−2107, 2010।

মূলত হাইপার-প্যারামিটারগুলি টিউন করা মডেলটিকে ফিটিংয়ের একটি অবিচ্ছেদ্য অঙ্গ হিসাবে বিবেচনা করা উচিত, সুতরাং প্রতিবার আপনি যখন কোনও নতুন নমুনায় এসভিএমকে প্রশিক্ষণ দেন, সেই নমুনার জন্য স্বতন্ত্রভাবে হাইপার-প্যারামিটারগুলি ফিরিয়ে দিন। আপনি যদি এই নিয়মটি অনুসরণ করেন তবে আপনি সম্ভবত খুব বেশি ভুল করতে পারবেন না। নিরপেক্ষ পারফরম্যান্সের অনুমানের জন্য এটি গণ্য ব্যয়ের পক্ষে উপযুক্ত, অন্যথায় আপনি নিজের পরীক্ষা থেকে ভুল উপসংহার আঁকানোর ঝুঁকি চালান।


1
আমার ব্যক্তিগত অভিজ্ঞতা ওভারফিটিংয়ের এই জাতীয় উত্স সম্পর্কে আমাকে খুব সতর্ক করেছে।
সিবিলেটগুলি 20:55

6

প্রতিটি সারোগেট মডেলের জন্য গ্রিড অনুসন্ধান করার পরে, আপনি কয়েকটি জিনিস পরীক্ষা করতে পারেন এবং করা উচিত:

  • অনুকূলিত পরামিতিগুলির প্রকরণ (এখানে এবং সি )। অনুকূল পরামিতি স্থিতিশীল? যদি তা না হয় তবে আপনি খুব সমস্যায় পড়তে পারেন।γC
  • অভ্যন্তরীণ এবং বাহ্যিক ক্রস বৈধতার রিপোর্ট করা কর্মক্ষমতা তুলনা করুন।
    যদি অভ্যন্তরীণ (অর্থাত সুরকরণ) ক্রস বৈধতা বাইরের (চূড়ান্ত মডেলের বৈধতা) এর চেয়ে অনেক ভাল দেখায়, তবে আপনিও সমস্যায় পড়েছেন: আপনি অত্যধিক মানানসই। একটি যথেষ্ট ঝুঁকি আছে, যে সুরযুক্ত প্যারামিটারগুলি মোটেও অনুকূল নয়। তবে, যদি বাইরের ক্রস বৈধতা সঠিকভাবে সম্পন্ন হয় (সমস্ত পরীক্ষার সেটগুলি সংশ্লিষ্ট সরোগেট মডেলগুলির চেয়ে সত্যই স্বাধীন) তবে কমপক্ষে আপনার কাছে এখনও মডেলের পারফরম্যান্সের একটি পক্ষপাতহীন (!) অনুমান আছে। তবে আপনি নিশ্চিত হতে পারবেন না যে এটি সর্বোত্তম।
  • সর্বোচ্চটি কতটা উচ্চারণযোগ্য? কর্মক্ষমতা suboptimal পরামিতি জন্য দ্রুত হ্রাস? অনুকূল পারফরম্যান্স কতটা ভাল?

মডেল নির্বাচনের মাধ্যমে ওভারফিটিংয়ের বিষয়ে অনেক কিছুই বলা যায়। যাইহোক, এটি মনে রাখা ভাল যে বৈকল্পিক এবং আশাবাদী পক্ষপাত উভয়ই আঘাত করতে পারে

  • বৈকল্পিকতার অর্থ হ'ল আপনি দুর্ঘটনাক্রমে সত্যিকারের সর্বোত্তম হাইপার-প্যারামিটারগুলি থেকে দূরে আসতে পারেন।
  • তবে পক্ষপাতও ক্ষতি করতে পারে: আপনি যদি বেশি মানানসই হন তবে আপনি এমন পরিস্থিতিতে দৌড়াতে পারেন যেখানে অনেকগুলি মডেল অভ্যন্তরীণ ক্রস বৈধতার সাথে নিখুঁত দেখায় (তবে তারা সত্যিকারের নয়)। সেক্ষেত্রে টিউনিংটি বিপথগামী হতে পারে কারণ এটি মডেলগুলির মধ্যে পার্থক্যকে স্বীকৃতি দেয় না।
  • পক্ষপাত যদি হাইপার-প্যারামিটারের উপর নির্ভর করে তবে আপনি বড় সমস্যায় পড়েছেন।

আপনি যদি একটি উদাহরণে আগ্রহী হন এবং আপনি জার্মান পড়তে পারেন তবে আমি আমার ডিপ্লোম থিসিসটি অনলাইনে রাখতে পারতাম।

আমার অভিজ্ঞতায় হাইপারপ্যারামিটারগুলি টিউন করা ওভারফিটের জন্য একটি অত্যন্ত কার্যকর ধারণা ...

এখন, আপনি যদি বুঝতে পারেন যে আপনি অত্যধিক মানানসই, আপনার কাছে প্রধানত দুটি বিকল্প রয়েছে:

  • রিপোর্ট করুন যে অপটিমাইজেশনের অত্যধিক মানসিকতায় সমস্যা ছিল তবে আপনি একটি যথাযথ বহিরাগত বৈধতা করেছেন যার ফলস্বরূপ ... (বহিস্থ ক্রস বৈধকরণের ফলাফল)।
  • মডেলটির জটিলতা সীমাবদ্ধ করুন। এটি করার একটি উপায় হাইপার-প্যারামিটারগুলি ঠিক করা:

প্রতিটি ট্রেনিং সেটে হাইপার-প্যারামিটারগুলি সুর করার বিকল্প হিসাবে, আপনি (হাইপার) পরামিতিগুলি পূর্বনির্ধারিত করতে পারেন (অর্থাত্ সেগুলি আগেই ঠিক করুন)। আমি আমার মডেলগুলির পক্ষে যতটা সম্ভব সম্ভব করি যতটা আমার কাছে সাধারণত আপনার চেয়ে কম মামলা হয়, নীচে দেখুন।
তবে, এই ফিক্সিংটি অবশ্যই সত্যই এবং সততার সাথে আগেই করা উচিত: উদাহরণস্বরূপ আমি কোনও সহকর্মীকে অনুরূপ ডেটা সেট (স্বতন্ত্র পরীক্ষা) এর অপ্টিমাইজড পরামিতিগুলির জন্য জিজ্ঞাসা করেছি বা পরামিতিগুলিতে গ্রিড অনুসন্ধান সহ প্রাক-পরীক্ষা-নিরীক্ষা করব। সেই প্রথম পরীক্ষার পরে কিছু পরীক্ষামূলক প্যারামিটারগুলি ঠিক করার জন্য ব্যবহৃত হয় বাস্তব পরীক্ষার জন্য এবং ডেটা বিশ্লেষণের জন্য মডেল পরামিতি। আরও ব্যাখ্যা জন্য নীচে দেখুন।

অবশ্যই স্বয়ংক্রিয়ভাবে অনুকূলিত মডেলগুলিতে (ডাবল বা নেস্টেড বৈধতা) সঠিক পরীক্ষা করা সম্ভব, তবে আপনার নমুনা আকারটি দুবার ডেটা বিভক্ত করতে দেয় না
এই পরিস্থিতিতে, কোনও ধরণের স্বয়ংক্রিয়ভাবে অপ্টিমাইজড মডেলটির উপর ওভারপোস্টিমিস্টিক অনুমানের প্রতিবেদন করার চেয়ে মডেলিংয়ের পরামিতিগুলি কীভাবে বেছে নেওয়া যায় সে সম্পর্কে পেশাদার অভিজ্ঞতা ব্যবহার করে তৈরি করা মডেলটির জন্য সৎ হিসাবের প্রতিবেদন করা আইএমএইচওর চেয়ে আরও ভাল।
পরিস্থিতি সম্পর্কে অন্য দৃষ্টিভঙ্গি হ'ল আপনাকে বাণিজ্য করতে হবে

  • প্যারামিটার অপ্টিমাইজেশনের জন্য আরও একটি গুচ্ছ কেস সেট করার কারণে খারাপ কর্মক্ষমতা (ছোট প্রশিক্ষণের নমুনা আকার => আরও খারাপ মডেল, তবে "অনুকূল" পরামিতি)
  • বিশেষজ্ঞের দ্বারা সাবপটিমাল প্যারামিটার ফিক্সিংয়ের কারণে খারাপ কর্মক্ষমতা (তবে বৃহত্তর প্রশিক্ষণের ডেটাতে)।

একই প্রশ্নে কিছু অনুরূপ ধারণা: /stats//a/27761/4598


প্যারামিটারগুলি এবং ডিকরান মার্সুপিয়ালের মন্তব্যগুলি ঠিক করার বিষয়ে

আমি হাইপার-প্যারামিটার শব্দটি ব্যবহার করছি যেহেতু ডিকরান মার্সুপিয়াল এটি তার কাগজে ব্যবহার করেছে (তার উত্তরের লিঙ্ক)

আমি বর্ণালি ডেটা নিয়ে কাজ করি। এটি এমন এক পরিমাপ যা ডেটা বিশ্লেষণ এবং মডেলিংয়ে প্রায়শই প্রাক-প্রক্রিয়াজাতকরণের বেশ কিছু অংশ থাকে। এটি হাইপার-প্যারামিটার হিসাবে দেখা যেতে পারে (উদাহরণস্বরূপ বেসলাইনের জন্য বহুপদী কী অর্ডার ব্যবহার করা উচিত? কোন পরিমাপ চ্যানেলগুলি অন্তর্ভুক্ত করা উচিত?)। আপনার এসভিএম প্যারামিটারের আরও কাছাকাছি থাকা অন্যান্য সিদ্ধান্ত রয়েছে যেমন, "আসল" মডেলটি প্রশিক্ষণের আগে পিসিএ মাত্রিকতা হ্রাসের জন্য করা হয় তবে কতগুলি মূল উপাদান ব্যবহার করতে হবে? এবং কখনও কখনও আমি এসভিএম শ্রেণিবিন্যাসও ব্যবহার করি, সুতরাং এসভিএম পরামিতিগুলির বিষয়ে আমাকে সিদ্ধান্ত নিতে হবে।

এখন, হাইপার-প্যারামিটারগুলি ঠিক করার সর্বোত্তম উপায় আইএমএইচও হ'ল যদি অ্যাপ্লিকেশন থেকে আসা কোনও কারণ থাকে। উদাহরণস্বরূপ আমি সাধারণত শারীরিক / রাসায়নিক / জৈবিক কারণে (যেমন নমুনা সম্পর্কে জ্ঞান এবং সেই থেকে বর্ণালী বর্ণনামূলক আচরণ সম্পর্কে জ্ঞান) কী ধরণের বেসলাইন ব্যবহার করব তা স্থির করি। তবে, আমি এই জাতীয় যুক্তি সম্পর্কে অবগত নই যা এসভিএম প্যারামিটারগুলির সাথে সহায়তা করে ...

আমি উপরে উল্লিখিত প্রাক-পরীক্ষাগুলির ক্ষেত্রে নিম্নরূপ দেখায়:

  • আমরা একগুচ্ছ কোষের ডেটা নিয়ে থাকি (বিভিন্ন সেল লাইন আলাদা করতে চাই)।
  • স্পেকট্রা বিশ্লেষণ করা হয়, পুনরাবৃত্তি ডাবল ক্রস বৈধকরণ এসভিএম চালিত হয় (গণনা সার্ভারে একটি বা দুটি রাত কাটিয়েছিলেন)।

    • γসি
    • আমি একটি নির্দিষ্ট অত্যধিক মান্যতাও পর্যবেক্ষণ করি: বাইরের ক্রস বৈধকরণ টিউনিংয়ের ফলাফলগুলির মতো ততটা ভাল নয়। আশানুরূপ হিসাবে এটি।
    • তবুও, হাইপার-প্যারামিটারগুলির টিউনিংয়ের পরিসীমা নিয়ে পারফরম্যান্সের মধ্যে পার্থক্য রয়েছে এবং টিউনিং গ্রিডের পারফরম্যান্সটি যুক্তিসঙ্গতভাবে মসৃণ দেখাচ্ছে। ভাল.
  • আমার উপসংহারটি হ'ল: যদিও আমি নিশ্চিত হতে পারি না যে চূড়ান্ত হাইপার-পরামিতিগুলি সর্বোত্তম হয় তবে বাইরের ক্রস বৈধতা আমাকে সারোগেট মডেলগুলির কর্মক্ষমতা সম্পর্কে সঠিক অনুমান দেয়।

  • পরীক্ষামূলক অংশ চলাকালীন, আমরা পরীক্ষামূলক সেট-আপের কিছু পরিবর্তন সম্পর্কে সিদ্ধান্ত নিয়েছি (যে জিনিসগুলি যা শব্দগুলির শব্দে শব্দ করার জন্য সংকেতকে প্রভাবিত করে না, তবে এটি যন্ত্রটির স্বয়ংক্রিয়করণে আরও এক ধাপ এগিয়ে যায়)

  • আমরা পরীক্ষামূলক সেটিংস উন্নতি করি এবং নতুন বর্ণালী অর্জন করি। কোষগুলি হওয়ায় তাদের নতুনভাবে বেড়ে ওঠা দরকার। অর্থাৎ নতুন ডেটা সেট এমনকি স্বতন্ত্র সংস্কৃতি ব্যাচ bat

এখন আমি সিদ্ধান্তটির মুখোমুখি: আমি কি অভ্যন্তরীণ ক্রস বৈধতা "এড়িয়ে চলা" উচিত এবং কেবলমাত্র পুরানো ডেটা দিয়ে নির্ধারিত হাইপার-প্যারামিটারগুলির সাথে যেতে পারি?

  • উপরে উল্লিখিত হিসাবে, আমি এই পূর্ব নির্ধারিত হাইপার-পরামিতি অনুকূল নয় যে ঝুঁকিটি চালাই।
  • তবে অভ্যন্তরীণ (টিউনিং) ক্রস বৈধকরণের মাধ্যমে সত্যই সর্বোত্তম হাইপার-প্যারামিটারগুলি পাওয়া নিশ্চিত হওয়া যায় না।
  • তবে, পুরানো ডেটাতে টিউনিং স্থিতিশীল ছিল।
  • অপ্টিমাইজেশন করা আমি কম নমুনাগুলিতে প্রশিক্ষণ দেব: যেহেতু আমার কাছে খুব কম কয়েকটি নমুনা (টিএম) আছে তাই আমি যদি আরও দুটি নমুনা ক্রস বৈধকরণের জন্য আলাদা রাখি তবে আমি আরও খারাপ মডেলগুলি পাওয়ার আশা করতে পারি।

সুতরাং সেক্ষেত্রে আমি স্থির প্যারামিটার নিয়ে যাওয়ার সিদ্ধান্ত নিয়েছি (অনুরূপ তথ্যের উপর অভিজ্ঞতার দ্বারা এবং ভবিষ্যতে আমাদের বড় বড় ডেটা সহ এই সিদ্ধান্তগুলি পুনরায় যাচাই করে অন্যান্য বিষয়গুলির সাথে আমাদের "হোমওয়ার্ক" করতে হবে তা জেনেও)।

মনে রাখবেন যে গুরুত্বপূর্ণ জিনিসটি আমি বাইরেরটি নয়, অভ্যন্তরীণ ( টিউনিং ক্রস বৈধকরণ) এড়িয়ে চলেছি । ফিক্সড হাইপার-প্যারামিটারগুলির সাথে আমি সম্ভবত সাবওটিমাল মডেলটির পারফরম্যান্সের একটি পক্ষপাতহীন অনুমান পাই। এটি সত্য যে এই অনুমানটি উচ্চ বৈকল্পের সাপেক্ষে, তবে এই বৈকল্পিকটি মূলত আমি অভ্যন্তরীণ টিউনিং করি বা না করি তা একই same
বাইরের ক্রস বৈদিকরণ এড়িয়ে যাওয়া আমি একটি টিউনযুক্ত মডেলের একটি আশাবাদী পক্ষপাতদুষ্ট অনুমান পেতে পারি - যা প্রয়োগ এবং ডেটার উপর নির্ভর করে মূল্যহীন হতে পারে (যদি খুব বেশি পরিমাণে আশাবাদী হয়) এবং আশাবাদী পক্ষপাত স্পষ্টত অগ্রহণযোগ্য হতে পারে।


এই উত্তরটি নিম্নোক্ত করতে হবে বলে দুঃখিত, তবে হাইপার-প্যারামিটারগুলির জন্য পূর্বনির্ধারিত মানগুলি ব্যবহার করা ভাল অভ্যাস নয় কারণ সর্বোত্তম জেনারেলাইজেশন এই পরামিতিগুলির উপযুক্ত সেটিংসের উপর নির্ভর করে, যা ডেটাসেট থেকে ডেটসেটে পৃথক হবে (এবং সমস্যাগুলির জন্য নমুনা থেকে অল্প ডেটা হবে) নমুনা). প্রাক-পরীক্ষামূলক গ্রিড অনুসন্ধানটি আরও খারাপ কারণ এটি আমার কাগজে আলোচিত ঠিক একই ধরণের পক্ষপাতিত্বের ফলাফল। এসভিএমগুলির জন্য ডেটা দুবার বিভক্ত করার সমস্যাটি প্রযোজ্য না কারণ আপনি অভ্যন্তরীণ সিভিতে মডেল নির্বাচনের মানদণ্ড হিসাবে প্রায় বিনামূল্যে নিখরচায় ভার্চুয়াল লেভ-ওয়ান-আউট ক্রস-বৈধতা ব্যবহার করতে পারেন।
ডিকরান মার্শুপিয়াল

অনুকূলিত পরামিতিগুলির প্রকরণের জন্য যাচাই করা একটি দুর্দান্ত পরামর্শ। আপনার যদি পর্যাপ্ত ডেটা থাকে যে প্যারামিটারগুলি এবং হাইপার-প্যারামিটারগুলি নির্ভরযোগ্যভাবে ডেটা থেকে অনুমান করা যায় তবে আমি আমার কাগজে যে ধরণের পক্ষপাতের কথা উল্লেখ করেছি তা সম্ভবত কোনও সমস্যার বেশি হবে না। যাইহোক, যদি একটি ছোট ডেটাসেটের কারণে অনুকূলিত হাইপার-প্যারামিটার মানগুলিতে প্রচুর পরিবর্তনশীলতা দেখা দেয় তবে পারফরম্যান্সের অনুমানের ক্ষেত্রে যথাযথ পক্ষপাত এড়ানোর জন্য নেস্টেড ক্রস-বৈধকরণ এবং এই জাতীয় অন্যান্য কঠোর পদ্ধতির সত্যই প্রয়োজনীয়।
ডিকরান মার্সুপিয়াল

@ ডিক্রানমারসুপিয়াল: আমি আমার ব্যাকগ্রাউন্ডটি আরও স্পষ্টভাবে ব্যাখ্যা করেছি, একবার দেখুন a এছাড়াও, আমি আপনার কাগজ আরও নিখুঁতভাবে পড়া। আমি মনে করি আমাদের বিষয়গুলি এর থেকে দূরে নয়। যদি আপনি চান, আসুন
আড্ডায় মিলিত হোন

@ ডিক্রানমারসুপিয়াল: (দুর্ভাগ্যক্রমে, আমার বেশিরভাগ তথ্যের জন্য, আমি বিশ্লেষণাত্মক ছাড়টি ব্যবহার করতে পারি না কারণ আমি নেস্ট্রাল / হায়ারারিকাল ডেটা স্ট্রাকচারগুলি করেছি)) এছাড়াও, আমি কিছু কুৎসিত বিস্ময়ের সাথে মিলিত হয়েছি - যাতে আমি কে-ফোল্ড বা আউট-অফ-বুটস্ট্র্যাপ বৈধতা করি ite তবে, এই প্রশ্নের জন্য এটি অফ-টপিক।
ক্যাবেলাইটস মনিকে

@ ডিক্রানমারসুপিয়াল: যদি অনুকূলিত পরামিতিগুলি স্থিতিশীল না হয় তবে আমি যাইহোক সমস্যায় আছি। অবশ্যই, তখন আমি এই উপসংহারটি শেষ করতে পারি না যে আমি নতুন ডেটার জন্য এই পরামিতিগুলি ব্যবহার করতে পারি। তবে, আমি তাদের কল করতাম না (বহু পরামিতিগুলির মধ্যে কোনটি?) চূড়ান্ত মডেলের জন্য অনুকূল ... আমি দেখলাম অপটিমাইজেশন পুরোপুরি বন্য হয়ে উঠেছে তবে এটি সর্বদা অভ্যন্তরীণ (টিউনিং) বৈধতার খুব বেশি সংবেদনশীল ফলাফলের সাথে এসেছিল । এবং আমি সর্বোত্তম মডেলের অভ্যন্তরীণ ক্রস বৈধকরণের প্রাক্কলনের সাথে বাইরের ক্রস বৈধকরণের সাথে তুলনা করে পরিমাপ করতে পারি। সেই অনুযায়ী উত্তর আপডেট করুন।
ক্যাবেলাইটস মনোকিকে

5

γCkterr(γ,C)γCγ,C{2nl,2nl+1,,2nu}γ

আমার মতে চাবিকাঠিটি হ'ল স্থানীয় সর্বনিম্ন (বা প্রতিটি 1-ম্লান প্রজেকশন) এর চারপাশে কিছুটা মসৃণতা সন্ধান করা এবং কেবলমাত্র সর্বনিম্ন সর্বনিম্ন গ্রহণ করা নয়।

γ(pσ)1pγCC


সুতরাং, ধরা যাক আমি 120 টি নমুনা সহ একটি ডেটাসেট করেছি। আমার কি প্রাথমিকভাবে 120 টি নমুনা ব্যবহার করে গামা এবং সি খুঁজে পাওয়া উচিত। তারপরে কে হোল্ডআউটগুলির জন্য একই গামা এবং সি ব্যবহার করে 10-पट ক্রস বৈধকরণ যখন 90% ডেটা প্রশিক্ষণের জন্য এবং 10% ডেটা পরীক্ষার জন্য ব্যবহার করে থাকে? এর অর্থ কি এই নয় যে আমি গামা এবং সি পেতে একই প্রশিক্ষণ সেটটি ব্যবহার করেছি এবং নমুনার কিছু অংশও পরীক্ষার সেটটিতে রয়েছে?
ব্যবহারকারী 13420

γC

(γ,C)(γ,C)(γ,C)

2
λβ

2
λβλββ(λ)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.