ক্রস-বৈধকরণ কৌশলগুলির সংমিশ্রণ


43

আমি ভাবছি যে কেউ যদি তাদের মধ্যে পার্থক্য নিয়ে আলোচনার সাথে ক্রস-বৈধকরণের কৌশলগুলির সংকলন এবং তাদের প্রত্যেকটি কখন ব্যবহার করতে হয় তার গাইড সম্পর্কে জানেন। উইকিপিডিয়ায় সর্বাধিক প্রচলিত কৌশলগুলির একটি তালিকা রয়েছে তবে আমি যদি আগ্রহী যে অন্য কৌশলগুলি আছে এবং যদি তাদের জন্য কোনও ট্যাক্সোনমি থাকে তবে আমি আগ্রহী।

উদাহরণস্বরূপ, আমি কেবলমাত্র একটি লাইব্রেরিতে চলেছি যা আমাকে নিম্নলিখিত কৌশলগুলির মধ্যে একটি চয়ন করতে দেয়:

  • ধরুন
  • বুটস্ট্র্যাপ
  • কে ক্রস-বৈধতা
  • একটা ছেড়ে দাও
  • স্তরিত ক্রস বৈধকরণ
  • ভারসাম্যযুক্ত স্তরযুক্ত ক্রস বৈধকরণ
  • স্ট্রেটেড হোল্ড আউট
  • স্তরযুক্ত বুটস্ট্র্যাপ

এবং বুটস্ট্র্যাপিং, হোল্ড আউট বা সিভিতে স্থিতিশীল ও ভারসাম্য বলতে কী বোঝার চেষ্টা করছি trying

লোকেরা চাইলে আমরা এই পোস্টটিকে একটি সম্প্রদায় উইকিতে রূপান্তর করতে পারি এবং কৌশলগুলি বা বিভাগের বিষয়গুলি এখানে আলোচনা সংগ্রহ করতে পারি।


এই পদ্ধতিটি আরও কার্যকর হবে যদি আমরা প্রতিটি পদ্ধতির ব্যাখ্যার সাথে লিঙ্ক করতে পারি।
এমকেটি - মনিকা

উত্তর:


16

আপনি এই তালিকায় যুক্ত করতে পারেন:

  • বার বার ক্রস বৈধতা
  • গ্রুপ-আউট ছাড়ুন ক্রস-বৈধতা
  • ব্যাগের বাইরে (এলোমেলো বন এবং অন্যান্য ব্যাগযুক্ত মডেলের জন্য)
  • 632+ বুটস্ট্র্যাপ

এই কৌশলগুলি কীভাবে ব্যবহার করতে হয় বা কখন সেগুলি ব্যবহার করতে হয় সে বিষয়ে আমার কাছে খুব বেশি পরামর্শ নেই। সিভি, বুট, বুট, বুট 632, লেভ-ওয়ান-আউট, লিভ-গ্রুপ-আউট এবং ব্যাগের বাইরে ব্যাগের ক্রস-বৈধতা তুলনা করতে আপনি আরে ক্যারেট প্যাকেজটি ব্যবহার করতে পারেন ।

সাধারণভাবে, আমি সাধারণত বুস্টারপ ব্যবহার করি কারণ এটি পুনরায় কে-ফোল্ড সিভি, বা লেভ-ওয়ান-আউট সিভির তুলনায় কম কম্পিউটেশনাল নিবিড়। বুট 2৩২ আমার পছন্দের অ্যালগরিদম কারণ এটির জন্য বুটস্ট্র্যাপের চেয়ে বেশি গণনার প্রয়োজন হয় না এবং এটি নির্দিষ্ট পরিস্থিতিতে ক্রস-বৈধতা বা বেসিক বুটস্ট্যাপের চেয়ে ভাল হতে দেখায়।

আমি প্রায় সবসময় ক্রস-বৈধতা না করে এলোমেলো বনগুলির জন্য আউট-অফ-ব্যাগ ত্রুটি অনুমান ব্যবহার করি। ব্যাগের বাইরে থাকা ত্রুটিগুলি সাধারণত নিরপেক্ষ থাকে এবং এলোমেলো বনগুলি যেমন হয় তেমন গণনা করতে যথেষ্ট সময় নেয়।


3
এই প্রতিটি ব্যবহার করার বিষয়ে কোন পরামর্শ?
হোবার

16

কে-ফোল্ড ক্রস-বৈধকরণ (সিভি) এলোমেলোভাবে আপনার কে কে পার্টিশনগুলিতে বিভক্ত করে এবং ফলস্বরূপ আপনি সেই কে-অংশগুলির একটি অংশকে পরীক্ষার কেস হিসাবে ধরে রাখেন এবং আপনার প্রশিক্ষণের ডেটা হিসাবে অন্যান্য কে -১ অংশকে একসাথে রেখে দেন। লেভ ওয়ান আউট (এলইউ) হল বিশেষ ক্ষেত্রে এটি যেখানে আপনি আপনার এন ডেটা আইটেমগুলি নিয়ে যান এবং এন-ফোল্ড সিভি করেন। কিছুটা অর্থে হোল্ড আউট হ'ল আরও একটি বিশেষ কেস, যেখানে আপনি কেবল আপনার কে ফোল্ডগুলির মধ্যে একটিকে পরীক্ষা হিসাবে বেছে নেন এবং সমস্ত কে ফোল্ডারে ঘোরান না।

আমি যতদূর জানি, দশগুণ সিভি হ'ল ডি রিগার, কারণ এটি আপনার ডেটা দক্ষতার সাথে ব্যবহার করে এবং ভাগ্যবান পার্টিশন পছন্দগুলি এড়াতে সহায়তা করে। হোল্ড আউট আপনার ডেটাগুলির কার্যকর ব্যবহার করে না এবং এলওইউ তেমন শক্তিশালী নয় (বা এর মতো কিছু) তবে 10-ইশ-ভাঁজটি ঠিক ঠিক।

যদি আপনি জানেন যে আপনার ডেটাতে একাধিক বিভাগ রয়েছে, এবং এক বা একাধিক বিভাগগুলি বাকীগুলির চেয়ে অনেক ছোট, আপনার কিছু কে এলোমেলো পার্টিশনগুলিতে এমনকি ছোট ছোট কোনও বিভাগও থাকতে পারে না, যা খারাপ হবে। প্রতিটি পার্টিশনটি যুক্তিসঙ্গতভাবে প্রতিনিধি কিনা তা নিশ্চিত করার জন্য, আপনি স্তরবদ্ধকরণ ব্যবহার করুন: আপনার ডেটা বিভাগগুলিতে বিভক্ত করুন এবং তারপরে প্রতিটি বিভাগ থেকে এলোমেলো এবং আনুপাতিকভাবে চয়ন করে এলোমেলো পার্টিশন তৈরি করুন।

কে-ফোল্ড সিভিতে এই সমস্ত প্রকারের পরিবর্তনগুলি ছাড়াই আপনার ডেটা থেকে চয়ন করে। বুটস্ট্র্যাপ প্রতিস্থাপনের সাথে ডেটা পছন্দ করে, তাই একই ড্যাটাম একাধিকবার অন্তর্ভুক্ত করা যেতে পারে এবং কিছু ডেটা একেবারেই অন্তর্ভুক্ত করা যায় না। (প্রতিটি "পার্টিশন" এ কে-ভাঁজগুলির বিপরীতে এন আইটেম থাকবে, যার প্রতিটি পার্টিশনে এন / কে আইটেম থাকবে))

(আমাকে স্বীকার করতে হবে যে সিভিতে বুটস্ট্র্যাপ কীভাবে ব্যবহৃত হবে তা আমি ঠিক জানি না। টেস্টিং এবং সিভির মূলনীতিটি নিশ্চিত করা হয় যে আপনি যে প্রশিক্ষণ নিয়েছিলেন সে ডেটা পরীক্ষা না করে আপনি পরীক্ষা করেন না, তাই আপনি পান আপনার কৌশলটি সহগতিগুলি কীভাবে আসল বিশ্বে কাজ করতে পারে তার একটি আরও বাস্তব ধারণা)

সম্পাদনা: প্রতি মন্তব্যগুলিতে পরিষ্কার করতে সহায়তা করতে "হোল্ড আউট আপনার ডেটার দক্ষ ব্যবহার করে না" সহ "হোল্ড আউট দক্ষ নয়" প্রতিস্থাপন করা হয়েছে।


1
আপনি যখন বলেন যে "হোল্ড আউট দক্ষ নয়", আমি নিশ্চিত না যে আমি অনুসরণ করি। দক্ষতা বলতে এখানে কী বোঝ? নিয়মিত এন-ভাঁড়ার বিপরীতে, হোল্ড আউটগুলি ভাঁজগুলির মধ্যে ঘোরান না, তাই এটি আরও দ্রুত হওয়া উচিত। এর পরিবর্তে আপনি কি বোঝাতে চেয়েছেন যে এটি নিয়মিত এন-ফোল্ড সিভিয়ের চেয়ে বেশি ফিট করার লড়াইয়ের চেয়ে খারাপ?
অ্যামিলিও ওয়াজকেজ-রেইনা

2
"দক্ষ" দ্বারা আমার অর্থ এটি আপনার ডেটা দক্ষতার সাথে ব্যবহার করে না। কে-ফোল্ড সিভির সৌন্দর্য হ'ল আপনার 100% ডেটা প্রশিক্ষণের জন্য ব্যবহৃত হয় এবং আপনার 100% ডেটা পরীক্ষার জন্য ব্যবহৃত হয় যা আপনার ডেটার দক্ষতার সাথে ব্যবহার করে। অবশ্যই মূল কথাটি হ'ল আপনার সমস্ত ডেটা একই সময়ে পরীক্ষার জন্য এবং প্রশিক্ষণের জন্য ব্যবহার হয় না, যা উপায়-আশাবাদী পরীক্ষার ফলাফল (অত্যধিক মানানসই) প্রদান করবে। একটি স্থিতিশীল বিভাগ তৈরি করে, হোল্ড আউট বলেছে যে, বলুন, আপনার ডেটাগুলির 1/3 কখনই প্রশিক্ষণের জন্য ব্যবহার করা হবে না এবং আপনার ডেটার 2/3 কখনও পরীক্ষার জন্য ব্যবহার করা হবে না, আপনার ডেটাতে প্রচুর তথ্য নষ্ট করে।
ওয়েইন

@Wayne holdout মূল্নির্ধারক নয় এসিম্পটোটিকভাবে পক্ষপাতিত্বহীন? এছাড়াও, সাধারণ কে-ফোল্ড সিভি বারবার কে-ফোল্ড সিভিয়ের চেয়ে II ত্রুটি টাইপ করার প্রবণতা বেশি।
chl

@ সিএইচএল: আমি বিশ্বাস করি আপনি উভয়ই গণিতে ঠিক আছেন। আমি বারবার কে-ফোল্ড সিভি ব্যবহার করি নি, তবে এটির কম বৈকল্পিক হওয়া উচিত যা সাহায্য করবে।
ওয়েইন

3

আমি উইকিপিডিয়া নিবন্ধে লিঙ্কযুক্ত একটি উল্লেখ খুঁজে পেয়েছি বেশ কার্যকর

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.48.529&rep=rep1&type=pdf

"সঠিকতা অনুমান এবং মডেল নির্বাচনের জন্য ক্রস-বৈধতা এবং বুটস্ট্র্যাপের একটি গবেষণা", রন কোহাবী, আইজেসিএআই 95

এটিতে সিভি কৌশলগুলির একটি উপসেটের জন্য অভিজ্ঞতাগত তুলনা রয়েছে। Tl; dr সংস্করণটি মূলত "10-ভাঁজ সিভি ব্যবহার করুন"।


1

... এবং সেগুলির প্রত্যেকটি কখন ব্যবহার করবেন সে সম্পর্কে একটি গাইড ...

দুর্ভাগ্যক্রমে যে সমস্যাটি এটির জন্য .ণ পাওয়ার চেয়ে কঠিন। ক্রস-বৈধকরণের কমপক্ষে 2 টি প্রধান ব্যবহার রয়েছে: একটি মডেল নির্বাচন করা এবং মডেলটির কার্যকারিতা মূল্যায়ন করা।

মোটামুটিভাবে বলতে গেলে, আপনি যদি উচ্চতর ট্রেন-থেকে-পরীক্ষার অনুপাত ব্যবহার করে ডেটা বিভক্ত করে এমন কোনও সিভি বৈকল্প ব্যবহার করেন তবে এটি মূল্যায়নের জন্য আরও ভাল হতে পারে। একটি বৃহত্তর প্রশিক্ষণ সেট ব্যবহার করা আরও সঠিকভাবে পুরো ডেটাসেটে ফিট মডেলের কর্মক্ষমতা নকল করবে m

তবে একটি উচ্চ ট্রেন-থেকে-পরীক্ষার অনুপাত নির্বাচনের জন্য আরও খারাপ হতে পারে। ভাবুন সত্যই এমন একটি "সেরা" মডেল রয়েছে যা আপনার বেছে নেওয়া উচিত "তবে আপনার ডেটাসেটটি বেশ বড়। তারপরে, খুব বড় মডেলগুলি যা সামান্য পরিমাণে ফিট করে তাদের "সেরা" মডেল হিসাবে প্রায় একই সিভির পারফরম্যান্স থাকবে (কারণ আপনি সাফল্যের সাথে তাদের উদ্দীপনাজনিত পরামিতিগুলি নগন্য হিসাবে অনুমান করবেন)। ডেটা এবং সিভি / বিভাজন পদ্ধতিতে এলোমেলোতা আপনাকে সত্যিকারের "সেরা" মডেলের পরিবর্তে প্রায়শই একটি অত্যুচ্চ মডেল বাছাই করতে বাধ্য করে।

দেখুন শাও (1993), "ক্রস-ভ্যালিডেশন দ্বারা লিনিয়ার মডেল নির্বাচন" রৈখিক রিগ্রেশনের ক্ষেত্রে পুরোনো মধ্যে asymptotic তত্ত্বের। ইয়াং (২০০)), "রিগ্রেশন পদ্ধতির তুলনা করার জন্য ক্রস বৈধকরণের ধারাবাহিকতা" এবং ইয়াং (২০০)), "শ্রেণিবিন্যাসের জন্য তুলনা শেখার পদ্ধতিগুলি" আরও সাধারণ রিগ্রেশন এবং শ্রেণিবিন্যাস সমস্যার জন্য অ্যাসিম্পটোটিক তত্ত্ব দেয়। তবে কঠোর সসীম-নমুনা পরামর্শটি পাওয়া শক্ত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.