জ্যাকনিফিংয়ের কোনও সমসাময়িক ব্যবহার রয়েছে?


12

প্রশ্ন: বুটস্ট্র্যাপিং জ্যাকনিফাইংয়ের চেয়ে উচ্চতর ; তবে আমি ভাবছি যে এমন কিছু উদাহরণ রয়েছে যেখানে প্যারামিটারের অনুমানগুলি থেকে অনিশ্চয়তা চিহ্নিত করার জন্য জ্যাককনিফিংই একমাত্র বা কমপক্ষে একটি কার্যকর বিকল্প। এছাড়াও, ব্যবহারিক পরিস্থিতিতে বুটস্ট্র্যাপিংয়ের সাথে তুলনামূলকভাবে পক্ষপাতদুষ্ট / ভুল কীভাবে জ্যাককনিফিং হয় এবং আরও জটিল বুটস্ট্র্যাপটি বিকাশের আগে জ্যাকনিফের ফলাফলগুলি প্রাথমিক অন্তর্দৃষ্টি সরবরাহ করতে পারে?

কিছু প্রসঙ্গ: একটি বন্ধু একটি ব্ল্যাক-বাক্স মেশিন লার্নিং অ্যালগরিদম ( ম্যাক্সেন্ট ) ভৌগলিক ডেটা শ্রেণীবদ্ধ করতে ব্যবহার করছে যা "উপস্থিতি কেবল" বা "কেবল ধনাত্মক"। সাধারণ মডেল মূল্যায়ন সাধারণত ক্রস-বৈধকরণ এবং আরওসি বক্ররেখা ব্যবহার করে করা হয়। তবে, তিনি মডেলের আউটপুটটি মডেল আউটপুটটির একক সংখ্যার বিবরণ পেতে ব্যবহার করছেন এবং সেই সংখ্যার কাছাকাছি একটি আত্মবিশ্বাসের ব্যবধান চান; জ্যাককনিফিং এই মানটির আশেপাশে অনিশ্চয়তার বৈশিষ্ট্যযুক্ত করার একটি যুক্তিসঙ্গত উপায় বলে মনে হয়। বুটস্ট্র্যাপিং প্রাসঙ্গিক বলে মনে হয় না কারণ প্রতিটি ডেটা পয়েন্ট মানচিত্রে একটি অনন্য অবস্থান যা প্রতিস্থাপনের সাথে পুনরায় স্যাম্পল করা যায় না। মডেলিং প্রোগ্রাম নিজেই শেষ পর্যন্ত তার যা প্রয়োজন তা সরবরাহ করতে সক্ষম হতে পারে; তবে, আমি / জ্যাককনিফিং যখন দরকারী হতে পারে তখন আমি আগ্রহী।


4
এই জাতীয় ম্যাপিং অ্যাপ্লিকেশনগুলি - পৃথক নমুনাযুক্ত অবস্থানগুলি থেকে অনুমান করা - আপনি যে কারণে জ্যাককনিফিংয়ের বিস্তৃত ব্যবহারের বিষয়টি উল্লেখ করেছি তা হ'ল। উদাহরণস্বরূপ, ক্রিগিংয়ের কাজ সম্পাদনের প্রাথমিক প্রক্রিয়া এটি procedure
হোবল

কিছু কম নমুনা সেটিংসে, কারণ প্রতিস্থাপনের সাথে বুটস্ট্র্যাপিং নমুনা, পুরো ডেটা ম্যাট্রিক্স একক হয়ে উঠতে পারে, তাই অনেকগুলি মডেল ফিট করা অসম্ভব।
rep_ho

উত্তর:


4

আপনি যদি জ্যাককিনিফিংটি কেবল ছুটি-ওয়ান- আউটকেই অন্তর্ভুক্ত করে না কেন তবে ফোল্ড পদ্ধতিগুলির মতো কোনও ধরণের পুনরায় মডেলিং-বিহীন প্রতিস্থাপনকে অন্তর্ভুক্ত করেন তবে আমি এটিকে একটি কার্যকর বিকল্প হিসাবে বিবেচনা করি এবং এটি নিয়মিত ব্যবহার করি, যেমন বেলাইটস এট আল-তে। : অ্যাস্ট্রোকাইটোমা টিস্যুগুলির রমন বর্ণালী গ্রেডিং: নরম রেফারেন্স তথ্য ব্যবহার করে। এনাল বায়োয়ানাল কেম, 2011, 400, 2801-2816k

আরও দেখুন: ক্রস-বৈধতাযুক্ত শ্রেণিবদ্ধকরণ নির্ভুলতার জন্য আস্থার ব্যবধান


আমি বেশ কয়েকটি কারণে এলইউকে এড়িয়ে চলি এবং এর পরিবর্তে পুনরাবৃত্ত / পুনরাবৃত্তি ফোল্ড স্কিম ব্যবহার করি। আমার ক্ষেত্রে (রসায়ন / স্পেকট্রোস্কোপি / কেমোমেট্রিক্স), আউট-অফ-বুটস্ট্র্যাপ বৈধতার চেয়ে ক্রস বৈধতা অনেক বেশি সাধারণ। আমাদের তথ্য / typcial অ্যাপ্লিকেশনের জন্য আমরা সেখানে পাওয়া গেছে বার iterated ধা ক্রস বৈধতা এবং আউট-অফ-বুটস্ট্র্যাপ কর্মক্ষমতা অনুমান অনুরূপ মোট ত্রুটি আছে পুনরাবৃত্তিও [Beleites এট অল। : স্পার্স ডেটাসেট ব্যবহার করে শ্রেণিবিন্যাস ত্রুটির অনুমানের বৈচিত্র্য হ্রাস। কেম.আইন্টেল.ল্যাব.সিস্ট।, 2005, 79, 91 - 100.]kikik

বুটস্ট্র্যাপিংয়ের চেয়ে পুনরাবৃত্ত ক্রস বৈধকরণের স্কিমগুলি দেখার জন্য আমি যে বিশেষ সুবিধাটি দেখছি তা হ'ল আমি খুব সহজেই স্থায়িত্ব / মডেল অনিশ্চয়তা ব্যবস্থা গ্রহণ করতে পারি যা স্বজ্ঞাতভাবে ব্যাখ্যা করা যায়, এবং এটি পারফরম্যান্সের পরিমাপের ক্ষেত্রে ভিন্নতা অনিশ্চয়তার দুটি ভিন্ন কারণকে পৃথক করে যা আরও জড়িত বুটস্ট্র্যাপ পরিমাপ।
ধরনের প্রশ্নের ক্রস বৈধতা অনুরূপ বরং সরাসরি য়ে কেউ আমাকে ক্রস বৈধতা / jackknifing পায় যুক্তি এক লাইন মডেল বলিষ্ঠতার এ খুঁজছেন হয় "যদি আমি বিনিময় আমার মডেল ঘটবে জন্য মামলা নতুন ক্ষেত্রে?" xxবা " কেস এক্সচেঞ্জ করে ট্রেনিং ডেটা বিবিধ করা সম্পর্কে আমার মডেল কতটা শক্ত ?"x এটি বুটস্ট্র্যাপিংয়ের ক্ষেত্রেও প্রযোজ্য তবে সরাসরি কম।

নোট করুন যে আমি আত্মবিশ্বাসের অর্জন করার চেষ্টা করি না , কারণ আমার ডেটা সহজাতভাবে ক্লাস্টারড ( রোগীদের স্পেকট্রা ), তাই আমি রিপোর্ট করতে পছন্দ করিnsnpns

  1. একটি (রক্ষণশীল) দ্বিপদী আত্মবিশ্বাসের ব্যবধান গড় পর্যবেক্ষণের পারফরম্যান্স এবং নমুনার আকার হিসাবে ব্যবহার করেnp

  2. ক্রস বৈধকরণের পুনরাবৃত্তির মধ্যে আমি যে বৈচিত্রটি পর্যবেক্ষণ । ভাঁজ করার পরে , প্রতিটি কেস ঠিক একবার পরীক্ষা করা হয়, যদিও বিভিন্ন সরোগেট মডেল দ্বারা। সুতরাং রানগুলির মধ্যে যে কোনও প্রকারের বৈকল্পিকতা দেখা যায় তা অবশ্যই মডেল অস্থিরতার কারণে ঘটতে পারে।iki

সাধারণত, উদাহরণস্বরূপ, যদি মডেলটি ভালভাবে সেট আপ করা থাকে, 2. এটি কেবলমাত্র দেখানোর জন্য প্রয়োজন যে এটি 1 এর পরিবর্তকের চেয়ে অনেক ছোট এবং মডেলটি যুক্তিযুক্তভাবে স্থিতিশীল। যদি ২ টি অ-তুচ্ছ হিসাবে প্রমাণিত হয় তবে এটি সমবেত মডেলগুলি বিবেচনা করার সময় হয়েছে: মডেল একীকরণ কেবলমাত্র মডেল অস্থিতিশীলতার কারণে পরিবর্তিত হওয়ার জন্য সহায়তা করে, এটি পরীক্ষার ক্ষেত্রে সীমাবদ্ধ সংখ্যার কারণে পারফরম্যান্স পরিমাপের প্রকরণের অনিশ্চয়তা হ্রাস করতে পারে না ।

নোট করুন যে এই জাতীয় ডেটার জন্য পারফরম্যান্স আস্থা অন্তরগুলি তৈরি করার জন্য, আমি কমপক্ষে বিবেচনা করব যে ক্রস বৈধকরণের রানগুলির মধ্যে পরিলক্ষিত বৈকল্পিকতা সেই অস্থিরতার মডেলের গড়ের , অর্থাৎ আমি মডেল অস্থিরতা বৈকল্পিক বলতে পারি হয় ক্রস বৈধতা রানে মধ্যে পর্যবেক্ষিত ভ্যারিয়েন্স; অতিরিক্ত সীমাবদ্ধ কেস নম্বর কারণে প্রকরণ - শ্রেণিবদ্ধকরণ (হিট / ত্রুটি) কর্মক্ষমতা ব্যবস্থা জন্য এটি দ্বিপদী। ক্রমাগত ব্যবস্থা গ্রহণের জন্য, আমি ক্রস-বৈধতা চালনার ভেরিয়েন্স, এবং এর থেকে প্রাপ্ত মডেলগুলির জন্য অস্থিরতা-ধরণের বৈকল্পিকের অনুমানের মধ্য থেকে ভিন্নতা আনতে চেষ্টা করবikkkk

Crossvalidation সুবিধা এখানে যে আপনার মডেলকে অস্থিরতা এবং পরীক্ষা মামলার সসীম সংখ্যা দ্বারা সৃষ্ট অনিশ্চয়তা দ্বারা সৃষ্ট অনিশ্চয়তা মধ্যে একটি স্পষ্ট বিচ্ছেদ পাবেন। সংশ্লিষ্ট অসুবিধা অবশ্যই হ'ল আপনি যদি সীমাবদ্ধ সংখ্যক প্রকৃত কেসগুলিকে বিবেচনায় নিতে ভুলে যান তবে আপনি প্রকৃত অনিশ্চয়তাটিকে কঠোরভাবে অবমূল্যায়ন করবেন। তবে এটি বুটস্ট্র্যাপিংয়ের জন্যও ঘটবে (যদিও কিছুটা কম হলেও)।


এখনও অবধি, যুক্তি প্রদত্ত ডেটা সেটের জন্য আপনি যে মডেলটি উত্পন্ন করেছেন তার জন্য কর্মক্ষমতা পরিমাপের উপর মনোনিবেশ করে । যদি আপনি প্রদত্ত অ্যাপ্লিকেশনটির জন্য এবং প্রদত্ত নমুনা আকারের কোনও ডেটা সেট বিবেচনা করেন , তবে বৈকল্পিক ক্ষেত্রে তৃতীয় অবদান রয়েছে যা বৈধতা পুনঃনির্মাণের মাধ্যমে মাপানো যায় না, উদাহরণস্বরূপ দেখুন বেনজিও এবং গ্র্যান্ডভ্যালেট: কে-ফোল্ড ক্রসের বৈকল্পিকতার কোনও নিরপেক্ষ অনুমানক -ভ্যালিডেশন, জার্নাল অফ মেশিন লার্নিং রিসার্চ, 5, 1089-1105 (2004)। , আমাদের কাছে বেলাইটস এট আল-এ এই তিনটি অবদান দেখানোর পরিসংখ্যানও রয়েছে : শ্রেণিবদ্ধকরণ মডেলগুলির জন্য নমুনা আকারের পরিকল্পনা,, আনল চিম অ্যাক্টা, 760, 25-33 (2013)। ডিওআই: 10.1016 / জে.এ.সি.এ.এল.২.১১.১০.০০ )
আমি মনে করি যে এখানে যা ঘটেছিল তা অনুমানের ফলস্বরূপ যে পুনরায় মডেলিংটি সম্পূর্ণ নতুন নমুনাকে ভেঙে আঁকার অনুরূপ।

যদি অ্যাপ্লিকেশনটির জন্য একটি নির্দিষ্ট মডেল তৈরি করা এবং এই মডেলটিকে বৈধতা দেওয়ার পরিবর্তে মডেল বিল্ডিং অ্যালগরিদম / কৌশল / হিউরিস্টিক্সের তুলনা করা হয় তবে এটি গুরুত্বপূর্ণ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.