নকশাকাগুলি কেন এত অযৌক্তিক কার্যকর


14

দেখে মনে হচ্ছে এটি অচল হয়ে পড়েছে যে শিক্ষার্থীদের একটি ঝাঁকুনি সেরা সম্ভাব্য মডেল ফলাফলের দিকে নিয়ে যায় - এবং এটি খুব বিরল হয়ে উঠছে, উদাহরণস্বরূপ, একক মডেলদের যেমন কাগলের মতো প্রতিযোগিতা জয়ের জন্য। কেন ছাঁকনিগুলি এত ঘৃণ্য কার্যকর তার জন্য কোনও তাত্ত্বিক ব্যাখ্যা আছে?


1
আমার অনুমান হবে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য তবে আমার কোনও যৌক্তিকতা নেই।

উত্তর:


13

একটি নির্দিষ্ট মডেলের জন্য আপনি এটি ডেটা খাওয়ান, বৈশিষ্ট্যগুলি চয়ন করুন, হাইপারপ্যারামিটারস ইত্যাদি বেছে নিন। বাস্তবের তুলনায় এটি তিন ধরণের ভুল করে:

  • বায়াস (খুব কম মডেলের জটিলতার কারণে, আপনার ডেটাতে একটি নমুনা পক্ষপাত)
  • বৈকল্পিকতা (আপনার ডেটাতে শব্দ করার কারণে, আপনার উপাত্তের তুলনায়)
  • আপনি যে বাস্তবতার পূর্বাভাস দেওয়ার চেষ্টা করছেন তার এলোমেলোতা (বা আপনার ডেটাসেটে ভবিষ্যদ্বাণীপূর্ণ বৈশিষ্ট্যের অভাব)

এই মডেলগুলির একটি সংখ্যা গড়ে গড়ে এনসেমেবলগুলি। স্যাম্পলিং পক্ষপাতের কারণে পক্ষপাতিত্ব সুস্পষ্ট কারণে স্থির করা হবে না, এটি কিছু মডেল জটিলতার পক্ষপাতিত্ব ঠিক করতে পারে, তবে পরিবর্তিত ভুলগুলি আপনার বিভিন্ন মডেলের তুলনায় খুব আলাদা different বিশেষত নিম্ন সংযুক্ত মডেলগুলি এই ক্ষেত্রগুলিতে খুব আলাদা ভুল করে, নির্দিষ্ট মডেলগুলি আপনার বৈশিষ্ট্য জায়গার কিছু অংশে ভাল পারফর্ম করে। এই মডেলগুলি গড়ে গড়ে আপনি এই প্রকরণটি খানিকটা হ্রাস করেন। এই জন্য জড়িত চকচকে।


6

নির্বাচিত উত্তরটি দুর্দান্ত, তবে আমি দুটি বিষয় যুক্ত করতে চাই:

  1. দেখা গেছে যে গড় মানুষের ভবিষ্যদ্বাণীগুলি কোনও পৃথক পূর্বাভাসের চেয়ে ভাল পূর্বাভাস দেয়। এটি জনতার বুদ্ধি হিসাবে পরিচিত । এখন, আপনি তর্ক করতে পারেন যে এটি কারণ কিছু লোকের বিভিন্ন তথ্য থাকে, তাই আপনি কার্যকরভাবে তথ্য গড় করছেন। তবে না, এটি কোনও জারে শিমের সংখ্যা অনুমান করার মতো কাজের জন্যও সত্য। আমি অনুমান করি এটি ডেটা মাইনিং মডেল সম্পর্কে উপরোক্ত কিছু কারণের সাথে সম্পর্কিত।
  2. কিছু কৌশল যেমন নিউরাল নেটওয়ার্কগুলিতে ড্রপআউট পদ্ধতি (যেখানে প্রশিক্ষণের সময় প্রতিটি পুনরাবৃত্তিতে আপনি কেবল আপনার নিউরাল নেটওয়ার্কের একটি অংশ ব্যবহার করেন) ফলাফল নিউরাল নেটওয়ার্কগুলির একটি সংযোজনের অনুরূপ ফলাফল দেয়। যুক্তিটি হ'ল আপনি নোডকে কার্যকরভাবে একটি মেটা-জুটি তৈরি করে অন্যান্য নোডের মতো একই পূর্বাভাসকারী কাজ করতে বাধ্য করছেন। আমি এই বিষয়টিটি বলার জন্য এটি বলছি যে আমরা traditionalতিহ্যবাহী মডেলগুলির মধ্যে ensembles এর কিছু সুবিধা চালু করতে সক্ষম হতে পারি।

6

তাত্ত্বিক এবং ব্যবহারিক কারণে ভবিষ্যদ্বাণীতে এনসেমবেলস জিতেছে।

সর্বোত্তম পূর্বাভাসের একটি মৌলিক তত্ত্ব রয়েছে, যদি আমরা আগের ঘটনাগুলির জ্ঞানের উপর ভিত্তি করে পরবর্তী ইভেন্টটির অনুক্রমের পূর্বাভাস দিই। সলোমনফের ভবিষ্যদ্বাণী (সলোমনঅফ ১৯64৪) বেশ কয়েকটি ইন্দ্রিয়তে যথাযথভাবে সর্বোত্তম, এটি সহ "এটি কেবলমাত্র নিখুঁত ন্যূনতম পরিমাণের ডেটা সহ কোনও গণনাযোগ্য ক্রমের পূর্বাভাস দিতে শিখবে” " (হুটার, লেগ এবং ভিটানাই ২০০ 2007) এপিকিউরিয়ান ("সমস্ত তত্ত্বগুলি রাখুন") এবং এপ্লিক্যুরানকে সমন্বিত করে প্রোগ্রামটির কলমোগোরভ জটিলতা এবং প্রোগ্রামটি যে ডেটাগুলিকে এখন পর্যন্ত নির্ধারিত সম্ভাবনা অনুসারে একটি সলোমনফ প্রিডেক্টর বিদ্যমান ডাটাগুলির সাথে সামঞ্জস্যপূর্ণ সমস্ত প্রোগ্রামকে ওজন করেন and ওখাম ("সাধারণ তত্ত্বগুলি পছন্দ করুন") বায়েশিয়ান কাঠামোর মধ্যে দর্শন।

সলোমনফের পূর্বাভাসের অনুকূল বৈশিষ্ট্যগুলি আপনার উল্লেখযোগ্য দৃ the় সন্ধানের ব্যাখ্যা দেয়: মডেল, উত্স বা বিশেষজ্ঞের উপরে গড় অনুমানের উন্নতি করে এবং গড় পূর্বাভাস এমনকি সেরা একক ভবিষ্যদ্বাণীকেও ছাড়িয়ে যায়। অনুশীলনে দেখা বিভিন্ন জাঁকজমক পদ্ধতিগুলি সলোমনঅফের পূর্বাভাসের গণনাযোগ্য অনুমান হিসাবে দেখা যেতে পারে - এবং এমএমএলের মতো কিছু (ওয়ালেস 2005) স্পষ্টভাবে সম্পর্কগুলি অন্বেষণ করে, যদিও বেশিরভাগ ক্ষেত্রে তা হয় না।

ওয়ালেস (২০০৫) নোট করেছেন যে সলোমনফের ভবিষ্যদ্বাণী পার্সোনোনিয়াস নয় - এটি মডেলগুলির একটি অসীম পুল রাখে - তবে বেশিরভাগ ভবিষ্যদ্বাণীমূলক শক্তি অবশ্যম্ভাবীভাবে অপেক্ষাকৃত ছোট ছোট মডেলগুলিতে পড়ে। কিছু ডোমেইনে একক সেরা মডেল (বা প্রায় অদম্য মডেলগুলির পরিবার) ভবিষ্যদ্বাণীপূর্ণ শক্তি এবং জেনেরিক এনসেম্বলসকে ছাড়িয়ে যায়, তবে সামান্য তত্ত্বের সাথে জটিল ডোমেনগুলিতে সম্ভবত বেশিরভাগ উত্তরোত্তর সম্ভাবনা ধরা দেয় না, এবং সুতরাং দুর্ভাগ্যজনক প্রার্থীদের উপর গড় গড় অনুমানের উন্নতি করা উচিত। নেটফ্লিক্স পুরষ্কার জিততে বেলকোর দল 450 টির বেশি মডেল (কোরেন 2009) মিশ্রিত করেছে।

মানুষ সাধারণত একটি একক ভাল ব্যাখ্যা চায়: পদার্থবিদ্যার মতো "হাই-থিওরি" ডোমেনে, এগুলি ভালভাবে কাজ করে। প্রকৃতপক্ষে যদি তারা অন্তর্নিহিত কার্যকারণ গতিশীলতা ক্যাপচার করে তবে তাদের প্রায় অপরাজেয় হওয়া উচিত। তবে যেখানে উপলভ্য তত্ত্বগুলি ঘটনাকে ঘনিষ্ঠভাবে মাপসই করে না (বলুন, ফিল্মের সুপারিশ বা ভূ-রাজনীতি), একক মডেলগুলির তুলনামূলক কম দক্ষতা দেখাবে: সমস্তই অসম্পূর্ণ, তাই কোনওটিরই আধিপত্য করা উচিত নয়। সুতরাং সাম্প্রতিক সময়ে জড়োকরণগুলি (মেশিন লার্নিংয়ের জন্য) এবং জনগণের উইজডম (বিশেষজ্ঞদের জন্য) এবং আইএআরপিএ এসি এবং বিশেষত গুড জাজমেন্ট প্রজেক্টের (টেটলক অ্যান্ড গার্ডিনার 2015) মত প্রোগ্রামগুলির সাফল্যের উপর সাম্প্রতিক জোর।

তথ্যসূত্র

  • এম। হটার, এস লেগ এবং পি ভিটানাই, "অ্যালগোরিদমিক সম্ভাবনা," স্কলার্পিডিয়া, খণ্ড। 2, 2007, পি। 2572।
  • ওয়াই। কোরেন, "নেটফ্লিক্স গ্র্যান্ড প্রাইজ-এর বেলকোর সলিউশন," ২০০৯।
  • সলোমনফ, রে (মার্চ 1964)। "ইন্ডাকটিভ ইনফারেন্স পার্ট I এর একটি আনুষ্ঠানিক তত্ত্ব" (পিডিএফ)। তথ্য এবং নিয়ন্ত্রণ 7 (1): 1-222। ডোই: 10,1016 / S0019-9958 (64) 90223-2।
  • সলোমনফ, রে (জুন 1964)। "ইন্ডাকটিভ ইনফারেন্স পার্ট II এর একটি আনুষ্ঠানিক তত্ত্ব" (পিডিএফ)। তথ্য এবং নিয়ন্ত্রণ 7 (2): 224-254। ডোই: 10,1016 / S0019-9958 (64) 90131-7।
  • পিই টেটলক, বিশেষজ্ঞ রাজনৈতিক রায়: এটি কতটা ভাল? আমরা কীভাবে জানতে পারি ?, প্রিন্সটন ইউনিভার্সিটি প্রেস, 2005
  • টেটলক, পিই, এবং গার্ডনার, ডি (2015)। সুপার ফোরকাস্টিং: অনুমানের শিল্প ও বিজ্ঞান। নিউ ইয়র্ক: ক্রাউন।
  • সিএস ওয়ালেস, ন্যূনতম বার্তার দৈর্ঘ্য, স্প্রিঞ্জার-ভার্লাগ, 2005 দ্বারা পরিসংখ্যানগত এবং সূচকীয় সূচনা।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.