আমি প্রথমে আপনার তৃতীয় প্রশ্নের উত্তর দেব এবং আপনার অন্য দুটি পরে সম্বোধন করব।
- "লাসো (এবং সম্পর্কিত) ... তবে উত্তরোত্তর বিতরণে নেই" বলার সময় তাঁর অর্থ কী?
তার স্লাইডগুলির এই চিত্রটি তার অর্থ বোঝায়। পূর্বের বিতরণ হিসাবে লসো নিয়ন্ত্রককে প্রকাশ করা মানে আপনার পূর্বের বিতরণটি একটি ল্যাপ্লেসিয়ান বা ডাবল-এক্সপেনসিয়াল বিতরণের রূপ নেবে । এই বিতরণটির গড় সময়ে একটি বৈশিষ্ট্যযুক্ত অ-মসৃণ শিখর রয়েছে, যা বিরল নিয়মিতকরণ প্রভাব অর্জনের জন্য 0 এ সেট করা হয়। সরাসরি কোনও লসো নিয়মিত ফলাফল পাওয়ার জন্য আপনার উত্তরোত্তর বিতরণের মোড নেওয়া উচিত।
চিত্রটিতে, নীল ড্যাশযুক্ত লাইনটি ল্যাপ্লেসিয়ার পূর্ব বিতরণকে উপস্থাপন করে। শক্ত কালো রঙের মধ্যে উত্তরোত্তর বিতরণটি দুর্বল সম্ভাবনার সাথে বামদিকে তার মোড থাকে, অন্যদিকে মোড শক্তিশালী সম্ভাবনার সাথে ডানদিকে শূন্য নয়।
যাইহোক, সম্পূর্ণ উত্তরোত্তর বিতরণ অল্প নয়, কারণ আপনি যদি এটি থেকে নমুনা নেন তবে খুব কমই 0 এর কাছাকাছি কিছু মান পাবেন এবং বাস্তবে কারণ এটি একটি অবিচ্ছিন্ন বিতরণ আপনি কখনই অবিকল 0 পাবেন না।
লাসো পদ্ধতির সাথে স্পারসিটি অর্জন করার জন্য, আপনাকে সাধারণত উত্তরোত্তর মোডে কিছু কাট অফের প্রান্ত স্থাপন করতে হবে। আদর্শ ক্ষেত্রে হ'ল যদি আপনার পূর্ববর্তী মোড 0 এর সমান হয় তবে আপনি এটি শিথিল করতে এবং আপনার পরিবর্তনশীলটিকে অপসারণ করতে পারতেন যদি পরের মানটি গ্রহণের পরে যদি এর পোস্টাররিয়র মোড 0.2 এর চেয়ে কম হয় তবে।
লাসোর অধীনে এই স্পারসিফিকেশন সম্পাদন করা নির্দিষ্ট এবং নির্ধারিত রেজিস্ট্রারদের একটি নির্দিষ্ট সেট দেয় যা "একক সিদ্ধান্ত" যা সম্পর্কে নিবন্ধকরা অন্তর্ভুক্ত বা বাদ পড়েছেন।
পরিবর্তনশীল নির্বাচনের সম্পূর্ণরূপে বায়েশিয়ান পদ্ধতি, স্পাইক এবং স্ল্যাব পূর্বে, কোনটি পরিবর্তনশীল মডেলটির মাধ্যমে অন্তর্ভুক্ত করা উচিত বা বাদ দেওয়া উচিত সে সম্পর্কে অনিশ্চয়তা বজায় রাখে।
সুতরাং আপনার প্রথম প্রশ্নের সমাধান করতে:
- এগুলি কি এই অর্থে আরও উন্নত যে তারা মূলত নিবন্ধকদের প্রতিটি সম্ভাব্য উপসেটকে অন্তর্ভুক্ত করার জন্য একটি নিষ্ঠুর শক্তি পদ্ধতির ব্যবহার করে?
এটি একটি ভুল বোঝাবুঝি, যেহেতু কোনও পদ্ধতিই রেজিস্ট্রারদের সমস্ত সম্ভাব্য সাবসেটগুলি অন্তর্ভুক্ত করার জন্য পরীক্ষা করে না।
- অসুবিধা কি এটি করার সময় গণনার সময়?
এটিও একটি ভুল বোঝাবুঝি, যেহেতু গণনার সময়টি রেজিস্ট্রারগুলির প্রতিটি সম্ভাব্য উপসেট পরীক্ষা করে নিরপেক্ষ শক্তি দ্বারা প্রভাবিত হয় না।
স্কটের বক্তব্যটি স্পষ্ট করার জন্য, কিছু তথ্য দেওয়া হয়েছে, যদি আপনি একটি দণ্ডিত সম্ভাবনা স্পারসফিকেশন পদ্ধতির ব্যবহার করেন তবে আপনি অন্তর্ভুক্ত এবং বাদ দেওয়া রেজিস্ট্রারগুলির ঠিক একটি সেট পাবেন। তবে আপনি যদি স্পাইক এবং স্ল্যাব স্পারসিফিকেশন পদ্ধতির ব্যবহার করেন তবে প্রতিটি রেজিস্ট্রারের জন্য আপনার সম্পূর্ণ উত্তরোত্তর বিতরণ রয়েছে, যার প্রতিটি অন্তর্ভুক্ত বা বাদ দেওয়ার আলাদা সম্ভাবনা রয়েছে। কিছু রেজিস্ট্রারদের অন্তর্ভুক্ত হওয়ার 70% সুযোগ থাকতে পারে, অন্যদের 25% সুযোগ থাকতে পারে। এটি অনেক অ্যাপ্লিকেশনগুলিতে পছন্দনীয় হতে পারে, কারণ একটি একক ডেটাসেট দেওয়া আমাদের এখনও অনিশ্চয়তা থাকা উচিত যা রেজিস্ট্রারগুলি গুরুত্বপূর্ণ বা না।
স্বজ্ঞাতভাবে, একটি স্পাইক এবং স্ল্যাব পূর্বে লাসোর মতো দণ্ডিত সম্ভাবনার পদ্ধতির তুলনায় অন্তর্ভুক্ত / বর্জনিত নিবন্ধকদের সম্ভাব্য স্থানকে আরও ভালভাবে উপস্থাপন করে।