অস্তিত্বহীন (অনুপস্থিত) ডেটা কীভাবে পরিচালনা করবেন?


11

যে কোনও শ্রেণিবদ্ধের ইনপুটগুলির জন্য কীভাবে 'অস্তিত্বহীন' ডেটা পরিচালনা করতে হয় সে সম্পর্কে সত্যই আমি কোনও ভাল পাঠ্য বা উদাহরণ পাইনি। আমি অনুপস্থিত ডেটাতে অনেক কিছু পড়েছি তবে মাল্টিভারিয়েট ইনপুটগুলির সাথে সম্পর্কিত বা না থাকতে পারে এমন ডেটা সম্পর্কে কী করা যায়। আমি বুঝতে পারি এটি একটি খুব জটিল প্রশ্ন এবং ব্যবহৃত প্রশিক্ষণের পদ্ধতিগুলির উপর নির্ভর করে তারতম্য হবে ...

উদাহরণস্বরূপ যদি ভাল সঠিক ডেটা সহ বেশ কয়েকটি রানার জন্য ল্যাপটাইমের পূর্বাভাস দেওয়ার চেষ্টা করা হয়। অনেকগুলি ইনপুটগুলির মধ্যে, অনেকের মধ্যে সম্ভাব্য ভেরিয়েবলগুলি:

  1. ইনপুট পরিবর্তনযোগ্য - প্রথমবারের রানার (ওয়াই / এন)
  2. ইনপুট পরিবর্তনযোগ্য - পূর্ববর্তী ল্যাপটাইম (0 - 500 সেকেন্ড)
  3. ইনপুট পরিবর্তনশীল - বয়স
  4. ইনপুট পরিবর্তনশীল - উচ্চতা। । । আরও অনেক ইনপুট ভেরিয়েবল ইত্যাদি

& আউটপুট ভবিষ্যদ্বাণী - ভবিষ্যদ্বাণী করা ল্যাপটাইম (0 - 500 সেকেন্ড)

'২.প্রাইরিশ ল্যাপটাইম' এর জন্য একটি 'মিসিং ভেরিয়েবল' বেশ কয়েকটি উপায়ে গণনা করা যায় তবে '1। প্রথমবারের রানার 'সর্বদা এন এর সমান হবে। তবে প্রথমবারের রানার জন্য 'নন অস্তিত্বের ডেটা' (যেখানে 'প্রথমবারের রানার' = ওয়াই) '2 এর জন্য আমার কী মূল্য / চিকিত্সা দেওয়া উচিত। আগের ল্যাপটাইম '?

উদাহরণস্বরূপ '2। পূর্ববর্তী ল্যাপটাইম '-৯৯ বা ০ হিসাবে এটিকে বিতরণটি নাটকীয়ভাবে আঁকতে পারে এবং এটিকে নতুন রানার দুর্দান্ত পারফরম্যান্সের মতো দেখায়।

আমার বর্তমান প্রশিক্ষণের পদ্ধতিগুলি লজিস্টিক রিগ্রেশন, এসভিএম, এনএন এবং সিদ্ধান্ত গাছ ব্যবহার করে আসছে


আমার যুক্ত হওয়া উচিত যে আমি অন্তর্নিহিত অনিশ্চয়তার কারণে প্রশিক্ষণ এবং ভবিষ্যদ্বাণী উভয়ই ডেটা থেকে নতুন রানারদের
ত্যাগ করে চলেছি তবে

উত্তর:


6

অস্তিত্বহীন প্রথমবারের রানার পূর্ববর্তী ল্যাপ সময়টির জন্য বিশেষ মান নির্ধারণের পরিবর্তে, প্রথম বারের রানার ডামির বিপরীতমুখী হয়ে পূর্ববর্তী ল্যাপ টাইমের জন্য কেবল ইন্টারঅ্যাকশন শব্দটি ব্যবহার করুন:

Yi=β0+β1FTRi+β2(NFTRi)×PLTi+...

এখানে

  • আপনার ইনপুট পরিবর্তনশীল, Yi
  • আপনার অন্যান্য পরিবর্তনশীল, ...
  • প্রথমবারের রানার জন্য ডামি,FTRi
  • PLTi
  • NFTRiFTRi=0

তারপরে প্রথমবারের রানারদের মডেলটি হবেন:

Yi=(β0+β1)+...

এবং প্রথমবারের জন্য দৌড়াকারীদের জন্য:

Yi=β0+β2PLTi+...

8

মডেলটিতে যতক্ষণ না আপনার (1) এবং (2) উভয়ই সর্বাধিক সম্ভাবনার দ্বারা সজ্জিত লজিস্টিক রিগ্রেশনের জন্য, তারপরে আপনি (2) নতুন রানারকে যে "ডিফল্ট" মান দেন না কেন, (1) এর জন্য অনুমান সেই অনুযায়ী সামঞ্জস্য করা হবে।

X1X2

η=α+β1X1+β2X2+

X2

η=α+β1+

তবে বিদ্যমান রানারদের জন্য এটি হ'ল:

η=α+β2X2+

X2

η=α+β199β2+

β199β2=β1

অবশ্যই, যদি আপনি সর্বাধিক সম্ভাবনা ব্যবহার না করেন (যেমন আপনি কোনও ধরণের শাস্তি বা পরামিতিগুলির পূর্বে ব্যবহার করছেন), তবে আপনি সেই অনুসারে শাস্তি / পূর্বে সামঞ্জস্য না করলে আপনি বিভিন্ন মান পেতে যাচ্ছেন। এবং যদি মডেলটি অ-রৈখিক হয় (যেমন এসভিএম, এনএন এবং সিদ্ধান্ত গাছ), তবে এই যুক্তিটি মোটেই কার্যকর হয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.