প্রশ্ন ট্যাগ «unbalanced-classes»

বিযুক্ত বিভাগ বা * শ্রেণি * তে আয়োজিত ডেটা পর্যবেক্ষণের সংখ্যা (যদি কিছু নির্দিষ্ট বিশ্লেষণ করে তবে সমস্যাগুলি উপস্থিত হতে পারে)n) প্রতিটি শ্রেণীর অন্তর্ভুক্ত ক্লাস জুড়ে ধ্রুবক নয়। অসম সহ ক্লাসগুলি * ভারসাম্যহীন *। n

3
লজিস্টিক রিগ্রেশন করার সময় কি ভারসাম্যহীন নমুনার বিষয়টি বিবেচনা করে?
ঠিক আছে, সুতরাং আমি মনে করি আমার হাতে যথেষ্ট পরিমাণে নমুনা রয়েছে: 20: 1 টি নিয়মের আমলে নেওয়া: মোট 7 প্রার্থীর ভবিষ্যদ্বাণী ভেরিয়েবলের জন্য মোটামুটি বড় নমুনা (এন = 374)। আমার সমস্যাটি হ'ল: প্রডাক্টর ভেরিয়েবলগুলির যে কোনও সেটই আমি ব্যবহার করি না, শ্রেণিবদ্ধিগুলি 100% এর স্পষ্টতা এবং 0% এর সংবেদনশীলতার …

6
দৃ strongly়ভাবে ভারসাম্যহীন ক্লাস সহ বাইনারি শ্রেণিবদ্ধকরণ
আমার কাছে একটি বৈশিষ্ট্য রয়েছে (বৈশিষ্ট্যগুলি, বাইনারি আউটপুট 0 বা 1) আকারে, তবে 1টি খুব কমই ঘটে, তাই 0 এর পূর্বে ভবিষ্যদ্বাণী করে আমি 70% থেকে 90% এর মধ্যে নির্ভুলতা পাই (আমি যে নির্দিষ্ট ডেটা দেখি তার উপর নির্ভর করে) )। এমএল পদ্ধতিগুলি আমাকে একই নির্ভুলতা সম্পর্কে দেয় এবং আমি …

5
ভারসাম্যহীন ডেটা আসলে মেশিন লার্নিংয়ে কখন সমস্যা হয়?
লজিস্টিক রিগ্রেশন , এসভিএম , সিদ্ধান্ত গাছ , ব্যাগিং এবং এই জাতীয় বেশ কয়েকটি অনুরূপ প্রশ্ন ব্যবহার করার সময় ভারসাম্যহীন ডেটা সম্পর্কে আমাদের ইতিমধ্যে একাধিক প্রশ্ন ছিল , এটি কী খুব জনপ্রিয় একটি বিষয় হিসাবে তৈরি করে! দুর্ভাগ্যক্রমে, প্রতিটি প্রশ্নের উত্তর অ্যালগরিদম-নির্দিষ্ট বলে মনে হয়েছে এবং ভারসাম্যহীন ডেটা নিয়ে কাজ …

4
তদারকি করা মেশিন লার্নিংয়ে শ্রেণির ভারসাম্যহীনতা
এটি সাধারণভাবে একটি প্রশ্ন, কোনও পদ্ধতি বা ডেটা সেটের সাথে সুনির্দিষ্ট নয়। 0 টির সংখ্যা 90% এর কাছাকাছি এবং 1 এর সংখ্যা আপনার ডেটাশেটে 10% এর কাছাকাছি যেখানে পর্যবেক্ষিত মেশিন শেখার ক্ষেত্রে আমরা কোনও শ্রেণি ভারসাম্যহীন সমস্যাটি কীভাবে মোকাবিলা করব we আমরা কীভাবে শ্রেণিবদ্ধকে প্রশিক্ষণ দেব? আমি অনুসরণ করার একটি …

4
ভারসাম্যহীন ডেটার বিরুদ্ধে সিদ্ধান্তের গাছ প্রশিক্ষণ
আমি ডেটা মাইনিংয়ে নতুন এবং আমি একটি ডেটা সেটের বিরুদ্ধে সিদ্ধান্ত গাছকে প্রশিক্ষণের চেষ্টা করছি যা অত্যন্ত ভারসাম্যহীন। তবে, আমার ভবিষ্যদ্বাণীপূর্ণ নির্ভুলতার সাথে সমস্যা হচ্ছে। উপাত্তগুলি কোর্স অধ্যয়নরত শিক্ষার্থীদের সমন্বয়ে গঠিত এবং ক্লাস ভেরিয়েবল হল কোর্সের স্ট্যাটাস যা দুটি মান রয়েছে - প্রত্যাহার বা বর্তমান। বয়স জাতিতত্ত্ব লিঙ্গ কোর্স ... …

1
ডাউন-স্যাম্পলিং লজিস্টিক রিগ্রেশন সহগকে পরিবর্তন করে?
যদি আমার খুব বিরল ধনাত্মক শ্রেণীর সাথে একটি ডেটাসেট থাকে এবং আমি নেতিবাচক শ্রেণিকে নিম্ন-নমুনা করি, তবে লজিস্টিক রিগ্রেশন করান, আমি ইতিবাচক শ্রেণীর প্রসারকে পরিবর্তন করেছি এই প্রতিস্থাপনের জন্য আমার কি রিগ্রেশন সহগের সমন্বয় করা দরকার? উদাহরণস্বরূপ, ধরা যাক আমার 4 টি ভেরিয়েবল সহ একটি ডেটাসেট রয়েছে: ওয়াই, এ, বি …

3
শ্রেণি ভারসাম্যহীন সমস্যার মূল কারণ কী?
আমি ইদানীং মেশিনে / পরিসংখ্যানগত শিক্ষায় "শ্রেণির ভারসাম্যহীন সমস্যা" সম্পর্কে অনেক চিন্তাভাবনা করেছি এবং এমন অনুভূতিতে আরও গভীরতর হয়ে যাচ্ছি যে আমি কী বুঝতে পারছি তা ঠিক বুঝতে পারছি না। প্রথমে আমার শর্তাদি সংজ্ঞায়িত করতে (বা চেষ্টা করার চেষ্টা করুন): বর্গ ভারসাম্যহীনতা সমস্যা মেশিন / পরিসংখ্যানগত লার্নিং পর্যবেক্ষণ যে কিছু …

4
শ্রেণি ভারসাম্যহীন অধীনে যথার্থ-পুনর্বিবেচনা বক্ররেখার জন্য অনুকূলকরণ
আমার একটি শ্রেণিবিন্যাস টাস্ক রয়েছে যেখানে আমার কাছে অনেকগুলি ভবিষ্যদ্বাণী রয়েছে (যার মধ্যে একটি সর্বাধিক তথ্যপূর্ণ), এবং আমি আমার শ্রেণিবদ্ধ নির্মানের জন্য মার্স মডেলটি ব্যবহার করছি (আমি কোনও সাধারণ মডেলের প্রতি আগ্রহী, এবং উদাহরণস্বরূপ গ্ল্যাম ব্যবহার করা হবে) ঠিক আছে)। প্রশিক্ষণ ডেটাতে এখন আমার কাছে বিশাল শ্রেণির ভারসাম্যহীনতা রয়েছে (প্রতিটি …

4
প্রশিক্ষণ ডেটা সেটে আমার ক্লাসগুলি কখন ব্যালেন্স করা উচিত?
আমার একটি অনলাইন কোর্স ছিল, যেখানে আমি শিখেছি যে প্রশিক্ষণের ডেটাগুলিতে ভারসাম্যহীন ক্লাসগুলি সমস্যার কারণ হতে পারে, কারণ শ্রেণিবদ্ধকরণ অ্যালগরিদম সংখ্যাগরিষ্ঠ নিয়মের জন্য যায়, কারণ ভারসাম্যহীনতা খুব বেশি হলে এটি ভাল ফলাফল দেয়। একটি অ্যাসাইনমেন্টে একজনকে সংখ্যাগরিষ্ঠ শ্রেণির আন্ডার স্যাম্পলিংয়ের মাধ্যমে ডেটা ভারসাম্য বজায় রাখতে হয়। তবে এই ব্লগে কেউ …

6
লজিস্টিক রিগ্রেশন জন্য নমুনা আকার?
আমি আমার জরিপের তথ্য থেকে একটি লজিস্টিক মডেল তৈরি করতে চাই। এটি চারটি আবাসিক উপনিবেশের একটি ছোট সমীক্ষা যেখানে 154 জন উত্তরদাতাকে সাক্ষাত্কার দেওয়া হয়েছিল। আমার নির্ভরশীল পরিবর্তনশীল হ'ল "কার্যক্রমে সন্তোষজনক রূপান্তর"। আমি খুঁজে পেয়েছি যে 154 জন উত্তরদাতাদের মধ্যে 73 জন বলেছিলেন যে তারা সন্তোষজনকভাবে কাজটিতে স্থানান্তরিত হয়েছে, বাকিরা …

4
ভারসাম্যহীন ডেটাসেটের জন্য xgboost এ স্কেল_পোস_ওয়েটের সঠিক ব্যবহার কী?
আমার খুব ভারসাম্যহীন ডেটাসেট রয়েছে। আমি টিউনিংয়ের পরামর্শ অনুসরণ এবং ব্যবহার করার চেষ্টা করছি scale_pos_weightতবে কীভাবে এটি টিউন করব তা নিশ্চিত নই। আমি দেখতে পাচ্ছি RegLossObj.GetGradient: if (info.labels[i] == 1.0f) w *= param_.scale_pos_weight সুতরাং একটি ধনাত্মক নমুনার গ্রেডিয়েন্ট আরও প্রভাবশালী হবে। তবে, xgboost কাগজ অনুসারে , গ্রেডিয়েন্ট পরিসংখ্যান সর্বদা স্থানীয়ভাবে …

4
ওভারস্যাম্পলিং, আন্ডার স্যাম্পলিং এবং এসএমওটিই কোন সমস্যার সমাধান করে?
সাম্প্রতিক, ভালভাবে উদ্ধৃত হওয়া প্রশ্নে টিম জিজ্ঞাসা করেছেন কখন মেশিন লার্নিংয়ে ভারসাম্যহীন ডেটা আসলেই সমস্যা ? প্রশ্নের ভিত্তি হ'ল ক্লাস ভারসাম্য এবং ভারসাম্যহীন ক্লাসগুলির সমস্যা নিয়ে আলোচনা করে প্রচুর মেশিন লার্নিং সাহিত্য রয়েছে । ধারণাটি হ'ল ধনাত্মক এবং নেতিবাচক শ্রেণীর মধ্যে ভারসাম্যহীন ডেটাসেটগুলি কিছু মেশিন লার্নিং শ্রেণিবিন্যাসের জন্য সমস্যা সৃষ্টি …

2
পরীক্ষার সেট এবং প্রশিক্ষণের সেট বিতরণের মধ্যে পার্থক্য কীভাবে পরিচালনা করবেন?
আমি মনে করি মেশিন লার্নিং বা পরামিতি অনুমানের একটি প্রাথমিক অনুমান হ'ল অদেখা তথ্যগুলি প্রশিক্ষণ সেট হিসাবে একই বিতরণ থেকে আসে। তবে কিছু ব্যবহারিক ক্ষেত্রে পরীক্ষার সেট বিতরণ প্রশিক্ষণ সেট থেকে প্রায় আলাদা হবে। বৃহত্তর স্তরের মাল্টি-শ্রেণিবদ্ধকরণ সমস্যার জন্য বলুন যা পণ্য বিবরণকে প্রায় 17,000 শ্রেণিতে শ্রেণিবদ্ধ করার চেষ্টা করে। …

3
অত্যন্ত ভারসাম্যহীন ডেটার জন্য শ্রেণিবদ্ধকরণ / মূল্যায়ন মেট্রিক্স
আমি একটি জালিয়াতি সনাক্তকরণ (ক্রেডিট-স্কোরিং-এর মতো) সমস্যাটি মোকাবিলা করি। যেমন জালিয়াতি এবং জালিয়াতিহীন পর্যবেক্ষণগুলির মধ্যে একটি ভারসাম্যহীন সম্পর্ক রয়েছে। http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html বিভিন্ন শ্রেণিবদ্ধকরণের মেট্রিকের দুর্দান্ত সংক্ষিপ্তসার সরবরাহ করে। Precision and Recallবা kappaউভয়ই ভাল পছন্দ বলে মনে হচ্ছে: এ জাতীয় শ্রেণিবদ্ধের ফলাফলকে ন্যায়সঙ্গত করার একটি উপায় হ'ল তাদের বেসলাইন শ্রেণিবদ্ধগুলির সাথে তুলনা …

5
রিগ্রেশনে ভারসাম্যহীন ডেটার জন্য নমুনা
শ্রেণিবদ্ধকরণ প্রসঙ্গে ভারসাম্যহীন ডেটা পরিচালনা করার বিষয়ে ভাল প্রশ্ন রয়েছে , তবে আমি ভাবছি যে লোকেরা রিগ্রেশনের জন্য নমুনা দেওয়ার জন্য কী করে। সমস্যা ডোমেনটি লক্ষণটির প্রতি খুব সংবেদনশীল তবে লক্ষ্যমাত্রার মাত্রায় কিছুটা সংবেদনশীল বলুন। তবে তাত্পর্যটি যথেষ্ট গুরুত্বপূর্ণ যে মডেলটি রিগ্রেশন হওয়া উচিত (ধারাবাহিক লক্ষ্য) শ্রেণিবিন্যাস নয় (ইতিবাচক বনাম …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.