প্রশ্ন ট্যাগ «model-evaluation»

নমুনাগুলির মূল্যায়ন করার সময়, নমুনা ইন-স্যাম্পল বা বাইরে-নমুনা।

7
শ্রেণিবদ্ধকরণের মডেলগুলি মূল্যায়নের জন্য নির্ভুলতা কেন সেরা মাপকাঠি নয়?
এটি একটি সাধারণ প্রশ্ন যা এখানে পরোক্ষভাবে একাধিকবার জিজ্ঞাসা করা হয়েছিল, তবে এর একক অনুমোদিত উত্তর নেই। রেফারেন্সটির জন্য এটির বিশদ উত্তরটি পাওয়া ভাল হবে। যথার্থতা , সমস্ত শ্রেণিবদ্ধের মধ্যে সঠিক শ্রেণিবিন্যাসের অনুপাত খুব সহজ এবং খুব "স্বজ্ঞাত" পরিমাপ, তবুও এটি ভারসাম্যহীন ডেটার জন্য একটি দরিদ্র পরিমাপ হতে পারে । …

7
বিশাল সংখ্যক বৈশিষ্ট্যগুলির জন্য সেরা পিসিএ অ্যালগরিদম (> 10 কে)?
আমি এটি স্ট্যাকওভারফ্লোতে জিজ্ঞাসা করেছি, তবে এটি এসও-তে কোনও উত্তর না পেলে এটি এখানে আরও উপযুক্ত হতে পারে বলে মনে হয়। এটি পরিসংখ্যান এবং প্রোগ্রামিংয়ের ছেদ এ এক ধরণের। আমার পিসিএ করার জন্য কিছু কোড লিখতে হবে (প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস)। আমি বিখ্যাত আলগোরিদিম মাধ্যমে ব্রাউজ এবং বাস্তবায়িত করেছি এই এক …

5
র্যান্ডম ফরেস্ট অ্যালগরিদমের অনুকূলিতকরণগুলি
আমি লক্ষ্য করেছি যে এলোজিআইবি, ওয়াফলস এবং কিছু আর প্যাকেজগুলির মতো এলোমেলো বনের কয়েকটি বাস্তবায়ন রয়েছে randomForest। কেউ কি আমাকে বলতে পারেন যে এই লাইব্রেরিগুলি অত্যন্ত অনুকূলিত হয়েছে? এগুলি মূলত পরিসংখ্যান শিক্ষার উপাদানগুলির বিবরণ হিসাবে এলোমেলো বনগুলির সমতুল্য বা অতিরিক্ত অতিরিক্ত কৌশল যুক্ত হয়েছে? আমি আশা করি এই প্রশ্নটি যথেষ্ট …

3
একটি ক্লাস্টারিং পদ্ধতি কীভাবে নির্বাচন করবেন? একটি ক্লাস্টার সমাধানকে কীভাবে বৈধতা দেওয়া যায় (পদ্ধতির পছন্দটি ওয়ারেন্ট করার জন্য)?
ক্লাস্টার বিশ্লেষণের সবচেয়ে বড় সমস্যাটি হ'ল আমরা যখন বিভিন্ন ক্লাস্টারিং পদ্ধতির ভিত্তিতে (শ্রেণিবদ্ধ ক্লাস্টারিংয়ের বিভিন্ন লিঙ্কেজ পদ্ধতি সহ) ব্যবহার করি তখন বিভিন্ন উপসংহার পেতে পারি । আমি এ সম্পর্কে আপনার মতামত জানতে চাই - আপনি কোন পদ্ধতিটি নির্বাচন করবেন এবং কীভাবে। কেউ বলতে পারে "ক্লাস্টারিংয়ের সেরা পদ্ধতিটি যা আপনাকে সঠিক …

1
ক্রস-বৈধতা অপব্যবহার (সেরা হাইপারপ্যারামিটার মানের জন্য রিপোর্টিং কর্মক্ষমতা)
সম্প্রতি আমি একটি কাগজ পেয়েছি যা নির্দিষ্ট ডেটাसेट ে কে-এনএন শ্রেণিবদ্ধ ব্যবহার করার প্রস্তাব দেয় prop লেখকরা বিভিন্ন কে মানগুলির জন্য কে-ফোল্ড ক্রস বৈধকরণ সম্পাদন করতে এবং সর্বোত্তম হাইপারপ্যারমিটার কনফিগারেশনের ক্রস বৈধকরণের ফলাফলের জন্য উপলব্ধ সমস্ত ডেটা নমুনা ব্যবহার করেছিলেন used আমার জানা মতে, এই ফলাফলটি পক্ষপাতদুষ্ট, এবং হাইপারপ্যারামিটার অপ্টিমাইজেশন …

3
হোজিওর-লেমশো গুডনেস অফ ফিটের লজিস্টিক রিগ্রেশন এবং ব্যাখ্যার মূল্যায়ন
যেমনটি আমরা সবাই জানি, লজিস্টিক রিগ্রেশন মডেলটি মূল্যায়নের 2 টি পদ্ধতি রয়েছে এবং তারা খুব আলাদা জিনিস পরীক্ষা করে দেখছে ভবিষ্যদ্বাণীমূলক শক্তি: একটি পরিসংখ্যান পান যা স্বতন্ত্র ভেরিয়েবলের উপর নির্ভর করে নির্ভরশীল ভেরিয়েবলটি কতটা ভালভাবে পূর্বাভাস দিতে পারে তা পরিমাপ করে। সুপরিচিত সিউডো আর ^ 2 হলেন ম্যাকফ্যাডডেন (1974) এবং …

3
অত্যন্ত ভারসাম্যহীন ডেটার জন্য শ্রেণিবদ্ধকরণ / মূল্যায়ন মেট্রিক্স
আমি একটি জালিয়াতি সনাক্তকরণ (ক্রেডিট-স্কোরিং-এর মতো) সমস্যাটি মোকাবিলা করি। যেমন জালিয়াতি এবং জালিয়াতিহীন পর্যবেক্ষণগুলির মধ্যে একটি ভারসাম্যহীন সম্পর্ক রয়েছে। http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html বিভিন্ন শ্রেণিবদ্ধকরণের মেট্রিকের দুর্দান্ত সংক্ষিপ্তসার সরবরাহ করে। Precision and Recallবা kappaউভয়ই ভাল পছন্দ বলে মনে হচ্ছে: এ জাতীয় শ্রেণিবদ্ধের ফলাফলকে ন্যায়সঙ্গত করার একটি উপায় হ'ল তাদের বেসলাইন শ্রেণিবদ্ধগুলির সাথে তুলনা …


1
মূল্যায়ন হিসাবে এওসির পরিবর্তে নরমালাইজড গিনি স্কোর কেন ব্যবহার করবেন?
কাগল এর প্রতিযোগিতা পোর্তো সেগুরোর নিরাপদ ড্রাইভার ভবিষ্যদ্বাণী মূল্যায়ন মেট্রিক হিসাবে নরমালাইজড গিনি স্কোরকে ব্যবহার করে এবং এটি এই পছন্দের কারণ সম্পর্কে আমাকে কৌতূহলযুক্ত করে তুলেছে । মূল্যায়নের জন্য এটুসির মতো সর্বাধিক মেট্রিকের পরিবর্তে সাধারণ গিনি স্কোর ব্যবহারের সুবিধা কী কী?

1
আরওসি বক্ররেখা একে অপরকে অতিক্রম করলে দুটি মডেলের তুলনা করুন
দুই বা ততোধিক শ্রেণিবদ্ধকরণের মডেলগুলির তুলনা করতে ব্যবহৃত একটি সাধারণ পরিমাপ হ'ল পরোক্ষভাবে তাদের কর্মক্ষমতা মূল্যায়নের উপায় হিসাবে আরওসি বক্ররেখা (এউসি) এর অধীনে অঞ্চলটি ব্যবহার করা। এক্ষেত্রে বৃহত্তর এওসি সহ একটি মডেলকে সাধারণত একটি ছোট এওসি সহ একটি মডেলের চেয়ে ভাল পারফরম্যান্স হিসাবে ব্যাখ্যা করা হয়। তবে, বিহিনেন, ২০১২ অনুসারে …

2
ফাই, ম্যাথিউস এবং পিয়ারসন পারস্পরিক সম্পর্কের সহগগুলির মধ্যে সম্পর্ক
ফাই এবং ম্যাথিউসের পারস্পরিক সম্পর্কের সহগগুলি কি একই ধারণা? তারা দুটি বাইনারি ভেরিয়েবলের জন্য কীভাবে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সাথে সম্পর্কিত বা সমতুল্য? আমি ধরে নিই বাইনারি মানগুলি 0 এবং 1 হয়। দুটি বার্নোল্লি র্যান্ডম ভেরিয়েবল এবং এর মধ্যে পিয়ারসনের পারস্পরিক সম্পর্ক :xxxyyy ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]−−−−−−−−−−√=E[xy]−E[x]E[y]Var[x]Var[y]−−−−−−−−−−√=n11n−n1∙n∙1n0∙n1∙n∙0n∙1−−−−−−−−−−√ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]=E[xy]−E[x]E[y]Var[x]Var[y]=n11n−n1∙n∙1n0∙n1∙n∙0n∙1 \rho = \frac{\mathbb{E} [(x - \mathbb{E}[x])(y …

3
শাস্ত্রীয় পরিসংখ্যানগুলিতে কেন হোল্ডআউট পদ্ধতি (প্রশিক্ষণ এবং পরীক্ষায় ডেটা বিভক্ত করা) ব্যবহৃত হয় না?
ডেটা মাইনিংয়ের সাথে আমার শ্রেণিকক্ষের সংস্পর্শে, হোল্ডআউট পদ্ধতিটি মডেল কর্মক্ষমতা মূল্যায়নের উপায় হিসাবে চালু হয়েছিল। যাইহোক, আমি যখন লিনিয়ার মডেলগুলিতে আমার প্রথম শ্রেণি নিয়েছিলাম তখন এটি মডেল বৈধতা বা মূল্যায়নের মাধ্যম হিসাবে চালু হয়নি। আমার অনলাইন গবেষণাও কোনও ধরণের ছেদ দেখায় না। শাস্ত্রীয় পরিসংখ্যানগুলিতে কেন হোল্ডআউট পদ্ধতি ব্যবহার করা হয় …

1
ফিশারের নির্ভুল পরীক্ষা এবং হাইপারজিম্যাট্রিক বিতরণ
আমি ফিশারদের সঠিক পরীক্ষাটি আরও ভালভাবে বুঝতে চেয়েছিলাম, তাই আমি নীচের খেলনাটির উদাহরণটি প্রস্তুত করেছি, যেখানে f এবং m পুরুষ এবং মহিলা এর সাথে মিলে যায় এবং n এবং y এর সাথে "সোডা সেবন" এর সাথে মিলে যায়: > soda_gender f m n 0 5 y 5 0 স্পষ্টতই, এটি …

2
মধ্যে পার্থক্য কি এর মধ্যে Scikit-শিখতে এবং ভ্যারিয়েন্স স্কোর?
আমি পাইথন সাইকিট-লার্ন ম্যানুয়ালটিতে রিগ্রেশন মেট্রিকগুলি সম্পর্কে পড়ছিলাম এবং যদিও তাদের প্রত্যেকের নিজস্ব সূত্র রয়েছে তবে আমি আন্তরিকভাবে বলতে পারি না যে এবং ভেরিয়েন্স স্কোরের মধ্যে পার্থক্য কী এবং তাই যখন মূল্যায়ন করার জন্য এক বা অন্যটি ব্যবহার করতে হয় আমার মডেল।আর2আর2R^2


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.