পরিসংখ্যান এবং বড় তথ্য cart

2

সিদ্ধান্ত গাছগুলির জন্য শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি কোডিংয়ের সেরা অনুশীলনগুলি?

লিনিয়ার রিগ্রেশন জন্য শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি কোডিং করার সময়, একটি নিয়ম রয়েছে: ডামির সংখ্যা মোট স্তরের সংখ্যার চেয়ে কম হওয়া উচিত (কোলাইনারিটি এড়াতে)। সিদ্ধান্ত গাছের জন্য কি একই ধরণের নিয়ম রয়েছে (ব্যাগড, বুস্টেড)? আমি এটি জিজ্ঞাসা করছি কারণ পাইথনে একটি স্ট্যান্ডার্ড অনুশীলন মনে হয় nস্তরগুলি nডমিগুলিতে (স্কালার্নস ' OneHotEncoderবা পান্ডাস' pd.get_dummies) …

13 categorical-data random-forest cart boosting

3

কেন বৃদ্ধির পদ্ধতিটি বিদেশীদের কাছে সংবেদনশীল

আমি অনেক নিবন্ধ পেয়েছি যা জানিয়েছে যে বুস্টিং পদ্ধতিগুলি বিদেশীদের কাছে সংবেদনশীল তবে কেন এটি ব্যাখ্যা করার মতো কোনও নিবন্ধ নেই। আমার অভিজ্ঞতায় আউটলিয়াররা কোনও মেশিন লার্নিং অ্যালগরিদমের পক্ষে খারাপ, তবে কেন উত্সাহ দেওয়ার পদ্ধতিগুলি বিশেষ সংবেদনশীল হিসাবে বিবেচিত হয়? নীচের অ্যালগরিদমগুলি কীভাবে বহিরাগতদের সংবেদনশীলতার দিক থেকে র‌্যাঙ্ক করবে: বুস্ট-ট্রি, …

12 machine-learning svm outliers cart boosting

1

কোন এলোমেলো বন গাছের জন্য ভাল ব্যয়ের কাজ: গিনি সূচক বা এন্ট্রপি?

কোন এলোমেলো বন গাছের জন্য ভাল ব্যয়ের কাজ: গিনি সূচক বা এন্ট্রপি? আমি ক্লোজুরে এলোমেলো বন বাস্তবায়নের চেষ্টা করছি।

12 classification random-forest cart

1

সিদ্ধান্ত গাছগুলিতে বাইনারি বিভাজন বাস্তবায়নে পার্থক্য

আমি একটা সিদ্ধান্ত গাছ একটি বাইনারি বিভক্ত ব্যবহারিক বাস্তবায়ন সম্পর্কে জানতে আগ্রহী am - যেমন একটি শ্রেণীগত predictor মাত্রা সম্পর্কিত ।এক্সঞXjX{j} বিশেষত, আমি প্রায়শই সিদ্ধান্ত গাছ ব্যবহার করে ভবিষ্যদ্বাণীমূলক মডেল তৈরি করার সময় কিছু ধরণের স্যাম্পলিং স্কিম (যেমন ব্যাগিং, ওভারসাম্পলিং ইত্যাদি) ব্যবহার করব - এর ভবিষ্যদ্বাণীমূলক নির্ভুলতা এবং স্থায়িত্বের উন্নতির …

12 cart rpart partitioning

2

প্যানেল ডেটার জন্য মেশিন লার্নিং অ্যালগরিদম

এই প্রশ্নে - সিদ্ধান্ত গৃহ নির্মাণের জন্য এমন কোনও পদ্ধতি আছে যা কাঠামোগত / শ্রেণিবিন্যাস / বহুমুখী ভবিষ্যদ্বাণীদের অ্যাকাউন্ট গ্রহণ করে? - তারা গাছের জন্য একটি প্যানেল ডেটা পদ্ধতি উল্লেখ করে। ভেক্টর মেশিন এবং নিউরাল নেটওয়ার্কগুলিকে সমর্থন করার জন্য কোনও নির্দিষ্ট প্যানেল ডেটা পদ্ধতি রয়েছে? যদি তা হয় তবে আপনি …

12 r machine-learning svm panel-data cart

2

এলোমেলো বন কি পূর্বাভাস পক্ষপাতিত্ব প্রদর্শন করে?

আমি মনে করি এটি একটি সরল প্রশ্ন, যদিও কেন বা কেন হবে না এর পিছনে যুক্তি। আমি জিজ্ঞাসার কারণটি হ'ল আমি সম্প্রতি একটি আরএফের নিজস্ব বাস্তবায়ন লিখেছি এবং যদিও এটি দুর্দান্তভাবে সম্পাদন করে তবে এটি আমার যেমনটি প্রত্যাশা করা হয়েছিল তেমন পারফরম্যান্স করছে না ( কাগল ফটো কোয়ালিটি প্রিডিকশন প্রতিযোগিতার …

12 algorithms random-forest cart

1

অ্যাডাবুস্টে দুর্বল শিক্ষার্থী হিসাবে কীভাবে সিদ্ধান্তের স্টাম্প ব্যবহার করবেন?

আমি সিদ্ধান্ত স্টম্প ব্যবহার করে অ্যাডাবোস্ট বাস্তবায়ন করতে চাই। অ্যাডাবুস্টের প্রতিটি পুনরাবৃত্তিতে আমাদের ডেটা সেটের বৈশিষ্ট্যগুলি যতটা সিদ্ধান্তের স্টাম্প করা ঠিক? উদাহরণস্বরূপ, আমার যদি 24 টি বৈশিষ্ট্য সহ একটি ডেটা সেট থাকে তবে আমার প্রতিটি পুনরাবৃত্তিতে 24 টি সিদ্ধান্ত স্টাম্প শ্রেণিবদ্ধ হওয়া উচিত? অথবা আমি এলোমেলোভাবে কিছু বৈশিষ্ট্যগুলি বেছে নিয়ে …

12 machine-learning classification cart boosting

2

সিদ্ধান্ত গাছ এবং নিরোধক - ভবিষ্যদ্বাণী করা মানগুলি কি প্রশিক্ষণের ডেটার সীমার বাইরে থাকতে পারে?

যখন সিদ্ধান্ত গাছের কথা আসে, তখন ভবিষ্যদ্বাণী করা মানটি কী প্রশিক্ষণের ডেটার ব্যাপ্তির বাইরে থাকতে পারে? উদাহরণস্বরূপ, যদি টার্গেট ভেরিয়েবলের প্রশিক্ষণ ডেটা সেট পরিসীমা 0-100 হয়, যখন আমি আমার মডেলটি তৈরি করি এবং এটি অন্য কোনওটিতে প্রয়োগ করি, তখন আমার মানগুলি -5 হতে পারে? বা 150? প্রদত্ত সিদ্ধান্তের গাছের প্রতিরোধের …

11 regression predictive-models random-forest cart

1

গিনি অপবিত্রতা কখন ব্যবহার করবেন এবং কখন তথ্য লাভ করবেন?

সিদ্ধান্তের গাছগুলির জন্য গিনি অপরিষ্কার এবং তথ্য লাভ কখন ব্যবহার করবেন দয়া করে কেউ আমাকে ব্যাখ্যা করতে পারেন? আপনি কখন আমাকে পরিস্থিতি / উদাহরণ দিতে পারেন কখন কোনটি ব্যবহার করা ভাল?

11 machine-learning classification data-mining cart

3

মুভি রেটিং পূর্বাভাসের জন্য শ্রেণিবদ্ধকরণ মডেল

আমি ডেটা মাইনিংয়ের ক্ষেত্রে কিছুটা নতুন এবং আমি মুভি রেটিংয়ের পূর্বাভাসের জন্য একটি শ্রেণিবদ্ধকরণ মডেলটিতে কাজ করছি। আমি আইএমডিবি থেকে ডেটা সেট সংগ্রহ করেছি এবং আমি আমার মডেলটির জন্য সিদ্ধান্ত গাছ এবং নিকটতম প্রতিবেশী পদ্ধতির ব্যবহার করার পরিকল্পনা করছি। আমি জানতে চাই যে কোন অবাধে উপলব্ধ ডেটা মাইনিং সরঞ্জাম আমার …

11 classification cart

2

সিদ্ধান্ত গাছের স্থান বনাম এলোমেলো বনগুলির এমসিসিএম নমুনা

একটি র্যান্ডম বন একটি সংগ্রহ সিদ্ধান্ত গাছ এলোমেলোভাবে (এবং কখনও কখনও প্রশিক্ষণ ডেটা ব্যাগিং) সঙ্গে প্রতিটি গাছ গড়ে তুলতে শুধুমাত্র নির্দিষ্ট বৈশিষ্ট্য নির্বাচন করে গঠন করেন। স্পষ্টতই তারা ভাল শিখেছে এবং সাধারণীকরণ করে। সিদ্ধান্তের জায়গার জন্য কেউ কি সিসিএমসি নমুনা করেছেন বা এলোমেলো বনের সাথে তুলনা করেছেন? আমি জানি যে …

11 mcmc monte-carlo random-forest cart

2

একটি শ্রেণিবিন্যাস গাছ (rpart এ) নিয়মের একটি সেটে সংগঠিত করছেন?

প্রতিটি শ্রেণীর জন্য উত্পাদিত সিদ্ধান্তের বিধিগুলি গুছিয়ে রাখার জন্য কি কোনও উপায় আছে যে একবার জটিল শ্রেণিবিন্যাস গাছটি rpart (আর মধ্যে) ব্যবহার করে নির্মিত হয়? সুতরাং একটি বিশাল গাছ পাওয়ার পরিবর্তে, আমরা প্রতিটি ক্লাসের জন্য একটি নিয়ম সেট পাই? (যদি তাই হয়, কিভাবে?) উদাহরণগুলি দেখানোর জন্য এখানে একটি সাধারণ কোড …

11 r classification cart rpart

3

স্পার প্রেডেক্টর এবং প্রতিক্রিয়াগুলি ব্যবহার করে কার্ট-জাতীয় পদ্ধতির জন্য এমন কোনও গ্রন্থাগার রয়েছে কি?

আমি আরবিতে জিবিএম প্যাকেজটি ব্যবহার করে কিছু বড় ডেটা সেট নিয়ে কাজ করছি my আমার ভবিষ্যদ্বাণীকারী ম্যাট্রিক্স এবং আমার প্রতিক্রিয়া ভেক্টর উভয়ই বেশ বিরল (যেমন বেশিরভাগ এন্ট্রি শূন্য)। আমি আশা করছিলাম যে এখানে সিদ্ধান্ত নেওয়া হয়েছে এমন অ্যালগরিদম ব্যবহার করে সিদ্ধান্ত গাছগুলি তৈরি করব যা এখানে হয়েছিল । সেই কাগজে …

11 r regression machine-learning classification cart

2

কেন একটি ব্যাগযুক্ত গাছ / এলোমেলো বন গাছের একক সিদ্ধান্ত গাছের চেয়ে উচ্চ পক্ষপাত হয়?

যদি আমরা একটি পূর্ণ বর্ধিত সিদ্ধান্তের গাছটিকে বিবেচনা করি (যেমন একটি অরক্ষিত সিদ্ধান্ত গাছ) এটির উচ্চতর বৈকল্পিকতা এবং কম পক্ষপাত রয়েছে। ব্যাগিং এবং র্যান্ডম অরণ্যগুলি এই উচ্চতর বৈকল্পিক মডেলগুলি ব্যবহার করে এবং বৈকল্পিকতা হ্রাস করতে এবং এইভাবে পূর্বাভাসের নির্ভুলতা বাড়ানোর জন্য তাদের একত্র করে। ব্যাগিং এবং এলোমেলো বন উভয়ই বুটস্ট্র্যাপের …

11 variance random-forest cart bias bagging

1

আর / এমজিসিভি: টি () এবং টিআই () সেন্সর পণ্যগুলি কেন বিভিন্ন উপরিভাগ তৈরি করে?

mgcvপ্যাকেজের Rঝুলানো টেন্সর পণ্যের পারস্পরিক ক্রিয়ার জন্য দুটি ফাংশন আছে: te()এবং ti()। আমি উভয়ের মধ্যে শ্রমের মৌলিক বিভাজন বুঝতে পারি (একটি অ-রৈখিক ইন্টারঅ্যাকশন বনাম বনাম। এই ইন্টারঅ্যাকশনটিকে প্রধান প্রভাব এবং একটি মিথস্ক্রিয়াতে ডেকপোজ করে)। আমি যা বুঝতে পারি না তা হ'ল কেন te(x1, x2)এবং ti(x1) + ti(x2) + ti(x1, x2)(কিছুটা) …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

প্রশ্ন ট্যাগ «cart»