প্রশ্ন ট্যাগ «many-categories»

বৃহত সংখ্যার স্তর সহ শ্রেণীবদ্ধ ভেরিয়েবল এবং এই জাতীয় ভেরিয়েবলগুলির সাথে কাজ করার জন্য পরিসংখ্যানগত পদ্ধতি (উদাহরণ: ফিউজড লাসো)।

6
বহু স্তরের সাথে শ্রেণিবদ্ধ ভেরিয়েবলগুলি ভেঙে যাওয়ার মূলনীতি?
কোনও পরিসংখ্যানের মডেলটিতে ইনপুট (ভবিষ্যদ্বাণীকারী) হিসাবে তাদের ব্যবহার করার উদ্দেশ্যে, কয়েকটি বিভাগকে কয়েকটি ভাঙ্গার জন্য (বা পুলিং) কী কী কৌশলগুলি উপলভ্য? কলেজ ছাত্র মেজর (একটি স্নাতক ছাত্র দ্বারা নির্বাচিত শৃঙ্খলা) মত একটি পরিবর্তনশীল বিবেচনা করুন । এটি অযৌক্তিক এবং শ্রেণিবদ্ধ, তবে এটির সম্ভাব্য কয়েক ডজন স্বতন্ত্র স্তর থাকতে পারে। ধরা …

6
অনেক শ্রেণিবদ্ধ ভেরিয়েবলের সাথে শ্রেণিবিন্যাস উন্নত করুন
আমি 200,000+ নমুনা এবং নমুনা হিসাবে প্রায় 50 টি বৈশিষ্ট্য সহ একটি ডেটাসেটে কাজ করছি: 10 অবিচ্ছিন্ন ভেরিয়েবল এবং অন্যান্য 40 ডলার শ্রেণিবদ্ধ ভেরিয়েবল (দেশ, ভাষা, বৈজ্ঞানিক ক্ষেত্র ইত্যাদি)। এই শ্রেণিবদ্ধ ভেরিয়েবলগুলির জন্য আপনার কাছে উদাহরণস্বরূপ 150 টি ভিন্ন দেশ, 50 টি ভাষা, 50 টি বৈজ্ঞানিক ক্ষেত্র ইত্যাদি রয়েছে ... …

6
পাই চার্টে সমস্যা
পাই চার্ট সম্পর্কে ক্রমবর্ধমান আলোচনা হতে পারে বলে মনে হচ্ছে। এর বিরুদ্ধে মূল যুক্তিগুলি মনে হয়: দৈর্ঘ্যের চেয়ে কম শক্তি সহ অঞ্চলটি অনুমিত হয়। পাই চার্টগুলিতে খুব কম ডেটা-পয়েন্ট-টু-পিক্সেল অনুপাত থাকে তবে আমি অনুভব করি যে অনুপাতগুলি চিত্রিত করার সময় এগুলি কোনওভাবে কার্যকর হতে পারে। আমি বেশিরভাগ ক্ষেত্রে একটি টেবিল …

7
মেশিন লার্নিং মডেল বা সুপারিশকারী সিস্টেমে কীভাবে ভূগোল বা জিপ কোড উপস্থাপন করবেন?
আমি একটি মডেল তৈরি করছি এবং আমি মনে করি যে আমার টার্গেট ভেরিয়েবলের পূর্বাভাস দেওয়ার ক্ষেত্রে ভৌগলিক অবস্থানটি খুব ভাল হবে। আমার প্রতিটি ব্যবহারকারীর জিপ কোড আমার কাছে রয়েছে। যদিও আমি আমার মডেলটিতে পূর্বাভাসকারী বৈশিষ্ট্য হিসাবে জিপ কোড অন্তর্ভুক্ত করার সর্বোত্তম উপায় সম্পর্কে পুরোপুরি নিশ্চিত নই। যদিও জিপ কোডটি একটি …

5
আর এর র্যান্ডমফোরস্ট 32 টি স্তরের বেশি পরিচালনা করতে পারে না। কাজটি কী?
আর এর এলোমেলো প্যাকেজ 32 টিরও বেশি স্তরের সাথে ফ্যাক্টর পরিচালনা করতে পারে না। যখন এটি 32 টিরও বেশি স্তরের দেওয়া হয় তখন এটি একটি ত্রুটি বার্তা প্রকাশ করে: 32 টিরও বেশি বিভাগ সহ শ্রেণিবদ্ধ ভবিষ্যদ্বাণী পরিচালনা করতে পারে না। তবে আমার কাছে থাকা ডেটাতে কয়েকটি কারণ রয়েছে। এর মধ্যে …

4
পুনরাবৃত্তির সংখ্যা বাড়ার সাথে সাথে গ্রেডিয়েন্ট বুস্টিং মেশিনের নির্ভুলতা হ্রাস পায়
আমি এর মাধ্যমে গ্রেডিয়েন্ট বুস্টিং মেশিন অ্যালগরিদম নিয়ে পরীক্ষা করছি caret আর। প্যাকেজটির ing একটি ছোট কলেজ ভর্তি ডেটাসেট ব্যবহার করে, আমি নিম্নলিখিত কোডটি চালিয়েছি: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
স্থিত প্রভাব বনাম এলোমেলো প্রভাব যখন সমস্ত সম্ভাবনা মিশ্র প্রভাবগুলির মডেলটিতে অন্তর্ভুক্ত থাকে
একটি মিশ্র প্রভাবগুলির মডেলটিতে সমস্ত সম্ভাব্য স্তর অন্তর্ভুক্ত করা হয় (উদাহরণস্বরূপ, পুরুষ এবং মহিলা উভয়) প্যারামিটারটি অনুমান করার জন্য একটি নির্দিষ্ট প্রভাব ব্যবহার করার পরামর্শ দেওয়া হয়। যদি পরিবর্তিত স্তরগুলির একটি জনসংখ্যার কেবলমাত্র এলোমেলো নমুনা হয় (সম্ভাব্য রোগীদের মহাবিশ্বের তালিকাভুক্ত রোগীরা) এবং আপনি জনসংখ্যার গড় পরিবর্তনের এবং তারতম্যের পরিবর্তনের জন্য …

2
যন্ত্র শেখার জন্য সংখ্যায় শ্রেণীবদ্ধ বৈশিষ্ট্যগুলি এনকোডিং
অনেক মেশিন লার্নিং অ্যালগরিদম, উদাহরণস্বরূপ নিউরাল নেটওয়ার্কগুলি সংখ্যার সাথে মোকাবিলা করার আশা করে। সুতরাং, যখন আপনার একটি শ্রেণিবদ্ধ ডেটা থাকবে, আপনার এটি রূপান্তর করতে হবে। শ্রেণিবদ্ধ দ্বারা আমার অর্থ, উদাহরণস্বরূপ: গাড়ির ব্র্যান্ডস: অডি, বিএমডাব্লু, শেভ্রোলেট ... ব্যবহারকারীর আইডি: 1, 25, 26, 28 ... যদিও ব্যবহারকারী আইডিগুলি সংখ্যা, তারা কেবলমাত্র লেবেল, …

2
সাধারণ বা নামমাত্র ডেটাতে বিভাগগুলি মার্জ / কমানোর পদ্ধতি?
নামমাত্র বা অর্ডিনাল ডেটাতে বিভাগের সংখ্যা হ্রাস করার জন্য আমি কোনও পদ্ধতি খুঁজতে লড়াই করছি। উদাহরণস্বরূপ, আসুন আমরা বলি যে আমি একটি ডেটাসেটে একটি রিগ্রেশন মডেল তৈরি করতে চাই যেখানে বেশ কয়েকটি নামমাত্র এবং অর্ডিনাল ফ্যাক্টর রয়েছে। যদিও এই পদক্ষেপে আমার কোনও সমস্যা নেই, আমি প্রায়শই এমন পরিস্থিতিতে চলে যাই …

1
আরআর-তে স্বাধীনতা ডিগ্রিআরসিআরসি মিশ্রিত এবং lme / lmer এর মধ্যে পার্থক্য
দ্রষ্টব্য: এই প্রশ্নটি পুনরায় পোস্ট করা হয়েছে, কারণ আমার আগের প্রশ্নটি আইনি কারণে মুছে ফেলা হয়েছিল। আর- lmeএর nlmeপ্যাকেজ থেকে ফাংশনটির সাথে এসএএস থেকে প্রসকে মিক্সেড তুলনা করার সময় , আমি কিছু বরং বিভ্রান্তিকর পার্থক্যের উপর হোঁচট খেয়েছি। আরও সুনির্দিষ্টভাবে বলা যায় যে বিভিন্ন পরীক্ষায় স্বাধীনতার ডিগ্রিগুলির মধ্যে পার্থক্য রয়েছে …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
আনর্ডার্ডযুক্ত শ্রেণিবদ্ধ ভবিষ্যদ্বাণী ভেরিয়েবলের স্তরের সংখ্যা হ্রাস করা
আমি একটি শ্রেণিবদ্ধ প্রশিক্ষণ দিতে চাই, এসভিএম, বা এলোমেলো বন, বা অন্য কোনও শ্রেণিবদ্ধকে বলতে চাই। ডেটাসেটের বৈশিষ্ট্যগুলির মধ্যে একটি হল 1000 স্তরের বিশিষ্ট পরিবর্তনশীল। এই পরিবর্তনশীল স্তরের সংখ্যা হ্রাস করার সর্বোত্তম উপায় কী। আর combine.levels()-তে হ্মিস্ক প্যাকেজে ডাকা একটি ফাংশন রয়েছে যা বিরল স্তরের সাথে সংযুক্ত, তবে আমি অন্যান্য …

3
ওয়ান-হট এনকোডিং বনাম ডামি এনকোডিংয়ের সমস্যা
আমি এই সত্যটি সম্পর্কে সচেতন যে কে স্তরের সাথে শ্রেণিবদ্ধ ভেরিয়েবলগুলি ডামি এনকোডিংয়ে (1 একইভাবে বহু-মূল্যবান শ্রেণিবদ্ধ ভেরিয়েবলগুলির জন্য) কে -1 ভেরিয়েবলের সাথে এনকোড করা উচিত। আমি ভাবছিলাম যে বিভিন্ন রিগ্রেশন পদ্ধতির জন্য মূলত লিনিয়ার রিগ্রেশন, পেনালাইড লিনিয়ার রিগ্রেশন (লাসো, রিজ, ইলাস্টিক নেট), বৃক্ষভিত্তিক (এলোমেলো বন) এক-হট এনকোডিং (যেমন পরিবর্তে …

3
ডেটামিনিংয়ের জন্য ফ্যাক্টর স্তরগুলির সংমিশ্রণের জন্য প্যাকেজ?
ভাবছেন যে কেউ যদি আর এর কোনও প্যাকেজ / ফাংশন জুড়ে চলেছে যা এমন কোনও ফ্যাক্টরের স্তরগুলিকে একত্রিত করবে যেটির উপাদানগুলির সমস্ত স্তরের অনুপাতটি কিছু প্রান্তিকের চেয়ে কম? বিশেষত, আমি প্রস্তুত ডেটা প্রস্তুতির প্রথম পদক্ষেপগুলির মধ্যে একটি হল বিরল স্তরের কারণগুলি একসাথে ('অন্যান্য' নামক একটি স্তরে বলুন) ভেঙে ফেলা যা …

1
শ্রেণিবদ্ধ ডেটার জন্য দণ্ডিত পদ্ধতি: একটি ফ্যাক্টরের স্তরের সমন্বয়
পেনালাইজড মডেলগুলি এমন মডেলগুলি অনুমান করতে ব্যবহার করা যেতে পারে যেখানে পরামিতিগুলির সংখ্যা নমুনার আকারের সমান বা তার চেয়েও বেশি বেশি is শ্রেণিবদ্ধ বা গণনা ডেটার বৃহত স্পার ছকগুলির লগ-লিনিয়ার মডেলগুলিতে এই পরিস্থিতি দেখা দিতে পারে। এই সেটিংগুলিতে প্রায়শই এমন ফ্যাক্টরের স্তরের সংমিশ্রণ করে টেবিলগুলি ধসে ফেলা বাঞ্ছনীয় বা সহায়ক …
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.