পরিসংখ্যান এবং বড় তথ্য clustering

4

আপনি কী-কে-এর একটি বাস্তবায়ন পরীক্ষা করবেন?

দাবি অস্বীকার: আমি এই প্রশ্নটি স্ট্যাকওভারফ্লোতে পোস্ট করেছি, তবে আমি ভেবেছিলাম এটি সম্ভবত এই প্ল্যাটফর্মের জন্য উপযুক্ত। বহুমাত্রিক ডেটা সেটগুলির জন্য আপনি কীভাবে আপনার নিজের কী-মানে বাস্তবায়ন পরীক্ষা করেন? আমি ডেটাতে ইতিমধ্যে বিদ্যমান বাস্তবায়ন (অর্থাত্ মতলব) চালানোর কথা ভাবছিলাম এবং ফলাফলগুলিকে আমার অ্যালগরিদমের সাথে তুলনা করব। তবে এর জন্য উভয় …

11 clustering algorithms

2

খুব স্কিউড, গণনা ডেটার ক্লাস্টারিং: কোনও পরামর্শ (ট্রান্সফর্ম ইত্যাদি) সম্পর্কে যেতে?

বেসিক সমস্যা এখানে আমার বেসিক সমস্যাটি: আমি গণনা সহ কিছু খুব স্কিউ ভেরিয়েবলযুক্ত একটি ডেটাসেট ক্লাস্টার করার চেষ্টা করছি। ভেরিয়েবলগুলিতে অনেকগুলি শূন্য থাকে এবং সুতরাং এটি আমার ক্লাস্টারিং পদ্ধতির জন্য খুব তথ্যপূর্ণ নয় - যা সম্ভবত কে-অর্থাত্ অ্যালগরিদম হতে পারে। ভাল, আপনি বলেছেন যে, কেবল স্কোয়ার রুট, বক্স কক্স বা …

11 clustering data-transformation k-means count-data compositional-data

1

কীভাবে স্বয়ংক্রিয়ভাবে একটি ইউ-ম্যাট্রিক্স ক্লাস্টার করবেন?

একটি স্ব-সংগঠিত মানচিত্র প্রশিক্ষণের পরে, ইউ-ম্যাট্রিক্স গণনা করা যায় । এটি ম্যানুয়ালি ভিজ্যুয়ালাইজ করতে এবং ক্লাস্টারগুলি সনাক্ত করার জন্য কয়েকটি সরঞ্জাম রয়েছে তবে আমি ভাবছি যে স্বয়ংক্রিয় উপায়ে এই প্রক্রিয়াটি করার জন্য কোনও অ্যালগরিদম রয়েছে কিনা (অর্থাত্ গুচ্ছগুলি সনাক্ত করতে কোনও ব্যক্তির দিকে তাকানো নেই)। এই কাজ করতে কোন উপায় …

10 clustering image-processing self-organizing-maps

3

শ্রেণিবদ্ধ ভেরিয়েবলগুলির জনপ্রিয় বা সাধারণ সংমিশ্রণগুলি খুঁজতে আমি কীভাবে পরিসংখ্যানগুলি ব্যবহার করতে পারি?

আমি পলিড্রু ব্যবহার সম্পর্কে একটি গবেষণা করছি। আমার কাছে 400 মাদকসেবীদের একটি ডেটা সেট রয়েছে, যারা প্রত্যেকে তাদের অপব্যবহারের ওষুধ বলেছিল। এখানে 10 টিরও বেশি ওষুধ রয়েছে এবং তাই এখানে সম্ভাব্য সংমিশ্রণ রয়েছে। তারা বাইনারি ভেরিয়েবলগুলিতে যে পরিমাণ ওষুধ খায় সেগুলির বেশিরভাগটি আমি পুনঃনির্মাণ করেছি (কোনও মাদকাসক্ত হেরোইন অন্য 0 …

10 hypothesis-testing clustering combinatorics association-measure association-rules

1

টিএফ-আইডিএফ লগারিদমে লোগারিদমের ব্যবহার বোঝা

আমি পরিতেছিলাম: https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition তবে সূত্রটি কেন ঠিক এমনভাবে তৈরি করা হয়েছিল তা আমি বুঝতে পারি না। আমি কি বুঝতে পারি: আইডিএফকে কিছু স্তরে পরিমাপ করা উচিত যে প্রতিটি নথিতে একটি শব্দ এস কতবার প্রকাশিত হয়, শব্দটি আরও ঘন ঘন প্রদর্শিত হওয়ায় মান হ্রাস পায়। সেই দৃষ্টিকোণ থেকে i D F( …

10 machine-learning clustering mathematical-statistics text-mining natural-language

3

"আর" গ্রাফ ক্লাস্টারিং এর পদ্ধতির এবং উদাহরণ

আমি 'আর' তে গ্রাফ ক্লাস্টারিং ব্যবহার করে একটি গ্রাফে নোডগুলিকে গ্রুপ / মার্জ করতে চাইছি। এখানে আমার সমস্যার একটি অত্যাশ্চর্য খেলনা তারতম্য। দুটি "গুচ্ছ" আছে গুচ্ছ সংযোগকারী একটি "ব্রিজ" রয়েছে এখানে একটি প্রার্থী নেটওয়ার্ক: আমি যখন সংযোগের দূরত্বটি দেখি, "হপকাউন্ট", আপনি যদি চান তবে আমি নীচের ম্যাট্রিক্সটি পেতে পারি: mymatrix …

10 r clustering data-visualization numerics

1

আমি জিএপি পরিসংখ্যান কীভাবে ব্যাখ্যা করব?

আমি আর এ কে ক্লাস্টারগুলি অনুমান করার জন্য জিএপি পরিসংখ্যান ব্যবহার করেছি However তবে আমি এটির ভাল ব্যাখ্যা করি কিনা তা নিশ্চিত নই। উপরের প্লট থেকে আমি ধরে নিচ্ছি যে আমার 3 টি ক্লাস্টার ব্যবহার করা উচিত। দ্বিতীয় প্লট থেকে আমার 6 টি ক্লাস্টার বেছে নেওয়া উচিত। এটি জিএপি পরিসংখ্যানের …

10 clustering

1

টোটাল এসএস এবং এসএস এর মধ্যে কে-ক্লাস্টারিংয়ের অর্থ কী?

গুচ্ছ বিশ্লেষণে আমি খুব নতুন। আমি কে-মানে ক্লাস্টারিংয়ের জন্য আর ব্যবহার করছি এবং আমি আশ্চর্য হই যে এই জিনিসগুলি কী। এবং যদি তাদের অনুপাতটি ছোট বা বড় হয় তবে এর চেয়ে ভাল আর কী হতে পারে?

10 clustering

2

ননপ্যারমেট্রিক ক্লাস্টারিংয়ের জন্য পাইএমসি: গাউসিয়ান মিশ্রণের পরামিতিগুলি অনুমান করার জন্য ডিরিচলেট প্রক্রিয়াটি গুচ্ছ হতে ব্যর্থ হয়েছে

সমস্যা সমাধান খেলনা সংক্রান্ত প্রথম সমস্যার মধ্যে আমি পাইএমসি প্রয়োগ করতে চেয়েছিলাম তা হ'ল ননপ্যারমেট্রিক ক্লাস্টারিং: কিছু তথ্য দেওয়া হলে এটিকে গাওসিয়ান মিশ্রণ হিসাবে মডেল করুন এবং গুচ্ছের সংখ্যা এবং প্রতিটি ক্লাস্টারের গড় এবং সমবায়তা শিখুন। এই পদ্ধতিটি সম্পর্কে আমি যা জানি তার বেশিরভাগই মাইকেল জর্ডান এবং ইয়ে হোয়ে তেহ, …

10 bayesian clustering python pymc nonparametric-bayes

3

জনসংখ্যার আর-বর্গ পরিবর্তনের উপর আস্থার ব্যবধান কীভাবে পাবেন

একটি সাধারণ উদাহরণের জন্য ধরে নিন যে দুটি লিনিয়ার রিগ্রেশন মডেল রয়েছে মডেল 1 গেছে তিন ভবিষ্যতবক্তা, x1a, x2b, এবংx2c মডেল 2 এর মডেল 1 থেকে তিনটি ভবিষ্যদ্বাণী এবং দুটি অতিরিক্ত ভবিষ্যদ্বাণী x2aএবংx2b একটি জনসংখ্যার রিগ্রেশন সমীকরণ রয়েছে যেখানে জনসংখ্যার বৈচিত্রটি বর্ণিত হয়েছে মডেল 1 এর জন্য ρ2(1)ρ(1)2\rho^2_{(1)} এবং মডেল …

10 regression confidence-interval estimation r-squared shrinkage anova t-test references tukey-hsd machine-learning boosting r clustering fishers-exact generalized-linear-model model probit link-function r survival probability distributions dice logistic lme4-nlme glmm meta-analysis distributions distributions factor-analysis r anova repeated-measures post-hoc

2

একটি নির্দিষ্ট দূরত্বের মধ্যে পয়েন্ট সংখ্যা সর্বাধিকীকরণকারী চেনাশেন্দ্রগুলির একটি পরিচিত সংখ্যা সন্ধান করা

আমার কাছে 2-ডি ডেটার একটি সেট রয়েছে যেখানে আমি নির্দিষ্ট বৃত্তের ( ) কেন্দ্রের নির্দিষ্ট সংখ্যক কেন্দ্রগুলির কেন্দ্রগুলি সন্ধান করতে চাই যা নির্দিষ্ট দূরত্বে ( ) এর মধ্যে মোট পয়েন্টের সংখ্যা সর্বাধিক করে দেয় ।NNNRRR উদাহরণস্বরূপ আমার 10,000 টি ডাটা পয়েন্ট রয়েছে এবং আমি সার্কেলের কেন্দ্রগুলি খুঁজে পেতে চাই যা …

10 r clustering distance

1

কম সিলুয়েটের প্রস্থের অর্থ কি ডেটাটির অন্তর্নিহিত কাঠামো খুব কম?

আমি সিকোয়েন্স বিশ্লেষণে নতুন, এবং আমি ভাবছিলাম যে সর্বোত্তম ম্যাচিং-ভিত্তিক ভিন্নতা ম্যাট্রিকগুলির ক্লাস্টার বিশ্লেষণগুলি থেকে গড় সিলুয়েট প্রস্থগুলি (এএসডাব্লু) কম হলে (প্রায় 25)) এই সিদ্ধান্তটি গ্রহণ করা কি যথাযথ বলে মনে হচ্ছে যে এখানে সামান্য অন্তর্নিহিত কাঠামো রয়েছে যা অনুক্রমগুলি ক্লাস্টার করার অনুমতি দেয়? গুচ্ছ মানের অন্যান্য ব্যবস্থা (আমি নীচে …

10 clustering traminer

1

কেন আনোভা () এবং ড্রপ 1 () জিএলএমএমগুলির জন্য আলাদা উত্তর সরবরাহ করে?

আমার ফর্মটির একটি জিএলএমএম রয়েছে: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) আমি যখন ব্যবহার করি drop1(model, test="Chi"), তখন আমি Anova(model, type="III")গাড়ি প্যাকেজটি ব্যবহার করি বা না থেকে তার চেয়ে আলাদা ফলাফল পাই summary(model)। এই দ্বিতীয় দুটি একই উত্তর দেয়। একগুচ্ছ মনগড়া তথ্য …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

2

প্রথম অর্ডার মার্কভ চেইনের ক্লাস্টারগুলি মূল্যায়ন

আমি কয়েক হাজার প্রথম অর্ডার মার্কভ চেইনের আমার ডেটাসেটটি প্রায় 10 টি ক্লাস্টারে ক্লাস্টার করেছি। আমি কীভাবে এই ক্লাস্টারগুলিকে মূল্যায়ন করতে পারি এবং গুচ্ছগুলিতে থাকা আইটেমগুলি কী ভাগ করে নেয় এবং কীভাবে তারা অন্যান্য ক্লাস্টার থেকে পৃথক হয় তা কীভাবে প্রস্তাবিত করার কোনও উপায় আছে? সুতরাং আমি যেমন বিবৃতি দিতে …

10 data-visualization clustering markov-process

1

ডেনড্রগ্রাম ক্লাস্টারিংয়ের জন্য কফেনেটিক পারস্পরিক সম্পর্ক রয়েছে

একটি ডেনড্রগ্রাম ক্লাস্টারিংয়ের প্রসঙ্গটি বিবেচনা করুন। আসুন আমরা ব্যক্তিদের মধ্যে দূরত্বকে মূল অসামঞ্জস্যতা বলি । ডেনড্রোগ্রাম তৈরির পরে আমরা দুটি ব্যক্তির মধ্যে কফেনেটিক বৈষম্যকে সংজ্ঞায়িত করি যেগুলি এই ব্যক্তিগুলির মধ্যে থাকা ক্লাস্টারের মধ্যে দূরত্ব হিসাবে রয়েছে as কিছু লোক বিবেচনা করে যে আসল অসামঞ্জস্য এবং কোফেনেটিক অসম্পূর্ণতার (যা কোফেনেটিক পারস্পরিক …

10 clustering classification

প্রশ্ন ট্যাগ «clustering»