প্রশ্ন ট্যাগ «clustering»

ক্লাস্টারের বিশ্লেষণ হ'ল শ্রেণীর লেবেলগুলির মতো প্রাইসিসিস্টিক জ্ঞান ব্যবহার না করে তাদের পারস্পরিক "মিল" অনুসারে অবজেক্টের উপ-উপসর্গগুলিতে ডেটা বিভক্ত করার কাজ। [ক্লাস্টার্ড-স্ট্যান্ডার্ড-ত্রুটি এবং / অথবা ক্লাস্টার-নমুনাগুলি যেমন ট্যাগ করা উচিত; তাদের জন্য "ক্লাস্টারিং" ট্যাগটি ব্যবহার করবেন না]]

1
ডিবিএসসিএএন-এর জন্য eps এবং minPts চয়ন করার একটি রুটিন
কিছু সাহিত্যের অনুসারে ডিবিএসসিএএন বেশিরভাগ ক্লাস্টারিং অ্যালগরিদমকে উদ্ধৃত করা হয় এবং এটি ঘনত্বের ভিত্তিতে নির্বিচার আকারের ক্লাস্টারগুলি খুঁজে পেতে পারে। এটিতে দুটি প্যারামিটার ইপস রয়েছে (প্রতিবেশের ব্যাসার্ধ হিসাবে) এবং মিনিপটস (নূন্যতম প্রতিবেশী হিসাবে কোনও বিন্দুটিকে মূল বিষয় হিসাবে বিবেচনা করতে হবে) যা আমি বিশ্বাস করি এটি তাদের উপর নির্ভর করে। …

2
আর-তে কোনও ফাংশন রয়েছে যা পাওয়া গেছে এমন ক্লাস্টারগুলির কেন্দ্রগুলিতে নিয়ে যায় এবং একটি নতুন ডেটা সেটে ক্লাস্টারগুলিকে নিয়োগ করে
আমার কাছে একটি বহুমাত্রিক ডেটা সেটের দুটি অংশ রয়েছে, আসুন তাদের কল করুন trainএবং test। এবং আমি ট্রেনের ডেটা সেটের ভিত্তিতে একটি মডেল তৈরি করতে চাই এবং তারপরে এটি পরীক্ষার ডেটা সেটটিতে বৈধতা দিতে চাই। গুচ্ছ সংখ্যা জানা যায়। আমি আর-তে কে-মানে ক্লাস্টারিং প্রয়োগ করার চেষ্টা করেছি এবং আমি এমন …
14 r  clustering  k-means 

4
কে-মানে ইনপুটটিতে কাস্টম দূরত্বের ম্যাট্রিক্স সহ বাস্তবায়ন
কেও আমাকে কোনও কে-মানে বাস্তবায়নটি নির্দেশ করতে পারে (মাতলাব থাকলে এটি আরও ভাল হবে) যা ইনপুটটিতে দূরত্বের ম্যাট্রিক্স নিতে পারে? স্ট্যান্ডার্ড ম্যাটল্যাব বাস্তবায়নের জন্য ইনপুটটিতে পর্যবেক্ষণ ম্যাট্রিক্স প্রয়োজন এবং সাদৃশ্য পরিমাপটি কাস্টম পরিবর্তন করা সম্ভব নয়।

3
Kmeans চালানোর আগে আমার কি পারস্পরিক সম্পর্কযুক্ত / কল্লাইনারযুক্ত ভেরিয়েবলগুলি ফেলে দেওয়ার দরকার আছে?
আমি গ্রাহকদের ক্লাস্টার সনাক্ত করতে কামান চালাচ্ছি। ক্লাস্টারগুলি সনাক্ত করতে আমার প্রায় 100 পরিবর্তনশীল রয়েছে। এই প্রতিটি ভেরিয়েবল কোনও বিভাগে কোনও গ্রাহকের ব্যয়ের% উপস্থাপন করে। সুতরাং, আমার যদি 100 টি বিভাগ থাকে তবে আমার কাছে এই 100 ভেরিয়েবলগুলি রয়েছে যে এই ভেরিয়েবলগুলির যোগফল প্রতিটি গ্রাহকের জন্য 100%। এখন, এই ভেরিয়েবলগুলি …

5
ন্যূনতম ক্লাস্টার আকারের সীমাবদ্ধতার সাথে ক্লাস্টারিং (কে-মানে বা অন্যথায়)
বর্গাকার (ডাব্লুএসএস) এর গ্রুপের যোগফলকে ন্যূনতম করার জন্য আমাকে ক্লাস্টার ইউনিটগুলি ক্লাস্টারগুলিতে করতে হবে, তবে আমার নিশ্চিত করতে হবে যে প্রতিটি ক্লাস্টারে কমপক্ষে ইউনিট রয়েছে। কোনও ধারণা যদি আর এর কোনও ক্লাস্টারিং ফাংশন ন্যূনতম ক্লাস্টার আকারের সীমাবদ্ধতার সাপেক্ষে ক্লাস্টারগুলিতে ক্লাস্টারিংয়ের অনুমতি দেয় ? kmeans () কোনও আকারের বাধা বিকল্প হিসাবে …
14 r  clustering 

5
আমি কীভাবে দূরত্বকে (ইউক্লিডিয়ান) অনুরূপ স্কোর রূপান্তর করতে পারি
আমি মানে ক্লাস্টার স্পিকার ভয়েসেস ক্লাস্টারিং ব্যবহার করছি । যখন আমি ক্লাস্টার স্পিকার ডেটার সাথে আমার উচ্চারণের তুলনা করি (ইউক্লিডিয়ান দূরত্ব ভিত্তিক) গড় বিকৃতি। এই দূরত্বটি এর মধ্যে হতে পারে । আমি এই দূরত্বটিকে অনুরূপ স্কোর রূপান্তর করতে চাই । আমি কীভাবে এটি অর্জন করতে পারি দয়া করে আমাকে গাইড …

1
প্রতিলিপিতে অত্যাধুনিক
রেকর্ড প্রতিলিপিতে অত্যাধুনিক কী কী পদ্ধতি রয়েছে? অনুদানকে কখনও কখনও বলা হয়: রেকর্ড লিঙ্কেজ, সত্তা রেজোলিউশন, পরিচয় রেজোলিউশন, মার্জ / শুদ্ধিকরণ। আমি সিব্লক [1] সম্পর্কে উদাহরণস্বরূপ জানি। উত্তরগুলিতে পদ্ধতিগুলি প্রয়োগকারী বিদ্যমান সফ্টওয়্যারগুলির উল্লেখগুলি অন্তর্ভুক্ত করা হলে আমি প্রশংসা করব। আমি উদাহরণস্বরূপ জানি যে মাহাউট ক্যানোপি-ক্লাস্টারিং প্রয়োগ করে । এছাড়াও ডিউক …

3
আর এ ক্লাস্টার বিগ ডেটা কি নমুনা প্রাসঙ্গিক?
আমি ডেটা সায়েন্সে নতুন এবং 200,000 সারি এবং আর-এ 50 টি কলাম সহ একটি ডেটা সেটটিতে ক্লাস্টারগুলি খুঁজে পেতে সমস্যা হচ্ছে যেহেতু ডেটাতে উভয় সংখ্যাসূচক এবং নামমাত্র ভেরিয়েবল রয়েছে, তাই কে-ইনের মতো পদ্ধতিগুলি যা ইউক্লিডিয়ান দূরত্ব পরিমাপ ব্যবহার করে তা উপযুক্ত পছন্দ বলে মনে হয় না। সুতরাং আমি পিএএম, অ্যাগনেস …

5
টেম্পোরাল ডেটার জন্য উপযুক্ত ক্লাস্টারিং কৌশল?
আমার কাছে ক্রিয়াকলাপের ফ্রিকোয়েন্সিগুলির অস্থায়ী ডেটা রয়েছে। আমি ডেটাতে ক্লাস্টারগুলি সনাক্ত করতে চাই যা অনুরূপ ক্রিয়াকলাপের স্তরের সাথে সময়ের স্বতন্ত্র সময়কে নির্দেশ করে। আদর্শভাবে আমি ক্লাস্টারগুলির সংখ্যা উল্লেখ না করেই ক্লাস্টারগুলি সনাক্ত করতে চাই । উপযুক্ত ক্লাস্টারিং কৌশলগুলি কী কী? যদি আমার প্রশ্নের উত্তর দেওয়ার জন্য পর্যাপ্ত তথ্য না থাকে …

4
ডেটাসেটের এলোমেলো সাবমেলগুলির মাধ্যমে কে-কেন্দ্র কেন্দ্রগুলি শুরু করছেন?
আমার যদি একটি নির্দিষ্ট ডেটাসেট থাকে তবে dat ডেটাসেটের এলোমেলো নমুনার মাধ্যম ব্যবহার করে গুচ্ছ কেন্দ্রগুলি শুরু করা কতটা স্মার্ট হবে? উদাহরণস্বরূপ, ধরুন আমি চাই 5 clusters। আমি মূল ডেটাসেটের 5 random samplesবলি size=20%। তাহলে আমি কি এই 5 টি এলোমেলো নমুনার প্রত্যেকটির গড় গ্রহণ করতে পারি এবং সেগুলি আমার …

2
ক্লাস্টার বিশ্লেষণের ফলাফলগুলি বৈধ করার জন্য পরিসংখ্যানগত তাত্পর্য পরীক্ষা ব্যবহার করা
ক্লাস্টার বিশ্লেষণের ফলাফলগুলি যাচাই করতে আমি পরিসংখ্যানগত তাত্পর্য পরীক্ষার (এসএসটি) ব্যবহার জরিপ করছি। আমি এই বিষয়টির আশেপাশে বেশ কয়েকটি কাগজপত্র পেয়েছি " পরিসংখ্যানগত সিগনি by হাই-ডাইমেনশনের জন্য ক্লাস্টারিংয়ের ক্যান্সার, কম – নমুনা আকারের ডেটা " লিউ, ইউফেনগ এট ​​আল দ্বারা। (2008) " ক্লাস্টার বিশ্লেষণে কিছু তাত্পর্যপূর্ণ পরীক্ষা ", বক দ্বারা …

2
ক্লাস্টারিং ফলাফলের তুলনা বোঝা
আমি গ্রুপগুলিতে ডেটা শ্রেণিবদ্ধকরণ নিয়ে পরীক্ষা করছি। আমি এই বিষয়টিতে বেশ নতুন, এবং কিছু বিশ্লেষণের ফলাফল বুঝতে চেষ্টা করছি। কুইক-আর-এর উদাহরণ ব্যবহার করে কয়েকটি Rপ্যাকেজ প্রস্তাবিত। আমি এই দুটি প্যাকেজ ব্যবহার করার চেষ্টা করেছি ( ফাংশনটি fpcব্যবহার করে kmeansএবং mclust)। এই বিশ্লেষণের একটি দিক যা আমি বুঝতে পারি না তা …
13 r  clustering 

1
LARS বনাম লাসোর জন্য স্থায়ী বংশোদ্ভূত
L1- নিয়মিত লিনিয়ার রিগ্রেশন ফিটিংয়ের জন্য স্থানাঙ্ক বংশোদ্ভূত ব্যবহারের তুলনায় LARS [1] ব্যবহারের পক্ষে কি কি? আমি মূলত পারফরম্যান্সের দিকগুলিতে আগ্রহী (আমার সমস্যাগুলি Nকয়েক হাজার এবং p<20 এর মধ্যে থাকে) তবে তবে অন্য কোনও অন্তর্দৃষ্টিও প্রশংসা হবে। সম্পাদনা: যেহেতু আমি প্রশ্ন পোস্ট করেছি, চিএল ফ্রেডম্যান এট আল দ্বারা একটি কাগজ …

4
এই পারস্পরিক সম্পর্ক ভিত্তিক দূরত্বগুলির জন্য কি ত্রিভুজ বৈষম্য পূরণ হয়?
শ্রেণিবদ্ধ ক্লাস্টারিংয়ের জন্য আমি প্রায়শই দুটি এবং এলোমেলো ভেরিয়েবল XXX এবং মধ্যবর্তী দূরত্ব পরিমাপ করার জন্য নিম্নলিখিত দুটি "মেট্রিক" (তারা ঠিক বলছেন না) দেখতে পাই YYY: \ {align} d_1 (X, Y) & = 1- | \ Cor (X, Y) |, \\ d_2 (X, Y) & = 1 - (\ Cor …

4
কামেন ক্লাস্টারিংয়ের কোনও কনুই পয়েন্ট না থাকলে আপনি কী করবেন
আমি শিখেছি যে বেশ কয়েকটি ক্লাস্টার বেছে নেওয়ার সময় আপনার কে এর বিভিন্ন মানের জন্য একটি কনুই পয়েন্ট সন্ধান করা উচিত I've কনুই. আপনি এই ধরনের ক্ষেত্রে কি করবেন?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.