প্রশ্ন ট্যাগ «clustering»

ক্লাস্টারের বিশ্লেষণ হ'ল শ্রেণীর লেবেলগুলির মতো প্রাইসিসিস্টিক জ্ঞান ব্যবহার না করে তাদের পারস্পরিক "মিল" অনুসারে অবজেক্টের উপ-উপসর্গগুলিতে ডেটা বিভক্ত করার কাজ। [ক্লাস্টার্ড-স্ট্যান্ডার্ড-ত্রুটি এবং / অথবা ক্লাস্টার-নমুনাগুলি যেমন ট্যাগ করা উচিত; তাদের জন্য "ক্লাস্টারিং" ট্যাগটি ব্যবহার করবেন না]]

4
একটি পারস্পরিক সম্পর্কের ক্লাস্টারিং ম্যাট্রিক্স
আমার একটি পারস্পরিক সম্পর্ক ম্যাট্রিক্স রয়েছে যা প্রতিটি আইটেমকে অন্য আইটেমের সাথে কীভাবে সংযুক্ত করে তা উল্লেখ করে। সুতরাং কোনও এন আইটেমের জন্য আমার কাছে ইতিমধ্যে একটি এন * এন পারস্পরিক সম্পর্ক ম্যাট্রিক্স রয়েছে। এই পারস্পরিক সম্পর্কের ম্যাট্রিক্সটি ব্যবহার করে আমি কীভাবে এম বিনগুলিতে এন আইটেমগুলি ক্লাস্টার করব যাতে আমি …

5
এমন কোনও আর ফাংশন রয়েছে যা কোসিনের ভিন্নতা ম্যাট্রিক্স গণনা করবে? [বন্ধ]
বন্ধ থাকে। এই প্রশ্নটি অফ-টপিক । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি ক্রস ভ্যালিডেটের জন্য অন-বিষয় । গত বছর বন্ধ ছিল । আমি কোসাইন দূরত্বের ভিত্তিতে সারি ক্লাস্টারিং সহ একটি হিটম্যাপ তৈরি করতে চাই। আমি আর ব্যবহার করছি heatmap.2()এবং চিত্র …

3
শ্রেণিবদ্ধ ক্লাস্টারিংয়ে ইউক্লিডিয়ান দূরত্বের ব্যবস্থায় সাধারণকরণের কারণ
স্পষ্টতই, হায়ারারিকিকাল ক্লাস্টারিংয়ে যেখানে দূরত্বের পরিমাপ ইউক্যালিডিয়ান দূরত্ব হয়, ক্লাস্টারিং চালানো থেকে সর্বোচ্চ বৈকল্পিকতা সহ কোভারিয়টকে রোধ করার জন্য ডেটাটিকে প্রথমে স্বাভাবিক বা মানিক করা উচিত। কেন? এই বাস্তবতা কি কাম্য নয়?

8
আর এর সাথে মিশ্রিত টাইপের ডেটা ক্লাস্টারিং
লক । এই প্রশ্ন এবং এর উত্তরগুলি লক করা হয়েছে কারণ প্রশ্নটি অফ-টপিক তবে butতিহাসিক তাত্পর্যপূর্ণ। এটি বর্তমানে নতুন উত্তর বা মিথস্ক্রিয়া গ্রহণ করছে না। আমি ভাবছি যে মিশ্রিত ডেটা ভেরিয়েবলযুক্ত ডেটার একটি ক্লাস্টারিংয়ের মাধ্যমে আর সম্পাদন করা সম্ভব কিনা। অন্য কথায় আমার কাছে একটি ডেটা সেট রয়েছে যার মধ্যে …

1
কে-ক্লাস্টারিং ক্লাস্টার সংখ্যার সংজ্ঞা কীভাবে দেওয়া যায়?
অনুকূল ক্লাস্টার নম্বর নির্ধারণ করার কোনও উপায় আছে কি আমার ভাল মান সম্পর্কে সিদ্ধান্ত নেওয়ার জন্য আলাদা আলাদা মানগুলি চেষ্টা করা উচিত এবং ত্রুটির হারগুলি পরীক্ষা করা উচিত?

4
শ্রেণিবদ্ধ তথ্য সহ, ভেরিয়েবলগুলি সম্পর্কিত না করে সেখানে গুচ্ছ থাকতে পারে?
ক্লাস্টার বিশ্লেষণগুলি ব্যাখ্যা করার চেষ্টা করার সময়, ভেরিয়েবলগুলি পরস্পর সম্পর্কিত কিনা তা সম্পর্কিত হওয়ার কারণে লোকেরা প্রক্রিয়াটিকে ভুল বোঝে is লোকদের বিভ্রান্ত করার একটি উপায় হ'ল এইরকম একটি চক্রান্ত: এটি ক্লাস্টার রয়েছে কিনা এবং ভেরিয়েবলগুলি সম্পর্কিত কিনা এই প্রশ্নের মধ্যে স্পষ্টভাবে তা প্রদর্শন করে। তবে এটি কেবল অবিচ্ছিন্ন তথ্যের পার্থক্যের …

4
হায়ারারিকাল ক্লাস্টারিংয়ের ত্রুটিগুলি কীভাবে বোঝবেন?
কেউ কি হায়ারারিকাল ক্লাস্টারিংয়ের উপকারিতা এবং বিধিগুলি ব্যাখ্যা করতে পারেন? হায়ারার্কিকাল ক্লাস্টারিং এর কে যেমন বোঝাচ্ছে একই ত্রুটি রয়েছে? কে হায়ারারিকিকাল ক্লাস্টারিং এর সুবিধা কী? হায়ারারিকাল ক্লাস্টারিং ও তার বিপরীতে কখন আমাদের কে ব্যবহার করা উচিত? এই পোস্টের উত্তরগুলি কে এর ত্রুটিগুলি বোঝায় খুব ভাল। কে-উপায়গুলির ত্রুটিগুলি কীভাবে বোঝা যায়

3
কে-মানে ক্লাস্টার পার্টিশনের সবচেয়ে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলির অনুমান করা
কে-মানে ক্লাস্টার সমাধানের মধ্যে ডেটাসেটের কোন বৈশিষ্ট্য / ভেরিয়েবলগুলি সবচেয়ে গুরুত্বপূর্ণ / প্রভাবশালী তা নির্ধারণ করার কোনও উপায় আছে?

3
কেন স্পেস স্ট্যাটিস্টিকস কেন-ই মানেগুলির একটি ক্লাস্টারের পরামর্শ দেয়, যদিও এর মধ্যে অবশ্যই দুটি আছে?
আমি আমার ডেটা ক্লাস্টার করতে কে-মানে ব্যবহার করছি এবং একটি "অনুকূল" ক্লাস্টার নম্বর প্রস্তাব করার উপায় খুঁজছিলাম। গ্যাপের পরিসংখ্যান মনে হয় একটি ভাল ক্লাস্টার নম্বর খুঁজতে একটি সাধারণ উপায়। কোনও কারণে এটি সর্বোত্তম ক্লাস্টার নম্বর হিসাবে 1 প্রদান করে, তবে আমি যখন ডেটা দেখি তখন স্পষ্ট হয় যে 2 টি …

1
ক্লাস্টারিং অ্যালগরিদমগুলি যেগুলি স্পার্স ডেটা ম্যাট্রিক্সে বন্ধ হয় [বন্ধ]
বন্ধ থাকে। এই প্রশ্নটি অফ-টপিক । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি ক্রস ভ্যালিডেটের জন্য অন-বিষয় । 5 বছর আগে বন্ধ । আমি ক্লাস্টারিং অ্যালগোরিদমগুলির একটি তালিকা সংকলন করার চেষ্টা করছি: আরে প্রয়োগ করা হয়েছে বিক্ষিপ্ত কাজ ডেটা ম্যাট্রিক্স যেমন …
18 r  clustering  sparse 

4
"মাত্রিকতার অভিশাপ" কি সত্যই ডেটাতে উপস্থিত রয়েছে?
আমি বুঝতে পারি "মাত্রিকতার অভিশাপ" কী, এবং আমি কিছু উচ্চ মাত্রিক অপ্টিমাইজেশান সমস্যাগুলি করেছি এবং তাত্পর্যপূর্ণ সম্ভাবনার চ্যালেঞ্জটি জানি। তবে, আমি সন্দেহ করি যে বেশিরভাগ বাস্তব বিশ্বের ডেটাতে "মাত্রিকতার অভিশাপ" উপস্থিত রয়েছে কিনা (ভালভাবে একটি চিত্রের জন্য ছবি বা ভিডিওগুলি একপাশের জন্য রেখে দেওয়া যাক, আমি গ্রাহক ডেমোগ্রাফিক এবং ক্রয় …

2
ক্লাস্টারিং - ক্লিনবার্গের অসম্পূর্ণতা উপপাদনের পিছনে অন্তর্দৃষ্টি
আমি ক্লিনবার্গের এই আকর্ষণীয় বিশ্লেষণের উপর একটি ব্লগ পোস্ট লেখার বিষয়ে ভাবছিলাম (2002) যা ক্লাস্টারিংয়ের অসুবিধাটি আবিষ্কার করে। ক্লিনবার্গ একটি ক্লাস্টারিং ফাংশনটির জন্য তিনটি আপাতদৃষ্টিতে স্বজ্ঞাত ডেসিডিটারের রূপরেখা তৈরি করেছিলেন এবং তারপরে প্রমাণ করেন যে এই জাতীয় কোনও কার্য নেই। অনেক ক্লাস্টারিং অ্যালগরিদম রয়েছে যা তিনটি মানদণ্ডের মধ্যে দুটিকে সন্তুষ্ট …

9
র‍্যান্ড সূচক গণনা
আমি একটি ক্লাস্টার অ্যালগরিদমের র‌্যান্ড সূচকটি কীভাবে গণনা করব তা নির্ধারণ করার চেষ্টা করছি, তবে আমি কীভাবে সত্য এবং মিথ্যা নেতিবাচক গণনা করতে পারি সেই স্থানে আটকে আছি। এই মুহুর্তে আমি তথ্য পুনরুদ্ধারের একটি পরিচিতি (ম্যানিং, রাঘাভান এবং স্কটিজ, ২০০৯) বইয়ের উদাহরণটি ব্যবহার করছি। 359 পৃষ্ঠায় তারা কীভাবে র‌্যান্ড সূচক …
17 clustering 

1
সুপ্ত ডিরিচলেট বরাদ্দ ব্যবহারের জন্য ইনপুট পরামিতি
টপিক মডেলিং (ল্যাটেন্ট ডিরিচলেট অ্যালোকেশন) ব্যবহার করার সময়, বিষয়গুলির সংখ্যাটি একটি ইনপুট প্যারামিটার যা ব্যবহারকারীর নির্দিষ্ট করতে হবে। আমার কাছে মনে হচ্ছে যে আমাদের প্রার্থী বিষয়ের একটি সংকলনও সরবরাহ করা উচিত যে ডিরিচলেট প্রক্রিয়াটির বিরুদ্ধে নমুনা দেওয়া উচিত? আমার বোধগম্যতা কি সঠিক? অনুশীলনে, এই ধরনের প্রার্থী বিষয় সেট কীভাবে সেটআপ …

8
গুচ্ছ গুণমানের পরিমাপ
আমার কাছে একটি ক্লাস্টারিং অ্যালগরিদম আছে (কে-মানে নয়) ইনপুট প্যারামিটার (ক্লাস্টারের সংখ্যা)। ক্লাস্টারিংয়ের পরে আমি এই ক্লাস্টারিংয়ের মানের কিছু পরিমাণগত পরিমাপ পেতে চাই। ক্লাস্টারিং অ্যালগরিদমের একটি গুরুত্বপূর্ণ সম্পত্তি রয়েছে। জন্য ট = 2 যদি আমি খেতে এন ফলে এই অ্যালগরিদম তাদের মধ্যে কোনো উল্লেখযোগ্য পার্থক্য ছাড়া ডাটা পয়েন্টের আমি ধারণকারী …
17 clustering 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.