ক্লাস্টারিং অ্যালগরিদমের বৈশিষ্ট্যগুলি প্রদর্শনের জন্য 2 ডি কৃত্রিম ডেটা খুঁজছেন


9

আমি 2 টি মাত্রিক ডেটাপয়েন্টের ডেটাসেটগুলি সন্ধান করছি (প্রতিটি ডেটাপয়েন্ট দুটি পৃথক বিতরণ এবং ফর্মগুলি অনুসরণ করে দুটি মান (x, y) এর ভেক্টর)। এই জাতীয় ডেটা তৈরির কোডটিও সহায়ক হবে। কিছু ক্লাস্টারিং অ্যালগরিদম কীভাবে সম্পাদন করে তা আমি প্লট / ভিজ্যুয়ালাইজ করতে তাদের ব্যবহার করতে চাই। এখানে কিছু উদাহরন:



: নির্দিষ্ট ডেটাসেট লাইনের মধ্যে অনুরূপ একটি প্রশ্ন এখানে বন্ধ করে দেয়া হয়েছে stats.stackexchange.com/questions/38928/...
শবযান

এসপিএসের জন্য, আমি একটি ক্লাস্টার-উত্পাদক ম্যাক্রো লিখেছি (আমার পৃষ্ঠাটি দেখুন, "ক্লাস্টারগুলি উত্পন্ন করুন" দেখুন)। এটি অবশ্য রিং বা সর্পিলের মতো ভ্রান্ত আকার তৈরি করে না।
ttnphns

উত্তর:


11

আর প্রচুর ডেটাসেট নিয়ে আসে এবং দেখে মনে হচ্ছে আপনি কোডের কয়েকটি লাইনের সাথে উদ্ধৃত উদাহরণগুলির বেশিরভাগ পুনরুত্পাদন করা বড় কাজ হবেন না। এছাড়াও আপনি খুঁজে পেতে পারেন mlbench দিয়ে শুরু নির্দিষ্ট সিন্থেটিক ডেটাসেট মধ্যে, প্যাকেজ দরকারী mlbench.*। কিছু চিত্র নীচে দেওয়া হল।

এখানে চিত্র বর্ণনা লিখুন

CRAN- এ ক্লাস্টার টাস্ক ভিউটি দেখে আপনি অতিরিক্ত উদাহরণ পাবেন । উদাহরণস্বরূপ, fpc প্যাকেজটিতে "মুখের আকারের" ক্লাস্টারযুক্ত বেঞ্চমার্ক ডেটাসেট ( rFace) এর জন্য একটি অন্তর্নির্মিত জেনারেটর রয়েছে ।

এখানে চিত্র বর্ণনা লিখুন

পাইথনের ক্ষেত্রে অনুরূপ বিবেচনা প্রযোজ্য, যেখানে আপনি বিজ্ঞান-শিখার সাথে ক্লাস্টারিংয়ের জন্য আকর্ষণীয় বেঞ্চমার্ক পরীক্ষা এবং ডেটাসেটগুলি পাবেন ।

ইউসিআই মেশিন লার্নিং রিপোজিটরিতে প্রচুর ডেটাসেটও হোস্ট করা থাকে তবে আপনি নিজের পছন্দের ভাষার সাথে ডেটা নিজেই সিমুলেট করা ভাল।



2

এই খেলনা ক্লাস্টারিং বেঞ্চমার্কটিতে এআরএফএফ ফর্ম্যাটে বিভিন্ন ডেটা সেট রয়েছে (সহজেই সিএসভিতে রূপান্তর করা যেতে পারে), বেশিরভাগ স্থল সত্যের লেবেল সহ। মানদণ্ডে ক্লাস্টারিং অ্যালগোরিদমের প্রাথমিক পছন্দসই বৈশিষ্ট্যগুলি বৈধতা দেওয়া উচিত। বেশিরভাগ ডেটা সেটগুলি ক্লাস্টারিং পেপারগুলি থেকে আসে:

  • বার্চ - জাং, তিয়ান, রঘু রামকৃষ্ণান, এবং মিরন লিভনি। "বার্চ: খুব বড় ডাটাবেসের জন্য একটি দক্ষ ডাটা ক্লাস্টারিং পদ্ধতি method" ACM SIGMOD রেকর্ড। ভোল। 25. নং 2. এসিএম, 1996।
  • নিরাময় - গুহ, সুদীপ্টো, রাজীব রাস্তোগি এবং কিউসোক শিম। "নিরাময়: বড় ডাটাবেসের জন্য একটি দক্ষ ক্লাস্টারিং অ্যালগরিদম।" ACM SIGMOD রেকর্ড। ভোল। 27. নং 2. এসিএম, 1998।
  • বহুরুপী - Karypis, জর্জ, Eui-হংকং হান এবং Vipin কুমার। "গিরগিটি: গতিশীল মডেলিং ব্যবহার করে শ্রেণিবদ্ধ ক্লাস্টারিং।" কম্পিউটার 32.8 (1999): 68-75।
  • ফান্ডামেন্টাল ক্লাস্টারিং সমস্যা স্যুট - আল্টসচ, এ .: এসওএম সহ ক্লাস্টারিং: ইউ * সি, প্রকেটে সেল্ফ-অর্গানাইজিং ম্যাপস, প্যারিস, ফ্রান্স, (2005) এর পৃষ্ঠা কর্মশালা, 75-82
  • মোক - হ্যান্ডল, জুলিয়া এবং জোশুয়া নোলস। "বহুমাত্রিক ক্লাস্টারিংয়ের একটি বিবর্তনীয় পদ্ধতি" " বিবর্তনীয় গণনা, ১১.১ (2007)-তে আইইইই লেনদেন: 56-76।
  • শক্তিশালী পাথ-ভিত্তিক বর্ণালী ক্লাস্টারিং - চ্যাং, হংকং এবং ডিট-ইয়ান ইয়াং। "শক্তিশালী পাথ-ভিত্তিক বর্ণালী ক্লাস্টারিং।" প্যাটার্ন স্বীকৃতি 41.1 (২০০৮): 191-203 3

Karypis ডেটা ক্লুটো ডেটা


1

ELKI কয়েকটি ডেটা সেট নিয়ে আসে (ইউনিট পরীক্ষাগুলিও পরীক্ষা করে দেখুন, সেগুলিতে প্যারামিটার সেটিংসের পাশাপাশি ওয়েব সাইটে থাকা অনেকগুলি রয়েছে)।

এটিতে মোটামুটি নমনীয় ডেটা জেনারেটরও অন্তর্ভুক্ত।


1

এখানে একটি কাস্টমাইজযোগ্য ক্লাস্টার জেনারেটর। এটি কেবলমাত্র ডেটা সেটগুলির একটি নির্দিষ্ট শ্রেণিকে সম্বোধন করে তবে এটি অবশ্যই ক্লাস্টার অ্যালগোরিদম তদন্তের জন্য ব্যবহার করা যেতে পারে।

এটি যে ধরণের ক্লাস্টার তৈরি করতে পারে তার উদাহরণ এখানে রয়েছে:

http://i.stack.imgur.com/vrCG5.png

ক্লাস্টার অধিভুক্তি একটি পাঠ্য ফাইলে সংরক্ষণ করা হয়েছে। কোডটি এমআইটি লাইসেন্সের অধীনে উন্মুক্ত উত্স।


1

এই মতলব স্ক্রিপ্ট ক্লাস্টারিংয়ের জন্য 2D ডেটা উত্পন্ন করে। এটি বেশ কয়েকটি পরামিতি গ্রহণ করে যাতে উত্পন্ন ডেটা ব্যবহারকারীর প্রয়োজনীয়তার মধ্যে থাকে।


0

আমি বিশ্বাস করতে পারি না যে ফিশারের আইরিস ডেটা কেউ উল্লেখ করেনি।

আমি মনে করি না যে আমি একটি ক্লাস্টারিং প্রযুক্তি দেখেছি যা আইরিস ডেটা উদাহরণ হিসাবে ব্যবহার করে না

R এ, ডেটা অ্যাক্সেস করতে কেবল "আইরিস" টাইপ করুন।

এখানে একটি সুন্দর (এবং আদর্শ) আইরিস চক্রান্তের উদাহরণ: http://ygc.name/2011/12/24/ML-class-7-kmeans-clustering/

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.