ফলাফলের দুটি সেটগুলির মধ্যে ম্যাপিংটি গণনা করা সহজ, কারণ আপনি পরীক্ষায় প্রাপ্ত তথ্যটি তিন-টিউপলসের একটি সেট হিসাবে উপস্থাপন করা যেতে পারে: প্রথম উপাদানটি একটি (বহুমাত্রিক) বিন্দু, দ্বিতীয়টি একটি (স্বেচ্ছাসেবী) গুচ্ছ লেবেল আপনার অ্যালগরিদম দ্বারা সরবরাহ করা, এবং তৃতীয়টি একটি (স্বেচ্ছাসেবী) ক্লাস্টার লেবেল একটি রেফারেন্স অ্যালগরিদম দ্বারা সরবরাহ করা। দ্বারা নির্মাণ করুনটটলেবেল জোড়াগুলির জন্য শ্রেণিবদ্ধকরণ সারণী: ফলাফলগুলি যদি একমত হয় তবে এটি একটি ক্রম ছাড় ম্যাট্রিক্সের একাধিক হবে। অর্থাৎ, প্রতিটি সারি এবং প্রতিটি কলামে অবশ্যই একটি ননজারো সেল থাকতে হবে। এটি প্রোগ্রামে একটি সহজ চেক। এই আদর্শ থেকে পৃথক ডেটা পয়েন্টগুলিতে ছোট ছোট বিচ্যুতিগুলি ট্র্যাক করাও সোজা so যাতে আপনি উত্তর দিতে পারেন যে উত্তর দুটি আলাদা হলেও কী আলাদা হয়। আমি চুক্তির পরিসংখ্যানগত ব্যবস্থাগুলি গণনা করতে বিরক্ত করব না: হয় নিখুঁত চুক্তি (অনুমান অবধি) হয় বা হয় না, এবং পরবর্তী ক্ষেত্রে এগুলি কীভাবে ঘটে তা বোঝার জন্য আপনাকে মতবিরোধের সমস্ত বিষয় সন্ধান করতে হবে। ফলাফল হয় হয় সম্মত হয় বা তারা না; মতবিরোধের যে কোনও পরিমাণের জন্য, এমনকি কেবলমাত্র এক পর্যায়ে, যাচাই করা দরকার।
আপনি পরীক্ষার জন্য বিভিন্ন ধরণের ডেটাसेट ব্যবহার করতে চাইতে পারেন: (1) প্রকাশিত কে-মানে ফলাফল সহ ডেটাসেটগুলি প্রকাশিত; (২) সুস্পষ্ট শক্তিশালী ক্লাস্টার সহ সিন্থেটিক ডেটাসেট; (3) কোন সুস্পষ্ট ক্লাস্টারিং সহ সিন্থেটিক ডেটাসেট। (1) আপনি যখনই কোনও গণিত বা পরিসংখ্যান প্রোগ্রাম লিখেন তা ব্যবহার করার জন্য একটি ভাল শৃঙ্খলা । (২) বিভিন্ন উপায়ে করা সহজ, যেমন ক্লাস্টারগুলির কেন্দ্র হিসাবে পরিবেশন করার জন্য কিছু এলোমেলো পয়েন্ট তৈরি করে এবং তারপরে এলোমেলোভাবে ক্লাস্টার কেন্দ্রগুলি অপেক্ষাকৃত কম পরিমাণে স্থানান্তরিত করে পয়েন্ট মেঘ উত্পন্ন করে। (3) কিছু এলোমেলো চেক সরবরাহ করে যা সম্ভাব্যভাবে অপ্রত্যাশিত আচরণগুলি উদঘাটন করে; আবার, এটি একটি ভাল সাধারণ পরীক্ষার শৃঙ্খলা।
তদতিরিক্ত, চূড়ান্ত সমাধানগুলির মধ্যে সীমানায় শুয়েই অ্যালগোরিদমকে চাপ দেয় এমন ডেটাসেটগুলি তৈরি করার বিষয়টি বিবেচনা করুন। এর জন্য সৃজনশীলতা এবং আপনার অ্যালগরিদমের গভীর বোঝার প্রয়োজন হবে (যা সম্ভবত আপনার কাছে রয়েছে!)। যে কোনও ইভেন্টে আমি যাচাই করতে চাই একটি উদাহরণ হ'ল form ফর্মের ভেক্টরগুলির সেটগুলি হবে যেখানে zero কোনও শূন্য উপাদান নয় এমন একটি ভেক্টর এবং ক্রমিক সংহত মান । আমি ভেক্টরগুলির সেটগুলিতে অ্যালগরিদমও পরীক্ষা করতে চাই যা সমবাহিক বহুভুজ গঠন করে। পারেন পরিস্থিতিতে, ক্ষেত্রে যেখানে হয় না এর গুণিতক বিশেষ করে আকর্ষণীয়, যেখানে সহi vবনামআমি0 , 1 , 2 , … , এন - 1এনটএনহয় কম বেশী । এই পরিস্থিতিতে সাধারণ বিষয়টি হ'ল (ক) তারা সমস্যার সমস্ত মাত্রা ব্যবহার করে, তবুও (খ) সঠিক সমাধানগুলি জ্যামিতিকভাবে সুস্পষ্ট এবং (গ) একাধিক সঠিক সমাধান রয়েছে।k
(ফরম র্যান্ডম সমবাহু বহুভুজ মধ্যে দুই অশূন্য ভেক্টর দিয়ে শুরু দ্বারা মাত্রা এবং এলোমেলোভাবে চয়ন করা হয়েছে। (একটি ভালো উপায় তাদের দেওয়া হয় উপাদান স্বাধীন আদর্শ স্বাভাবিক variates হতে।) Rescale তাদের ইউনিটের দৈর্ঘ্য হবে; আসুন এইগুলিকে এবং call কল করুন formula উপাদানটি সূত্রের মাধ্যমে from থেকে সরানd≥2uv2dxzxz
w=z−(z⋅x)x.
প্রাপ্ত করুন rescaling দ্বারা ইউনিট দৈর্ঘ্য আছে। যদি আপনি চান, অভিন্নভাবে এবং both উভয় এলোমেলোভাবে পুনরুদ্ধার করুন । ভেক্টরগুলি এবং মাত্রার মধ্যে একটি এলোমেলো 2D সাবসপেসের জন্য একটি orthogonal ভিত্তি গঠন করে । একটি সমবাহু বহুভুজ ছেদচিহ্ন এর সেট হিসাবে প্রাপ্ত হয় পূর্ণসংখ্যা হিসাবে থেকে রেঞ্জ মাধ্যমে ।)w x y x y d n cos ( 2 π k / n ) x + sin ( 2 π k / n ) y k 0 n - 1ywxyxydncos(2πk/n)x+sin(2πk/n)yk0n−1