মেশিন লার্নিং শ্রেণিবদ্ধকরণ / রিগ্রেশন কার্যের জন্য বেশ কয়েকটি ক্লাসিক ডেটাসেট রয়েছে। সর্বাধিক জনপ্রিয়:
- আইরিস ফ্লাওয়ার ডেটা সেট ;
- টাইটানিক ডেটা সেট ;
- মোটর ট্রেন্ড গাড়ি ;
- প্রভৃতি
কিন্তু কেউ কি নেটওয়ার্ক বিশ্লেষণ / গ্রাফ তত্ত্বের জন্য একই রকম ডেটাসেটগুলি জানেন? আরও কংক্রিট - আমি তুলনা / মূল্যায়ন / শেখার জন্য স্বর্ণের মানক ডেটাসেটগুলি সন্ধান করছি:
- কেন্দ্রিকতা ব্যবস্থা;
- নেটওয়ার্ক ক্লাস্টারিং অ্যালগোরিদম।
আমার সর্বজনীনভাবে উপলব্ধ নেটওয়ার্ক / গ্রাফগুলির একটি বিশাল তালিকা প্রয়োজন নেই, তবে বেশ কয়েকটি অবশ্যই ডেটাসেটগুলি জানতে হবে।
সম্পাদনা করুন:
"সোনার স্ট্যান্ডার্ড ডেটাসেট" এর সঠিক বৈশিষ্ট্য সরবরাহ করা বেশ কঠিন, তবে এখানে কিছু চিন্তাভাবনা রয়েছে। আমি মনে করি, বাস্তব ক্লাসিক ডেটাসেটের এই মানদণ্ডগুলি পূরণ করা উচিত:
- নিবন্ধ এবং পাঠ্যপুস্তকে একাধিক উল্লেখ;
- সুপরিচিত নেটওয়ার্ক বিশ্লেষণ সফ্টওয়্যার প্যাকেজগুলিতে অন্তর্ভুক্তি;
- অস্তিত্বের পর্যাপ্ত সময়;
- গ্রাফ বিশ্লেষণের উপর বেশ কয়েকটি কোর্সে ব্যবহার।
আমার আগ্রহের ক্ষেত্রটি সম্পর্কিত, আমারও শীর্ষবিন্দু এবং / বা প্রাক্পম্পিউটেড (বা পূর্বনির্ধারিত) "কর্তৃপক্ষের স্কোর" (অর্থাত্ কেন্দ্রীয়তা অনুমান) জন্য লেবেলযুক্ত ক্লাসগুলির প্রয়োজন। এই প্রশ্নটি জিজ্ঞাসা করার পরে আমি অনুসন্ধান চালিয়েছি, এবং এখানে কয়েকটি উপযুক্ত উদাহরণ রয়েছে:
- জাচারির কারাতে ক্লাব : ১৯ 1977 সালে প্রবর্তিত, 1.5k বারেরও বেশি বার উদ্ধৃত হয়েছিল (গুগল স্কলারের মতে), ভার্টেক্সগুলি ফেকশন (যার ফলে গুচ্ছের জন্য ব্যবহার করা যেতে পারে) এর বৈশিষ্ট্য রয়েছে।
- এরদোস সহযোগিতা নেটওয়ার্ক : দুর্ভাগ্যক্রমে, আমি এই নেটওয়ার্কটি ডেটা-ফাইল আকারে খুঁজে পাইনি, তবে এটি বরং বিখ্যাত, এবং যদি কেউ গণিতবিদদের বিশেষজ্ঞের ডেটা দিয়ে নেটওয়ার্ক সমৃদ্ধ করে, এটি ক্লাস্টারিং অ্যালগরিদমগুলি পরীক্ষা করার জন্যও ব্যবহার করা যেতে পারে।