নেটওয়ার্ক বিশ্লেষণ ক্লাসিক ডেটাসেট


10

মেশিন লার্নিং শ্রেণিবদ্ধকরণ / রিগ্রেশন কার্যের জন্য বেশ কয়েকটি ক্লাসিক ডেটাসেট রয়েছে। সর্বাধিক জনপ্রিয়:

কিন্তু কেউ কি নেটওয়ার্ক বিশ্লেষণ / গ্রাফ তত্ত্বের জন্য একই রকম ডেটাসেটগুলি জানেন? আরও কংক্রিট - আমি তুলনা / মূল্যায়ন / শেখার জন্য স্বর্ণের মানক ডেটাসেটগুলি সন্ধান করছি:

  1. কেন্দ্রিকতা ব্যবস্থা;
  2. নেটওয়ার্ক ক্লাস্টারিং অ্যালগোরিদম।

আমার সর্বজনীনভাবে উপলব্ধ নেটওয়ার্ক / গ্রাফগুলির একটি বিশাল তালিকা প্রয়োজন নেই, তবে বেশ কয়েকটি অবশ্যই ডেটাসেটগুলি জানতে হবে।

সম্পাদনা করুন:

"সোনার স্ট্যান্ডার্ড ডেটাসেট" এর সঠিক বৈশিষ্ট্য সরবরাহ করা বেশ কঠিন, তবে এখানে কিছু চিন্তাভাবনা রয়েছে। আমি মনে করি, বাস্তব ক্লাসিক ডেটাসেটের এই মানদণ্ডগুলি পূরণ করা উচিত:

  • নিবন্ধ এবং পাঠ্যপুস্তকে একাধিক উল্লেখ;
  • সুপরিচিত নেটওয়ার্ক বিশ্লেষণ সফ্টওয়্যার প্যাকেজগুলিতে অন্তর্ভুক্তি;
  • অস্তিত্বের পর্যাপ্ত সময়;
  • গ্রাফ বিশ্লেষণের উপর বেশ কয়েকটি কোর্সে ব্যবহার।

আমার আগ্রহের ক্ষেত্রটি সম্পর্কিত, আমারও শীর্ষবিন্দু এবং / বা প্রাক্পম্পিউটেড (বা পূর্বনির্ধারিত) "কর্তৃপক্ষের স্কোর" (অর্থাত্ কেন্দ্রীয়তা অনুমান) জন্য লেবেলযুক্ত ক্লাসগুলির প্রয়োজন। এই প্রশ্নটি জিজ্ঞাসা করার পরে আমি অনুসন্ধান চালিয়েছি, এবং এখানে কয়েকটি উপযুক্ত উদাহরণ রয়েছে:

  • জাচারির কারাতে ক্লাব : ১৯ 1977 সালে প্রবর্তিত, 1.5k বারেরও বেশি বার উদ্ধৃত হয়েছিল (গুগল স্কলারের মতে), ভার্টেক্সগুলি ফেকশন (যার ফলে গুচ্ছের জন্য ব্যবহার করা যেতে পারে) এর বৈশিষ্ট্য রয়েছে।
  • এরদোস সহযোগিতা নেটওয়ার্ক : দুর্ভাগ্যক্রমে, আমি এই নেটওয়ার্কটি ডেটা-ফাইল আকারে খুঁজে পাইনি, তবে এটি বরং বিখ্যাত, এবং যদি কেউ গণিতবিদদের বিশেষজ্ঞের ডেটা দিয়ে নেটওয়ার্ক সমৃদ্ধ করে, এটি ক্লাস্টারিং অ্যালগরিদমগুলি পরীক্ষা করার জন্যও ব্যবহার করা যেতে পারে।

1
আমি মনে করি আপনি আরও সুনির্দিষ্ট ফ্যাশনে "সোনার স্ট্যান্ডার্ড ডেটাসেট" সংজ্ঞায়িত করে এই প্রশ্নের উন্নতি করতে পারেন। এটি "অবশ্যই জানতে হবে" কী করে? এটি বেশ কয়েকটি পাঠ্যপুস্তকে উল্লেখ করা উচিত? বেশ কয়েকটি প্রকাশিত মডেল ব্যবহার করা হয়? ইত্যাদি। অন্যথায় উত্তরগুলি বিষয়ভিত্তিক হবে এবং সময় পার হওয়ার সাথে সাথে এগুলি পরিবর্তন হবে। এখানে একটি খারাপ সমন্বয়।
এয়ার

উত্তর:


5

আপনি যা খুঁজছেন তা কানেক্টে পাওয়া যাবে (ওয়েবসাইটটি লিখে যাওয়ায় আমি এটি লিখছি তবে এটি শীঘ্রই ঠিক করা উচিত!)। এটি নেটওয়ার্ক বিশ্লেষণের জন্য প্রায় সর্বাধিক বিস্তৃত ডেটা সংগ্রহ। তবে প্রশ্নটি হ'ল কোনটি ব্যবহারের জন্য আরও বেশি স্ট্যান্ডার্ড ?

ঠিক আছে, জাচারির কারাতে ক্লাব ব্যতীত আর কোন সুস্পষ্ট উত্তর নেই!

আপনি যদি সম্প্রদায় সনাক্তকরণ অ্যালগরিদমে সাহিত্য পর্যালোচনা করেন তবে আপনি দেখতে পাবেন যে প্রায় সমস্ত আলোকিত কাগজগুলি বিভিন্ন নেটওয়ার্ক ব্যবহার করে। আমার পরামর্শ অ্যান্ড্রিয়া ল্যানসিচিনেটি এবং সান্তো ফরচুনাটো গ্রাফিকের জন্য মাপদণ্ডের জন্য যা করেছিল তা অতিক্রম করছে। তারা কিছু বেঞ্চমার্ক গ্রাফ জেনারেশন অ্যালগরিদমগুলি প্রস্তাব করেছিল যেমন এটি একটি

আশা করি এটা সাহায্য করবে :)


আপনি wayback মেশিন এর মাধ্যমে সনাক্ত করতে পারেন, তার আপনার সেরা বন্ধু web.archive.org/web/20150402165739/http://konect.uni-koblenz.de/...
আলবার্ট


1

কেবলমাত্র আমি কেবল গ্রাফ ডেটাবেসগুলির জন্য বেনমার্ক ডেটা, যেমন নিও 4 জে সম্পর্কে জানতে পারি।

আপনি এটির মতো লিঙ্কগুলি পেতে পারেন: http://istc-bigdata.org/index.php/benchmarking-راف- ডেটাবেসস /

যেখানে আপনি নেটওয়ার্ক বিশ্লেষণ এবং গ্রাফ তত্ত্ব পরীক্ষা করতে ডেটা পেতে পারেন।

তদতিরিক্ত, আপনি নিজের ডেটা সংগ্রহ করতে টুইটার / ফেসবুকের এপিআই দিয়ে খেলতে পারেন। আপনি যে ডেটা সন্ধান করছেন তা খুঁজে না পেলে এটিও একটি পরামর্শ।


ধন্যবাদ, তবে আমি ঠিক যা খুঁজছি তা নয়। আরও বিশদের জন্য আপডেট দেখুন।
sobach
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.