ভারযুক্ত সামাজিক নেটওয়ার্ক / গ্রাফে সম্প্রদায় সনাক্তকরণ কীভাবে করবেন?


42

আমি ভাবছি যে কেউ যদি ওয়েট , অনিরীক্ষিত প্রান্তগুলি সহ কোনও গ্রাফের সম্প্রদায় সনাক্তকরণ / গ্রাফ বিভাজন / ক্লাস্টারিংয়ের সম্পাদন করার ক্ষেত্রে ভাল প্রারম্ভিক পয়েন্টগুলি কী বলতে পারে । প্রশ্নের গ্রাফটিতে প্রায় 3 মিলিয়ন প্রান্ত রয়েছে এবং প্রতিটি প্রান্তটি এটি দুটি সংযোগের সাথে সংযোগ স্থাপনের মধ্যে মিলের ডিগ্রি প্রকাশ করে। বিশেষত, এই ডেটাসেট প্রান্তগুলিতে ব্যক্তি এবং শিখরগুলি তাদের পর্যবেক্ষণের আচরণের মিলের একটি পরিমাপ।

অতীতে আমি একটি পরামর্শ অনুসরণ করেছি আমি এখানে stats.stackexchange.com এ পেয়েছি এবং নিউম্যানের মডুলারিটি ক্লাস্টারিংয়ের জন্য ইগ্রাফের প্রয়োগ ব্যবহার করেছি এবং ফলাফলগুলি নিয়ে সন্তুষ্ট ছিলাম, তবে এটি ছিল একটি অপ্রকাশিত ডেটাসেটে।

আমার কোন সুনির্দিষ্ট অ্যালগরিদমগুলি দেখা উচিত?

উত্তর:


20

নিউম্যানের মডুলারিটি ক্লাস্টারিং (ফাস্টগ্রাফি ফাংশন) এর আইগ্রাফ প্রয়োগকরণ ওজনযুক্ত প্রান্তগুলির পাশাপাশি ব্যবহার করা যেতে পারে। প্রান্তগুলিতে কেবল ওজনের বৈশিষ্ট্য যুক্ত করুন এবং যথারীতি বিশ্লেষণ করুন। আমার অভিজ্ঞতায় কম বন্ধন হওয়ায় এটি ওজন নিয়ে আরও দ্রুত চলে।


এটি আমাকে দেখানোর জন্য অনেক ধন্যবাদ, আমি ডকুমেন্টেশনে ওজনের রেফারেন্সটি পুরোপুরি মিস করেছি।
ল্যারামিচেলস

9

আমি জানি যে Gephi undirected ভরযুক্ত গ্রাফ প্রক্রিয়া করতে পারি, কিন্তু আমি মনে রাখা এটা সংরক্ষণ করা করেছে বলে মনে হচ্ছে GDF , যা প্রশংসনীয় করা CSV অথবা Ucinet পাসে হবে ডিএল । সচেতন থাকুন যে এটি এখনও একটি আলফা রিলিজ। এখন, আপনার গ্রাফটি ক্লাস্টারিংয়ের বিষয়ে, গিফির কাছে ক্লাস্টারিং পাইপলাইনগুলির অভাব রয়েছে বলে মনে হচ্ছে, এখনকার সর্বশেষতম সংস্করণে পাওয়া এমসিএল অ্যালগরিদম ব্যতীত। ২০০৯ সালে একটি গুগল কোড প্রকল্প ছিল, জিফি নেটওয়ার্ক স্ট্যাটিস্টিকস (উদাহরণস্বরূপ নিউম্যানের মডুলারিটি মেট্রিক বৈশিষ্ট্যযুক্ত), তবে আমি জানি না যে এই দিক থেকে কিছু প্রকাশিত হয়েছে কিনা। যাইহোক, এটি একরকম মডুলারিটি / ক্লাস্টারিং কম্পিউটেশনগুলিকে মঞ্জুরি দেয় বলে মনে হয়, তবে আর এবং গেফির ব্যবহার করে সোশ্যাল নেটওয়ার্ক বিশ্লেষণ এবং দেখুনআর এবং গেফিকে ব্যবহার করে সোশ্যাল নেটওয়ার্ক বিশ্লেষণের জন্য ডেটা প্রস্তুতি (@ টালকে অনেক ধন্যবাদ)।

যদি আপনি পাইথন ব্যবহার করেন, তবে এটি নেটওয়ার্কএক্স চেষ্টা করার পক্ষে মূল্যবান (এখানে সম্পর্কিত কোড সহ ভারযুক্ত গ্রাফের উদাহরণ )। তারপরে আপনার বিশ্লেষণ চালিয়ে যাওয়ার অনেক উপায় রয়েছে ways

আপনার জটিলতা নেটওয়ার্ক এবং জটিলতা সম্পর্কে আইএনএসএনএ - সোশ্যাল নেটওয়ার্ক অ্যানালাইসিস সফটওয়্যার বা টিম ইভান্সের ওয়েবপেজটিও দেখতে হবে ।


হ্যালো, কেবল আপনাকে জানাতে যে গিফী ভার্চুয়ালতা অনুসারে অপরিবর্তিত গ্রাফ পরিচালনা করতে পারে না সাময়িকতার মাধ্যমে সম্প্রদায় সনাক্ত করতে। ধন্যবাদ। -গৌতম

@ গৌতম জেনে রাখা ভাল, ধন্যবাদ আমি গেফির সাথে আসলেই পরিচিত নই, তবে আমি ভেবেছিলাম এটি সক্রিয় বিকাশে রয়েছে।
chl

7

গিফি লুভাইন মডুলারিটি পদ্ধতি প্রয়োগ করে: http://wiki.gephi.org/index.php/ আধুনিকতা

চিয়ার্স


@ আর আপনি কি জানেন যে কোনও বাস্তবায়ন জানেন?
জন কলবি

4

লুইভেন মডুলারিটি অ্যালগরিদম সি ++ তে উপলব্ধ: https://sites.google.com/site/findcommunities/

এটি কয়েক মিলিয়ন নোড এবং প্রান্তের ওজনযুক্ত নেটওয়ার্কগুলির সাথে সম্পর্কিত এবং নিউম্যান অ্যালগরিদমের চেয়ে অনেক দ্রুত গতিতে প্রদর্শিত হয়েছে।


লুভাইন মডুলারিটি অ্যালগরিদম দ্রুত এবং অবিচল , আমি ভাবছি যদি এর কোনও মানচিত্র হ্রাস করা যায় তবে।
পৃষ্ঠা

3

যদি আপনি পাইথন ব্যবহার করেন এবং নেটওয়ার্কএক্স ব্যবহার করে একটি ভারী গ্রাফ তৈরি করেছেন , তবে আপনি ক্লাস্টারিংয়ের জন্য পাইথন- লাউভাইন ব্যবহার করতে পারেন । যেখানে জি একটি ওজনযুক্ত গ্রাফ:

import community 
partition = community.best_partition(G, weight='weight')

1

আমি কেবল আর এর জন্য tnet প্যাকেজ জুড়ে এসেছি The

http://opsahl.co.uk/tnet/content/view/15/27/

আমি এখনও এটি ব্যবহার করে না।


1

এসএলপিএ (বর্তমানে GANXiS বলা হয়) একটি দ্রুত অ্যালগরিদম যা সামাজিক নেটওয়ার্কগুলিতে (অপরিবর্তিত / নির্দেশিত এবং অদ্বিতীয় / ভারিত) উভয় সম্প্রদায়কে সনাক্ত করতে সক্ষম। এটি প্রদর্শিত হয় যে অ্যালগরিদম বাস্তব-বিশ্বের সামাজিক এবং জিন নেটওয়ার্কগুলিতে অর্থবহ ফলাফল দেয়। এটি একটি অত্যাধুনিক শিল্প। এটি পাওয়া যায়

https://sites.google.com/site/communitydetectionslpa/

আরও তথ্যের জন্য একটি দুর্দান্ত পর্যালোচনা দেখুন arxiv.org/abs/1110.5813


1

আমি নন-ওভারল্যাপিং, ওয়েট / ওয়েইট / নেটওয়ার্কের জন্য একটি জাভা বাস্তবায়ন করেছি যা সম্ভবত 3 মিলিয়ন নোডগুলি পরিচালনা করতে পারে (আমি এটি মিলিয়ন নোড ডেটাসেটের জন্য পরীক্ষা করেছি)। যাইহোক, এটি কে-মানেগুলির মতো কাজ করে এবং একটি ইনপুট হিসাবে সনাক্ত করার জন্য পার্টিশনের সংখ্যা প্রয়োজন (কেমিয়ানে k)। আপনি আরও তথ্য পেতে পারেন এখানে , এবং এখানে কোড , GitHub মধ্যে

চিয়ার্স,

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.