যখন বাস্তব-জগতের নেটওয়ার্ক / গ্রাফের সমস্ত প্রান্ত পরিসংখ্যানগতভাবে সংঘটিত হওয়ার সম্ভাবনা থাকে তখন এর অর্থ কী?


11

আমি এই কাগজে বর্ণিত ব্যাকবোন নেটওয়ার্ক নিষ্কাশন পদ্ধতিটি ব্যবহার করেছি: http://www.pnas.org/content/106/16/6483.abstract

মূলত, লেখকরা পরিসংখ্যান ভিত্তিতে এমন একটি পদ্ধতি প্রস্তাব করেন যা গ্রাফের প্রতিটি প্রান্তের জন্য সম্ভাবনা তৈরি করে, প্রান্তটি কেবল সুযোগে ঘটতে পারে। আমি 0.05 এর আদর্শ পরিসংখ্যানগত তাত্পর্য কাট অফ ব্যবহার করি।

আমি বেশ কয়েকটি রিয়েল-ওয়ার্ল্ড নেটওয়ার্কগুলিতে এই পদ্ধতিটি প্রয়োগ করে চলেছি এবং আকর্ষণীয়ভাবে কিছু নেটওয়ার্কের কোনও প্রান্তই উল্লেখযোগ্য নয়। নেটওয়ার্কের জন্য এটি কী কী তা বোঝার চেষ্টা করছি। কেবলমাত্র আমি যখন পদ্ধতিটি কোনও নেটওয়ার্কটিতে প্রয়োগ করেছি এবং এর কোন প্রান্ত ছিল না ততটা তাৎপর্যপূর্ণভাবে উপস্থিত হয়েছিল যখন আমি এই পদ্ধতিটি আমার তৈরি র্যান্ডম নেটওয়ার্কগুলিতে প্রয়োগ করেছিলাম, যা আমরা প্রত্যাশা করতাম।

রিয়েল ওয়ার্ল্ড নেটওয়ার্কের উদাহরণ হিসাবে আপনি সাম্প্রতিক নেটওয়ার্ক ভিজ্যুয়ালাইজেশনটি দেখেছেন যা গত 25 বছরে মার্কিন সিনেটের মেরুকরণ দেখিয়ে দি ইকোনমিস্টে গিয়েছিল: http://www.economist.com/news/united-states/21591190 অউনিটড-স্টেটস-অ্যামিবা । আমি সেই নেটওয়ার্কগুলিতে ব্যাকবোন নেটওয়ার্ক নিষ্কাশন পদ্ধতি প্রয়োগ করেছি এবং কোনও প্রান্ত উল্লেখযোগ্য হিসাবে আসে নি। যদিও কাঁচা প্রান্তগুলি স্পষ্টতই পছন্দসই সংযুক্তি এবং গুচ্ছ দেখায়, এটি কি কেবলমাত্র সুযোগের দ্বারা? সিনেটের ভোটদানের নেটওয়ার্কগুলি কি এলোমেলোভাবে এলোমেলো?

উত্তর:


6

পিঠ হাড় পদ্ধতি পিছনে নাল অনুমান

[সাধারণ] ডিগ্রি কে এর একটি নির্দিষ্ট নোডের সংযোগের সাথে সামঞ্জস্যযুক্ত স্বাভাবিক ওজন একটি অভিন্ন বিতরণ থেকে এলোমেলোভাবে নির্ধারিত দ্বারা উত্পাদিত হয়।

যদি কোনও "উল্লেখযোগ্য" প্রান্তগুলি না থাকে, তবে নাল অনুমানটি পুরো গ্রাফের জন্য ধরে রাখে, যেমন প্রান্তগুলি প্রেরণ করে এবং সম্পর্কগুলি প্রাপ্ত করার জন্য নোডাল প্রবণতাগুলির ফলে প্রান্তের ওজন হয়।

আপনি যে সম্পর্কগুলি বিশ্লেষণ করছেন তার উপর নির্ভর করে, ব্যাকবোন পদ্ধতিটি উপযুক্ত নাও হতে পারে। পদ্ধতিটি এমন নেটওয়ার্কগুলির পক্ষে সর্বোত্তম কাজ করে যা ধারণামূলকভাবে এক-মোড ওজনযুক্ত নেটওয়ার্ক। দ্বি-মোড নেটওয়ার্কগুলিকে ওজনযুক্ত ওয়ান-মোড নেটওয়ার্ক হিসাবে প্রজেক্ট করা যেতে পারে, তবে এটি প্রায়শই বোঝায় না।

অর্থনীতিবিদ আপনার উদাহরণ অঙ্কন করে, ভাগ করা ভোটের সংখ্যার দ্বারা ভারিত এক-মোড নেটওয়ার্ক হিসাবে সিনেটের ভোটদান বিশ্লেষণ করার কোনও মানে হয় না। সিনেটে ভোটদান একটি স্বাক্ষরিত, দ্বি-মোড সম্পর্ক। সিনেটর (i) একটি বিধিবিধানের (জ) এর একটি অংশের সাথে সম্পর্ক রয়েছে এবং তারা হয় (0) ভোট দেওয়া থেকে বিরত থাকে অথবা তারা (+1) অথবা আইনটির (-1) বিপরীতে ভোট দেয়। নেটওয়ার্কটিকে একটি ওজনযুক্ত ওড-মোড চুক্তি নেটওয়ার্কে রূপান্তর করতে, তারপরে একটি ব্যাক হোন বিশ্লেষণ করা ডেটা মারাত্মক হ্রাস হতে পারে। আইন সংক্রান্ত কিছু অংশ রাজনৈতিকভাবে বিভাজনযুক্ত এবং কিছু অন্যের চেয়ে বেশি ভোট রয়েছে - মেরুদণ্ডের পদ্ধতিগুলি এই প্রক্রিয়াগুলি গ্রহণ করবে না।

আপনি ব্যাকবোন পদ্ধতির পরিবর্তে শর্তসাপেক্ষ ইউনিফর্ম গ্রাফ (সিইউজি) পরীক্ষা বিবেচনা করতে চাইতে পারেন। এই পরীক্ষাগুলির পিছনে ধারণাটি নির্দিষ্ট গ্রাফ-স্তরের বৈশিষ্ট্যগুলি (যেমন, ক্লাস্টারিং, গড় পাথের দৈর্ঘ্য, কেন্দ্রীয়করণ, সমকামীভাবে) সুযোগ থেকে প্রাপ্ত কিনা তা নির্ধারণ করা। প্রক্রিয়াটি নিম্নরূপ:

  1. পরিলক্ষিত গ্রাফ থেকে পরিমাপ নিন
  2. একটি এলোমেলো গ্রাফ তৈরি করুন যা পর্যবেক্ষিত গ্রাফের নির্দিষ্ট বৈশিষ্ট্যগুলির জন্য নিয়ন্ত্রণ করে (উদাঃ আকার, প্রান্তের সংখ্যা, ডিগ্রি বিতরণ ইত্যাদি)
  3. এলোমেলো গ্রাফ থেকে পরিমাপ নিন
  4. নাল ডিস্ট্রিবিউশন উত্পাদন করতে 2 এবং 3 বার বহুবার (যেমন, 1000) পুনরাবৃত্তি করুন
  5. নাল বন্টন সঙ্গে পর্যবেক্ষণ পরিমাপ তুলনা করুন

দ্বি-মোড নেটওয়ার্কগুলির জন্য, পর্যবেক্ষণ করা গ্রাফকে অনুমতি দিয়ে এলোমেলো গ্রাফ তৈরি করা বুদ্ধিমান হতে পারে (আর-তে tnet এবং স্ট্যাটনেট উভয়ই দ্বি-মোড নেটওয়ার্ককে অনুমতি দেওয়ার জন্য রুটিন রয়েছে)। যদি পরিমাপ f এর একটি এক-মোড নেটওয়ার্কের প্রয়োজন হয়, তবে এক-মোড নেটওয়ার্ক হিসাবে প্রজেক্ট করার আগে এলোমেলোকরণ প্রক্রিয়াটি দুটি-মোড নেটওয়ার্কে করা উচিত।


4

আপনি যে নিবন্ধটি উদ্ধৃত করেছেন তাতে লেখকগণ বিবেচনা করেছেন যে একটি জটিল নেটওয়ার্কে, "[[] নোডগুলি [মডেলড] সিস্টেমের উপাদানগুলি উপস্থাপন করে এবং ভারিত প্রান্তগুলি একটি মিথস্ক্রিয়া এবং এর তুলনামূলক শক্তি উপস্থিতি চিহ্নিত করে " (আমার জোর দিয়ে) ।

আপনি যে নেটওয়ার্কটিতে অধ্যয়ন করছেন, আমি যদি অর্থনীতিবিদ নিবন্ধটি সঠিকভাবে বুঝতে পারি তবে ২ জন সিনেটর কমপক্ষে 100 বার একইভাবে ভোট দিলে তাদের মধ্যে একটি যোগসূত্র রয়েছে। সুতরাং, লিঙ্কগুলি মিথস্ক্রিয়াকে মডেল করে না, তবে সাদৃশ্যগুলি (সিনেটরদের ভোটদানের আচরণের মধ্যে)। আমার অভিজ্ঞতা থেকে, সাদৃশ্য নেটওয়ার্কগুলি ইন্টারঅ্যাকশন নেটওয়ার্কগুলির চেয়ে একই ডিগ্রি বিতরণ প্রদর্শন করে না, অর্থে এটি যতটা ভিন্ন ভিন্ন নয়। এছাড়াও, নেটওয়ার্কটি বের করার সময় ব্যবহৃত থ্রোসোল্ড প্যারামিটার (এখানে: 100) কখনও কখনও ডিগ্রি বিতরণে শক্তিশালী প্রভাব ফেলে।

তদুপরি, আমি অর্থনীতিবিদ নিবন্ধে কোনও ওজনের উল্লেখ খুঁজে পাইনি। তবুও, ওজন উপস্থিতি অ্যাঞ্জেলস সেরানানো এট আল- র কাজ বর্ণিত পদ্ধতিতে একটি গুরুত্বপূর্ণ পয়েন্ট বলে মনে হয় । আপনি আপনার প্রশ্নে উদ্ধৃত।

এই দুটি পর্যবেক্ষণ থেকে মনে হয় যে পদ্ধতিটি এই ডেটাগুলিতে সঠিকভাবে সম্পাদন করে না কারণ এটি এই ধরণের নেটওয়ার্কগুলি প্রক্রিয়া করার জন্য ডিজাইন করা হয়নি। হতে পারে আপনি ডিগ্রি বিতরণ পরীক্ষা করতে পারেন: এটি কোনও বৈশিষ্ট্যযুক্ত মানকে কেন্দ্র করে, না ভিন্ন ভিন্ন? এবং ওজন সম্পর্কে কি আছে, কোন আছে?


আমি উত্স ওয়েব সাইট থেকে ডেটা নিজেই পুনরুত্পাদন করেছি, তাই আমি ওজন অন্তর্ভুক্ত করেছি এবং নির্বিচারে কাট অফের থ্রেশহোল্ড প্রয়োগ করি নি। সুতরাং আমি মনে করি যে আমি ডেটা মেরুদণ্ড পদ্ধতি প্রয়োগ করেছি সেগুলি এই সমস্যাগুলি দ্বারা প্রভাবিত হওয়া উচিত নয়। ডিগ্রি বিতরণ পরীক্ষা করার বিষয়ে ভাল ধারণা - আমাকে একবার দেখতে হবে!
র্যান্ডি ওলসন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.