সর্বজনীনভাবে উপলভ্য সামাজিক নেটওয়ার্কের ডেটাসেট / এপিআই


26

আমাদের সর্বজনীনভাবে উপলভ্য ডেটাসেটগুলির দুর্দান্ত তালিকার এক্সটেনশন হিসাবে , আমি জানতে চাই যে সর্বজনীনভাবে উপলভ্য সামাজিক নেটওয়ার্কের ডেটাসেট / ক্রলিং এপিআইয়ের কোনও তালিকা রয়েছে কিনা। এটি খুব সুন্দর হবে যদি ডেটাসেট / এপিআইয়ের লিঙ্কের পাশাপাশি উপলব্ধ ডেটার বৈশিষ্ট্যগুলি যুক্ত করা হয়। এই জাতীয় তথ্য হওয়া উচিত এবং এটি সীমাবদ্ধ নয়:

  • সামাজিক নেটওয়ার্কের নাম;
  • এটি কোন ধরণের ব্যবহারকারীর তথ্য সরবরাহ করে (পোস্টগুলি, প্রোফাইল, বন্ধুত্বের নেটওয়ার্ক, ...);
  • এটি কোনও এপিআই (এবং হার: 10 / মিনিট, 1 কে / মাস, ...) এর মাধ্যমে এর সামগ্রীগুলি ক্রল করার অনুমতি দেয় কিনা;
  • এটি কেবল পুরো ডেটাসেটের স্ন্যাপশট সরবরাহ করে কিনা।

যোগ করার জন্য কোনও পরামর্শ এবং আরও বৈশিষ্ট্যগুলি অত্যন্ত স্বাগত।

উত্তর:


20

সামাজিক নেটওয়ার্কগুলির এপিআই সম্পর্কে কয়েকটি শব্দ words প্রায় এক বছর আগে আমি গবেষকদের জন্য জনপ্রিয় সামাজিক নেটওয়ার্কগুলির এপিআইগুলির একটি পর্যালোচনা লিখেছিলাম। দুর্ভাগ্যক্রমে, এটি রাশিয়ান ভাষায়। এখানে একটি সংক্ষিপ্তসার দেওয়া হল:

টুইটার ( https://dev.twitter.com/docs/api/1.1 )

  • টুইট / পাঠ্য এবং ব্যবহারকারীদের সম্পর্কে প্রায় সমস্ত ডেটা উপলব্ধ;
  • সোসিওডেমোগ্রাফিক ডেটার অভাব;
  • দুর্দান্ত স্ট্রিমিং এপিআই: রিয়েল টাইম পাঠ্য প্রক্রিয়াজাতকরণের জন্য দরকারী;
  • প্রোগ্রামিং ভাষাগুলির জন্য প্রচুর মোড়ক;
  • নেটওয়ার্ক স্ট্রাকচার (সংযোগ) পাওয়া সম্ভব তবে সময় ব্যয়বহুল (প্রতি 1 মিনিটের জন্য 1 অনুরোধ)।

ফেসবুক ( https://developers.facebook.com/docs/references/api/ )

  • হার সীমা: প্রতি সেকেন্ডে প্রায় 1 অনুরোধ;
  • ভাল নথিভুক্ত, স্যান্ডবক্স উপস্থিত;
  • এফকিউএল (এসকিউএল-মত) এবং «নিয়মিত বিশ্রাম» গ্রাফ এপিআই;
  • বন্ধুত্বের ডেটা এবং সোসিয়োডেমোগ্রাফিক বৈশিষ্ট্য উপস্থিত রয়েছে;
  • প্রচুর ডেটা ইভেন্টের দিগন্তের বাইরে : কেবলমাত্র 'বন্ধুবান্ধব' এবং বন্ধুবান্ধব ডেটা কম-বেশি সম্পূর্ণ হয়, প্রায় এলোমেলো ব্যবহারকারীর সম্পর্কে তদন্ত করা যায়নি;
  • কিছু অদ্ভুত এপিআই বাগগুলি এবং দেখে মনে হচ্ছে যে কেউ এগুলি সম্পর্কে চিন্তা করে না (উদাহরণস্বরূপ, কিছু বৈশিষ্ট্য এফকিউএল এর মাধ্যমে উপলভ্য, তবে গ্রাফ এপিআই প্রতিশব্দ দ্বারা নয়)।

ইনস্টাগ্রাম ( http://instagram.com/developer/ )

  • হার সীমা: প্রতি ঘন্টা 5000 অনুরোধ;
  • রিয়েল-টাইম এপিআই (টুইটারের জন্য স্ট্রিমিং এপিআইয়ের মতো, তবে ফটোগুলির সাহায্যে) - এর সাথে সংযোগটি কিছুটা জটিল: কলব্যাকগুলি ব্যবহৃত হয়;
  • সোসিওডেমোগ্রাফিক ডেটার অভাব;
  • ফটো, ফিল্টার ডেটা উপলব্ধ;
  • অপ্রত্যাশিত অপূর্ণতা (যেমন, পোস্ট / ফটোতে কেবল 150 টি মন্তব্য সংগ্রহ করা সম্ভব)।

চৌবাচ্চা ( https://developer.foursquare.com/overview/ )

  • হার সীমা: প্রতি ঘন্টা 5000 অনুরোধ;
  • ভূ-সামাজিক তথ্যের কিংডম :)
  • গোপনীয়তার কারণে গবেষণাগুলি থেকে একেবারে বন্ধ। চেকিনস ডেটা সংগ্রহ করার জন্য 4sq, bit.ly, এবং টুইটার API গুলি একবারে কাজ করে কম্পোজিট পার্সার তৈরি করতে হবে;
  • আবার: সোসিয়োডেমোগ্রাফিক ডেটার অভাব।

Google+ ( https://developers.google.com/+/api/latest/ )

  • প্রতি সেকেন্ডে প্রায় 5 টি অনুরোধ (যাচাই করার চেষ্টা করুন);
  • প্রধান পদ্ধতি: কার্যক্রম এবং মানুষ;
  • ফেসবুকে যেমন এলোমেলো ব্যবহারকারীর জন্য প্রচুর ব্যক্তিগত তথ্য লুকানো থাকে;
  • ব্যবহারকারীর সংযোগ ডেটার অভাব।

এবং প্রতিযোগিতার বাইরে: আমি রাশিয়ান পাঠকদের জন্য সামাজিক নেটওয়ার্কগুলি পর্যালোচনা করেছি, এবং # 1 নেটওয়ার্কটি এখানে vk.com । এটি অনেক ভাষায় অনুবাদ করা হয়েছে, তবে কেবল রাশিয়া এবং অন্যান্য সিআইএস দেশে জনপ্রিয়। এপিআই ডক্স লিঙ্ক: http://vk.com/dev/ । এবং আমার দৃষ্টিকোণ থেকে, এটি হোমব্রিউ সামাজিক মিডিয়া গবেষণার জন্য সেরা পছন্দ। কমপক্ষে, রাশিয়ায়। এই জন্য:

  • হার সীমা: প্রতি সেকেন্ডে 3 অনুরোধ;
  • পাবলিক টেক্সট এবং মিডিয়া ডেটা উপলব্ধ;
  • সোসিয়োডেমোগ্রাফিক ডেটা উপলব্ধ: এলোমেলো ব্যবহারকারীর জন্য প্রাপ্যতা স্তর প্রায় 60-70%;
  • ব্যবহারকারীদের মধ্যে সংযোগগুলিও উপলভ্য: এলোমেলো ব্যবহারকারীর জন্য প্রায় সমস্ত বন্ধুত্বের ডেটা উপলব্ধ;
  • কিছু বিশেষ পদ্ধতি: উদাহরণস্বরূপ, রিয়েলটাইমে সঠিক ব্যবহারকারীর জন্য অনলাইন / অফলাইন স্থিতি পেতে একটি পদ্ধতি রয়েছে এবং তার দর্শকদের জন্য সময়সূচী তৈরি করা যেতে পারে।

1
নিছক দুর্দান্ততা! আমি আসলে এমন অনেক প্রত্যাশা করছিলাম যা অনেকগুলি উত্তরের মধ্যে দ্রবীভূত হয়েছিল এবং আপনি পুরোটা বহন করে এসেছিলেন: ডি উত্তরের জন্য ধন্যবাদ। সুন্দর কাজ! :)
রুবেন্স

1
আমি লিঙ্কডইন, ইউটিউব, গোপনীয়তা পিছনে রেখেছি। হতে পারে অন্যান্য আঞ্চলিক নেটওয়ার্কগুলি (কিউকিউ?)। এবং তাদের সম্পর্কে কোনও তথ্য পেয়ে খুশি হবে।
সোবাচ

8

এটি প্রতি সেচের কোনও সামাজিক নেটওয়ার্ক নয়, তবে স্ট্যাকেক্সচেঞ্জ তাদের পুরো ডেটাবেস ডাম্প পর্যায়ক্রমে প্রকাশ করে:

ব্যবহারকারীরা একে অপরকে জিজ্ঞাসা ও উত্তর দেয় এমন বিশ্লেষণ করে আপনি কিছু সামাজিক তথ্য আহরণ করতে পারেন। একটি দুর্দান্ত বিষয় হ'ল পোস্টগুলি যেহেতু ট্যাগ করা হয়েছে তাই আপনি উপ-সম্প্রদায়গুলি সহজেই বিশ্লেষণ করতে পারেন।


6

স্ট্যানফোর্ড নেটওয়ার্ক বিশ্লেষণ প্রকল্পের ওয়েবসাইটে সর্বজনীনভাবে উপলভ্য সামাজিক নেটওয়ার্ক ডেটাসেটের একটি ভাল তালিকা পাওয়া যাবে:

এসএনএপি ডেটাসেটস

সাইটে ইন্টারনেট সামাজিক নেটওয়ার্ক ডেটা (ফেসবুক, টুইটার, গুগল প্লাস), একাডেমিক জার্নালের জন্য সম্মানসূচক নেটওয়ার্ক, অ্যামাজন থেকে কো-ক্রয়িং নেটওয়ার্ক এবং বিভিন্ন ধরণের নেটওয়ার্ক রয়েছে। তারা নির্দেশিত, পুনর্নির্দেশিত, এবং দ্বিপক্ষীয় গ্রাফ এবং সমস্ত ডেটাসেটগুলি স্ন্যাপশট যা সংকুচিত আকারে ডাউনলোড করা যায়।


5

জার্মানি থেকে একটি উদাহরণ: লিংকডিনের অনুরূপ একটি সাইট জিং, তবে জার্মান ভাষী দেশগুলির মধ্যে সীমাবদ্ধ।

এর বিকাশকারীটির কেন্দ্রীয় লিঙ্ক: https://dev.xing.com/overview

এতে অ্যাক্সেস সরবরাহ করে: ব্যবহারকারী প্রোফাইল, ব্যবহারকারীদের মধ্যে কথোপকথন (ব্যবহারকারী নিজেই সীমাবদ্ধ), চাকরির বিজ্ঞাপন, যোগাযোগ এবং পরিচিতিগুলির যোগাযোগগুলি, নেটওয়ার্ক থেকে প্রাপ্ত সংবাদ এবং কিছু ভূ-অবস্থান এপিআই।

হ্যাঁ এটির একটি এপি রয়েছে, তবে আমি হার সম্পর্কে কোনও তথ্য পাইনি। তবে আমার কাছে মনে হয়, কিছু তথ্য ব্যবহারকারীর সম্মতিতে সীমাবদ্ধ।


4

নেটওয়ার্ক সংগ্রহস্থল ( http://networkrepository.com ) এর প্রচুর সংখ্যক সামাজিক নেটওয়ার্ক, ওয়েব গ্রাফ, বায়ো এবং মস্তিষ্কের নেটওয়ার্ক রয়েছে all সর্বোপরি, তাদের কাছে বিভিন্ন সামাজিক নেটওয়ার্কের তুলনা / অন্বেষণ করার জন্য ইন্টারেক্টিভ ভিজ্যুয়াল অ্যানালিটিক সরঞ্জাম রয়েছে।


2

এই জাতীয় লিঙ্কগুলির একটি ছোট সংগ্রহ এখানে পাওয়া যাবে । তাদের অনেকগুলিই সামাজিক গ্রাফ।


আমি এই রেফারেন্স পোস্ট করার জন্য আপনাকে অনেক ধন্যবাদ জানাই, তবে আমি এখানে উত্তরগুলির প্রত্যাশা করছিলাম যে সোশ্যাল নেটওয়ার্কের জন্য সর্বজনীনভাবে উপলভ্য ডেটাসেট / এপিআই নির্দেশ করা হবে, এবং এ জাতীয় উত্স দ্বারা সরবরাহিত পোস্টগুলি (পোস্টের ডাউনলোডের হার, বা কী ধরণের তথ্য রয়েছে তা বর্ণনা করুন) ব্যবহারকারীদের সম্পর্কে)। আপনার উত্তর হিসাবে, আমি অনুমান করি যে এটি আমাদের কাছে সর্বজনীনভাবে উপলব্ধ ডেটাসেটগুলির তালিকায় খুব স্বাগত হবে ।
রুবেন্স

0

বিভিন্ন সোশ্যাল মিডিয়া প্ল্যাটফর্মগুলি থেকে থাই পাঠ্য + সংবেদন লেবেল (ধনাত্মক, নিরপেক্ষ, নেতিবাচক)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.