অবাধে উপলব্ধ ডেটা নমুনাগুলি সনাক্ত করা


98

আমি কোনও উপগোষ্ঠীর বৈশিষ্ট্যগুলির পূর্বনির্দিষ্টতা ছাড়াই জনসংখ্যার উপ-গোষ্ঠীগুলি সনাক্ত এবং পৃথক করতে ডেটাসেটগুলি বিশ্লেষণ ও পার্সিংয়ের জন্য একটি নতুন পদ্ধতিতে কাজ করছি। পদ্ধতিটি কৃত্রিম উপাত্তের নমুনাগুলি (যেমন জনসংখ্যার উপসংশ চিহ্নিতকরণ এবং পৃথকীকরণের উদ্দেশ্যে বিশেষভাবে তৈরি করা ডেটাসেটগুলি) দিয়ে যথেষ্ট কাজ করে, আমি লাইভ ডেটা দিয়ে এটি পরীক্ষা করার চেষ্টা করতে চাই।

আমি যা খুঁজছি তা অবাধে উপলভ্য (অর্থাত্ গোপনীয় নয়, স্বত্বাধিকারী) ডেটা উত্স। সাধারণত বিমোডাল বা মাল্টিমোডাল বিতরণ সম্বলিত একটি বা স্পষ্টতই একাধিক উপসর্গ সমন্বিত যা প্রচলিত উপায়ে সহজেই টানা যায় না। আমি কোথায় এই ধরনের তথ্য পেতে যেতে হবে?



4
আপনি পছন্দ করতে পারেন getthedata.org একটি প্রশ্ন ও উত্তর সাইট ডেটা সেট খোঁজার জন্য নিবেদিত
Jeromy Anglim

উত্তর:



46

নিম্নলিখিত তালিকায় আপনার আগ্রহী হতে পারে এমন অনেকগুলি ডেটা সেট রয়েছে:



17

বিশ্বব্যাংক বেশ আকর্ষণীয় ডেটা সরবরাহ করে এবং এটিরজন্যসুন্দর এপিআই বিকাশে সম্প্রতি সক্রিয় ছিল।

এছাড়াও, সংযুক্ত প্রকল্পের একটি আকর্ষণীয় তালিকা উপলব্ধ।

স্বাস্থ্য সূচক গুদামের জন্য মার্কিন স্বাস্থ্য সম্পর্কিত ডেটা হেড ।

ড্যানিয়েল Lemire এর ব্লগ পয়েন্ট কয়েক আকর্ষণীয় উদাহরণ (বেশিরভাগই ডিবি গবেষণা দিকে উপযোগী) সহ কানাডিয়ান জনগণনা 1880 এবং ম্যাথু মেঘ রিপোর্ট

এবং আজকের হিসাবে (03/04/2012) মার্কিন 1940 আদমশুমারির রেকর্ডগুলিও ডাউনলোডের জন্য উপলব্ধ।


2
বিশ্বব্যাংকের হয় অতিরিক্ত মাইল যাচ্ছে খোলা ডেটা এবং মানচিত্র, Stata এবং আর সঙ্গে
ফরাসী ভাষায়



10

দেখার মতো একটি ভাল জায়গা হ'ল কার্নেগি মেলন বিশ্ববিদ্যালয়ের ডেটা অ্যান্ড স্টোরি লাইব্রেরি বা ডিএএসএল , যাতে এমন ডেটা ফাইল রয়েছে যা "মৌলিক পরিসংখ্যান পদ্ধতির ব্যবহারের চিত্রিত করে ... একটি ভাল উদাহরণ একটি নির্দিষ্ট পরিসংখ্যান পদ্ধতির পাঠকে বিশদ এবং প্রাসঙ্গিক করে তুলতে পারে। DASL হ'ল শিক্ষকদের পাঠদানের জন্য ডেটাফিলগুলি সনাক্ত এবং সনাক্ত করতে সহায়তা করার জন্য ডিজাইন করা হয়েছে We আমরা আশা করি যে ডিএএসএল পরিসংখ্যান সাহিত্যের ডেটাসেটগুলির সংরক্ষণাগার হিসাবেও কাজ করবে। "


9

আর শুরু করুন এবং টাইপ করুন data()। এটি অনুসন্ধানের পথে সমস্ত ডেটাসেট প্রদর্শন করবে। অ্যাড-অন প্যাকেজগুলিতে অনেকগুলি অতিরিক্ত ডেটাসেট উপলব্ধ। উদাহরণস্বরূপ, AERপ্যাকেজে কিছু আকর্ষণীয় বাস্তব-বিশ্বের সামাজিক বিজ্ঞানের ডেটাসেট রয়েছে ।




5

স্ট্যাক এক্সচেঞ্জ নেটওয়ার্কের এখন ডেটা নিবেদিত একটি নতুন সাইট, ওপেন ডেটা (5 ই মার্চ, 2015-তে বিটাতে) রয়েছে। এটি নিজেকে বর্ণনা করে:

ওপেন ডেটা স্ট্যাক এক্সচেঞ্জ হ'ল বিকাশকারী এবং গবেষকদের জন্য উন্মুক্ত ডেটাতে আগ্রহী একটি প্রশ্নোত্তর সাইট। এটি প্রশ্নোত্তর সাইটগুলির স্ট্যাক এক্সচেঞ্জ নেটওয়ার্কের অংশ হিসাবে আপনার দ্বারা নির্মিত এবং পরিচালিত। আপনার সহায়তায়, আমরা খোলা ডেটা সম্পর্কে প্রতিটি প্রশ্নের বিস্তারিত উত্তরের একটি গ্রন্থাগার তৈরি করতে একসাথে কাজ করছি।

"ওপেন ডেটা" ডেটাসেটগুলি বোঝায় যা "কপিরাইট, পেটেন্টস বা নিয়ন্ত্রণের অন্যান্য প্রক্রিয়া থেকে নিষেধাজ্ঞা ছাড়াই" প্রত্যেকেরই নিজের ইচ্ছামতো প্রকাশ করতে এবং পুনরায় প্রকাশের জন্য অবাধে উপলব্ধ "( উইকিপিডিয়া )। যাইহোক, সাইটটি বন্ধ ডেটাসেটগুলির জন্য অনুরোধের জন্য কার্যকর বলে মনে হচ্ছে ।



3

তালিকায় একটি দম্পতি যুক্ত করা:

  • উন্মুক্ত-ব্যবসায়িক কোম্পানি, ফিরে বহু দশক যাচ্ছে গভীর আর্থিক তথ্য প্রচুর: http://www.mergent.com/servius

  • মার্কিন যুক্তরাষ্ট্রে 16+ মিলিয়ন ব্যবসায়ের সমৃদ্ধ তথ্য: http://compass.webservius.com

উভয়ই একটি REST এপিআই এর মাধ্যমে উপলব্ধ এবং বিনামূল্যে পরীক্ষার পরিকল্পনা রয়েছে।






2

আমার প্রয়োজনের জন্য উপযুক্ত ডেটা সেট অনুসন্ধান করে আমি এই দুটি আলোচনার জন্য প্রাসঙ্গিক দুটি সাইট জুড়েই হোঁচট খেয়েছি।

ডেটাসাইট সাইট যা নিজেকে বর্ণনা করে ...

আমরা একটি আন্তর্জাতিক সংস্থা যার লক্ষ্য:

  • গবেষণা তথ্য সহজে অ্যাক্সেস প্রতিষ্ঠিত
  • পণ্ডিত রেকর্ডে বৈধ অবদান হিসাবে গবেষণা তথ্য গ্রহণযোগ্যতা বৃদ্ধি এবং
  • ফলাফলগুলি যাচাই করার এবং ভবিষ্যতের অধ্যয়নের জন্য পুনরায় উদ্দেশ্য করার অনুমতি দেওয়ার জন্য ডেটা সংরক্ষণাগারটিকে সমর্থন করে।

ডেটাবিব.আর.অর্গ যা নিজেকে বর্ণনা করে ...

ডেটাবিব হ'ল গবেষণা ডেটাগুলির অনলাইন ভান্ডারগুলি সনাক্ত করতে এবং সনাক্ত করতে লোকদের সহায়তা করার একটি সরঞ্জাম। ব্যবহারকারী এবং গ্রন্থপ্রেমীরা রেকর্ড তৈরি করে এবং খাঁটি রেকর্ড করে যা ব্যবহারকারী অনুসন্ধান করতে পারে এমন ডেটা সংগ্রহস্থলগুলিকে বর্ণনা করে।

ভেবেছি এটি অন্যদের জন্য এখানে তালিকায় যুক্ত করা উপযুক্ত হবে।

এখন এর লিঙ্কগুলির মধ্যে এমন কিছু সন্ধান করতে যা আমার প্রয়োজনগুলির সাথে খাপ খায়!


2

আমি Quandl.com চেক আউট সুপারিশ । এটি একটি ডেটা প্রোগ্রামারদের স্বপ্ন। এটি 10 ​​মিলিয়নেরও বেশি বিভিন্ন ডেটা সিটের যে কোনওটিতে অ্যাক্সেসের জন্য একটি খুব সহজ API সরবরাহ করে। আপনি দ্বি-মোডিয়াল বা বহু-বৈচিত্রযুক্ত ডেটা সন্ধান করছেন, সুতরাং আমি জনসংখ্যার বিভিন্ন ধরণের ডেটা পরীক্ষা করার পরামর্শ দেব যেমন এই বিশ্ব জনসংখ্যার চার্টে মোট উপাদানগুলির দেশ এবং অঞ্চলগুলি অন্তর্ভুক্ত রয়েছে।


1
কিছু কান্ডাল ডেটা বিনামূল্যে, কিছু "প্রিমিয়াম" অর্থাত্ দাম $$ এছাড়াও আমার এপিআই স্বপ্নের মধ্যে টাইম-সিরিজ নরো, এনকোলস এবং অনলাইন প্লট রয়েছে (আমি একটি পনি চাই)।
ড্যানিস


1

সময়ের সাথে সাথে ব্যবহার

সময়ের সাথে সাথে ব্যবহারকারী ডেমোগ্রাফিক্স সহ সমস্ত অনলাইন ক্রিয়াকলাপের ডেটা পয়েন্ট সহ ডাউনলোডের জন্য একটি খুব বড় এক্সেল স্প্রেডশিট উপলব্ধ। এই স্প্রেডশিটটি ডাউনলোড বা ব্যবহারের আগে দয়া করে টিপ শিটটি (নীচে) পড়ুন।

http://pewinternet.org/Trend-Data/Usage-Over-Time.aspx





আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.