উত্তর:
সেখানে অবশ্যই দেখা যাচ্ছে যে কোনও প্রকল্পের পাঠ্য মাইনিং / তথ্য পুনরুদ্ধার / ইত্যাদি জড়িত গবেষণা প্রকল্প রয়েছে। এবং স্ট্যাক এক্সচেঞ্জ সাইটগুলি।
কিছু উদাহরণ আমি গুগল / গুগল স্কলারের মাধ্যমে খুঁজে পেতে সক্ষম হয়েছি (বিস্তৃত তালিকার কাছাকাছি কোথাও হওয়ার সম্ভাবনা নেই):
আরও সাধারণভাবে, অটোমেটেড প্রশ্ন উত্তর সিস্টেমগুলি তুচ্ছ / "সমাধান করা" সমস্যা নয়, এখনও গবেষণার বরং সক্রিয় ক্ষেত্র হিসাবে উপস্থিত বলে মনে হয়। এই জাতীয় সিস্টেমগুলির জন্য স্ট্যাক এক্সচেঞ্জ ডেটাগুলির একটি উত্স হতে পারে তবে প্রচুর পরিমাণে অন্যান্য ডেটা উত্সও রয়েছে (উইকিপিডিয়া, কোওড়া ইত্যাদি)।
DuckDuckGo StackExchange থেকে প্রযুক্তিগত প্রশ্নের উত্তর শেখে। "চলমান প্রকল্পগুলি স্টাকেক্সচেঞ্জ ব্যবহার করুন" এর মতো প্রযুক্তিগত প্রশ্নটি ডাকডকগোতে টাইপ করুন এবং এটি ডানদিকে উত্তরটির একটি হাইলাইটেড সংক্ষিপ্তসার সরবরাহ করবে। এবং হাঁসের কাছে অনেকগুলি (100s) আরও প্রশ্নের উত্তর দেওয়ার ডেটা উত্সগুলির জন্য একটি ওপেন API রয়েছে। অথবা আপনি সরাসরি স্ট্যাকেক্সচেঞ্জ এপিআইতে যেতে পারেন ।
প্রকল্পগুলি এসই ওপেন এপিআই থেকে ডেটা ব্যবহার করতে পারে যতক্ষণ না তারা তাদের টিউইউ মেনে চলে । মূলত আপনার ব্যবহারকারীরা বলতে পারবেন যে ডেটা স্ট্যাক এক্সচেঞ্জ থেকে এসেছে। কপিরাইট লাইসেন্স পাঠ্য বিষয়বস্তু পরিবর্তন করতে আপনার ক্ষমতা সীমিত করতে পারে, একটি শিখানো বিমূর্ত সংক্ষিপ্ত বিবরণ দিয়ে। সম্ভবত এজন্যই ডট ডট কম কীওয়ার্ডগুলিকে হাইলাইট করে।
ডেটা রাইটস আইনটি প্রবাহিত হয়, বিশেষত যখন আপনি কোনও সাইটে জমা দেওয়া ডেটা এবং সেই ডেটা থেকে প্রাপ্ত মেশিন লার্নিং মডেলগুলির কথা আসে। নতুন ইউরোপীয় ডেটা এবং গোপনীয়তার বিধি আপনাকে স্ট্যাক এক্সচেঞ্জের মতো কোনও সাইটে জমা দেওয়া সমস্ত ডেটা ডাউনলোড বা মুছতে সক্ষম করে।