প্রজেক্ট অয়লারের চেয়ে বাজি বেশি হলেও আপনি উল্লেখ করেছেন যে, ক্যাগল আপনার নিজস্ব পরীক্ষায় ব্যবহারের জন্য উপাত্তের একটি দুর্দান্ত উত্স। তাদের অনেকগুলি প্রতিযোগিতার জন্য ডেটাসেটগুলি অ্যাক্সেস করার জন্য আপনাকে সাইন ইন করা প্রয়োজন (আইনি চুক্তি এবং এর জন্য) তবে আপনি যদি সত্যই কোনও এন্ট্রি শেষ করেন না, তবে আমি জানি না এমন কোনও জরিমানা।
বলা হচ্ছে, আপনি যদি প্রিন্সটনের মতো পরিসংখ্যান পদ্ধতিগুলির জন্য নির্দিষ্ট ডেটা সেটগুলি সন্ধান করেন তবে আপনি বিভিন্ন নেটওয়ার্ক আর্কিটেকচারের ডেটা পরীক্ষা করতে পারেন এবং এটিকে একটি মানদণ্ড হিসাবে প্লেইন রিগ্রেশন ইত্যাদির সাথে তুলনা করতে পারেন।
এখানে একটি বিস্তৃত তালিকার জন্যও দেখুন , এতে গুগলের সমস্ত প্রাকৃতিক ভাষা প্রক্রিয়াকরণ ডেটা রয়েছে ।
সুতরাং, প্রকল্প এলিউর নির্দিষ্ট সমস্যাগুলির সাথে দুর্দান্ত পরিষেবা সরবরাহ করে তবে মেশিন লার্নিংয়ের ক্ষেত্রে আপনি আপনার তৈরির একটি স্থাপত্যের সাথে বিদ্যমান ডেটাসেটগুলি ব্যবহার করতে পারেন এবং "উত্তরগুলি" অনলাইনে বা গবেষণাপত্রে উপস্থাপিত উপসংহারের সাথে তুলনা করতে পারেন।