@Ogrisel হাইলাইট হিসাবে, পাইথনের জন্য সাইকিট-লার্ন অন্যতম সেরা মেশিন লার্নিং প্যাকেজ। এটি 100 কে (স্পার্স) বৈশিষ্ট্য এবং 10 কে স্যাম্পল হিসাবে ছোট ডেটা-সেটগুলির জন্য এবং এমনকি 200k সারি হতে পারে এমন প্রান্তিক আকারে বড় ডেটা-সেটগুলির জন্য এটি উপযুক্ত। মূলত, কোনও ডেটাসেট যা মেমরিতে ফিট করে।
তবে, আপনি যদি খুব স্কেবলযোগ্য পাইথন মেশিন লার্নিং ফ্রেমওয়ার্কটি সন্ধান করেন তবে আমি পিসপার্ক এমএল্লিবকে অত্যন্ত সুপারিশ করব। যেহেতু এই দিনগুলিতে ডেটাসেটগুলি তাত্পর্যপূর্ণভাবে বড় হতে পারে (বড় ডেটা এবং গভীর শিক্ষার তরঙ্গ দেওয়া হয়েছে), আপনার প্রায়শই এমন একটি প্ল্যাটফর্মের প্রয়োজন হবে যা কেবলমাত্র মডেল প্রশিক্ষণের পর্যায়ে নয়, তবে বৈশিষ্ট্য ইঞ্জিনিয়ারিং পর্বেও (বৈশিষ্ট্য রূপান্তরকরণের সময়) ভাল স্কেল করতে এবং দ্রুত চালাতে পারে platform বৈশিষ্ট্য নির্বাচন)। আসুন স্পার্ক মলিব প্ল্যাটফর্মের জন্য তিনটি মেট্রিক দেখে আসুন যেটিতে আপনি আগ্রহী:
স্কেলিবিলিটি:
আপনার ডেটাসেট যদি স্মৃতিতে ফিট করতে পারে তবে সাইকিট-লার্ন আপনার পছন্দ হওয়া উচিত। যদি এটি মেমোরিতে ফিট না হয় তবে স্পার্কটি যাওয়ার উপায়। এখানে লক্ষণীয় গুরুত্বপূর্ণ বিষয় হ'ল স্পার্ক কেবল একটি বিতরণ সেটিংয়ে দ্রুত কাজ করে।
বিস্তৃতি : স্পার্ক মলিবের তুলনায় স্কেলার্ন প্রচুর পরিমাণে ব্যবহৃত অ্যালগরিদমগুলির শালীন প্রয়োগের ক্ষেত্রে আরও সমৃদ্ধ। ডেটা ম্যানিপুলেশন এবং রূপান্তরকরণের জন্য সমর্থন বিজ্ঞান-শিখার ক্ষেত্রে আরও সমৃদ্ধ। স্পার্ক মল্লিবের যথেষ্ট পরিমাণে ট্রান্সফর্মেশন মডিউল রয়েছে যা বেশিরভাগ সময় কৌতুক করে। সুতরাং, যদি আপনি মাপদণ্ডের উদ্বেগের জন্য স্পার্ক মলিব শেষ করেন তবে আপনি এখনও কাজটি করতে সক্ষম হবেন। এতে পারস্পরিক সম্পর্ক বিশ্লেষণ, বৈশিষ্ট্য নিষ্কাশন (টিএফ-আইডিএফ, ওয়ার্ড টুভেক, কাউন্টভেক্টরাইজার), বৈশিষ্ট্য রূপান্তরকরণ (টোকেনাইজার, স্টপওয়ার্ডস্রোভার, এনএন-গ্রাম, বাইনারিজার, পিসিএ ইত্যাদি) এর সমস্ত সমর্থন রয়েছে। বিস্তারিত তালিকার জন্য নীচের লিঙ্কটি দেখুন:
এক্সট্রাক্টিং, ট্রান্সফর্মিং এবং স্পার্ক মলিবের বৈশিষ্ট্য নির্বাচন করা
-
শ্রেণিবদ্ধকরণ : স্পার্ক মলিবের সমস্ত বড় অ্যালগোরিদমের বাস্তবায়ন রয়েছে যা আপনি বেশিরভাগ সময় ব্যবহার করতেন (পাঠ্য শ্রেণীবদ্ধের জন্য ভালভাবে কাজ করা অ্যালগোস সহ)। মোলিবের মাধ্যমে কি কি অ্যালগরিদমগুলি পাওয়া যায় তার বিশদ পর্যালোচনা করার জন্য নীচের লিঙ্কটি দেখুন।
মেলিব শ্রেণিবদ্ধকরণ এবং প্রতিরোধ
বোনাস: অ্যাপাচি স্পার্কের পাইথন, আর, জাভা এবং স্কালার জন্য সমর্থন রয়েছে। সুতরাং, আগামীকাল যদি আপনি কোনও ভিন্ন ভাষা নিয়ে পরীক্ষা করার সিদ্ধান্ত নেন (ব্যক্তিগত পছন্দ হিসাবে বা পেশাদার কারণে), আপনাকে সম্পূর্ণ নতুন কাঠামো শিখতে হবে না।