মেশিন লার্নিং মডেলগুলি সংরক্ষণ, সঞ্চয় এবং ভাগ করে নেওয়ার সেরা অনুশীলনগুলি কী কী?
পাইথনে, আমরা সাধারণত আচার বা জবলিব ব্যবহার করে মডেলের বাইনারি উপস্থাপনা সঞ্চয় করি। মডেলগুলি, আমার ক্ষেত্রে, ~ 100 বড় হতে পারে। এছাড়াও, জবলিব একাধিক ফাইলে একটি মডেল সংরক্ষণ করতে পারে যদি না আপনি সেট করেন compress=1
( /programming/33497314/sklearn-dumping-model-using-joblib-dumps-m Multipleple-files- which-one-is-the- সংশোধন )।
তবে, আপনি যদি মডেলগুলির অ্যাক্সেসের অধিকারগুলি নিয়ন্ত্রণ করতে এবং বিভিন্ন মেশিনের মডেলগুলি ব্যবহার করতে সক্ষম হন তবে সেগুলি সঞ্চয় করার সর্বোত্তম উপায় কোনটি?
আমার কয়েকটি পছন্দ আছে:
- এগুলি ফাইল হিসাবে সংরক্ষণ করুন এবং তারপরে গিট এলএফএস ব্যবহার করে একটি সংগ্রহস্থলে রাখুন
- এগুলিকে বাইনারি ফাইল হিসাবে একটি এসকিউএল ডাটাবেসে সংরক্ষণ করুন:
- উদাহরণস্বরূপ Postgresql https://wiki.postgresql.org/wiki/BinaryFilesInDB
- এটি এসকিউএল সার্ভার দল দ্বারা প্রস্তাবিত পদ্ধতি:
- https://docs.microsoft.com/en-us/sql/advanced-analytics/tutorials/walkthrough-build-and-save-the-model
- https://microsoft.github.io/sql-ml-tutorials/python/rentalprediction/step/3.html
- https://blogs.technet.microsoft.com/dataplatforminsider/2016/10/17/sql-server-as-a-machine-learning-model-management-system
- HDFS