এই সংজ্ঞাটি পুরোপুরি প্রয়োগ হয় না কারণ আমরা সবসময় অন্তর্নিহিত বিতরণটি ধরে নিই না। সুতরাং একটি মডেল আসলে কি? নির্দিষ্ট হাইপারপ্যারামিটার সহ একটি জিবিএমকে কী মডেল হিসাবে বিবেচনা করা যেতে পারে? কোনও মডেল কি বিধিগুলির সংকলন?
এই সংজ্ঞাটি পুরোপুরি প্রয়োগ হয় না কারণ আমরা সবসময় অন্তর্নিহিত বিতরণটি ধরে নিই না। সুতরাং একটি মডেল আসলে কি? নির্দিষ্ট হাইপারপ্যারামিটার সহ একটি জিবিএমকে কী মডেল হিসাবে বিবেচনা করা যেতে পারে? কোনও মডেল কি বিধিগুলির সংকলন?
উত্তর:
আমি সম্প্রতি একই প্রশ্নে আগ্রহী ছিলাম এবং উপলব্ধি করেছিলাম যে মেশিন লার্নিংয়ে কোনও "মডেল" এর কোনও একক সংজ্ঞা নেই। এটি আপনি যে উত্সগুলির সাথে পরামর্শ করছেন তার উপর নির্ভরশীল যা কোনও নির্দিষ্ট সফ্টওয়্যার প্রোগ্রামের নথীকরণ হতে পারে, এর ব্যবহারকারী সম্প্রদায় দ্বারা গৃহীত অপবাদ বা প্রকাশিত একাডেমিক কাগজগুলিতে ব্যবহৃত সংজ্ঞা যা জার্নাল থেকে জার্নালে বিভিন্নভাবে পরিবর্তিত হতে পারে। তদুপরি, আমার মনে রাখতে হবে যে এই জাতীয় কাগজপত্রগুলি কেবল মেশিন লার্নিংয়ের বিশেষজ্ঞরা নয়, অন্যান্য শাখার বিশেষজ্ঞরাও লিখেছেন যা মেশিন লার্নিং কৌশলগুলি প্রয়োগ করার প্রয়োজন রয়েছে (যেমন ইমেজিং, বিভিন্ন চিকিত্সা ক্ষেত্র ইত্যাদি)) । তাদের মধ্যে অনেকে "মডেল" শব্দটি স্পষ্টভাবে সংজ্ঞায়িত করেন না যা প্রায়শই আলগাভাবে ব্যবহৃত হয়। এখানে "মডেল" আমি "এর বিভিন্ন সংজ্ঞা দেওয়া আছে
• পরিসংখ্যানের মডেলগুলি, বিশেষত সম্ভাবনা বিতরণের সাথে সম্পর্কিত পরিসংখ্যান।
• রিগ্রেশন ডেটা এবং সম্পর্কিত পরিসংখ্যান।
Above উপরে নীল স্লেটার দ্বারা উল্লিখিত গাণিতিক মডেলগুলি।
Machine মেশিন লার্নিংয়ে ব্যবহৃত ডেটা মডেলগুলি যেমন জড়িত কলামগুলি, তাদের ডেটা প্রকারগুলি, ডেটা উত্স এবং অন্যান্য মেটাডেটা। এটি বিশেষত জটিল কারণ আমি তালিকাভুক্ত প্রথম তিনটির মতো এই সংজ্ঞাটি সম্পর্কে গাণিতিক কিছুই নেই। উদাহরণস্বরূপ, এসকিউএল সার্ভারের "মাইনিং মডেলগুলির" জন্য সমস্ত নথি দেখুন, যা মেশিন শেখার উদ্দেশ্যে ডাবল শুল্ক সরবরাহ করে।
• কখনও কখনও উপরের সমস্ত সংজ্ঞাগুলি সমীকরণের শীর্ষে নির্মিত মেশিন লার্নিং স্ট্রাকচার এবং মেটাডেটা যেমন নিউরাল নেটগুলির স্পেসিফিকেশন অন্তর্ভুক্ত করার জন্য প্রসারিত হয়। অন্যান্য ক্ষেত্রে এগুলি পৃথক সত্তা হিসাবে বিবেচিত হয়।
উপরের সমস্তগুলি কখনও কখনও উত্সের উপর নির্ভর করে একসাথে মিশ্র এবং মিলিত হয়। আমি নিশ্চিত যে "মডেল" এর অন্যান্য সংজ্ঞা রয়েছে যা আমি এই তালিকাটি ছেড়ে দিয়েছি, এটি আরও জটিল করে দেবে। এই অস্পষ্টতার সাথে মোকাবিলা করার জন্য, আমি যখনই "মডেল" শব্দটি ব্যবহার করি তখনই লেখকের উদ্দেশ্য সম্পর্কে নিজেকে প্রশিক্ষণের চেষ্টা করছি। কখনও কখনও প্রসঙ্গে বা লেখক যে ক্ষেত্রে কাজ করে তার উপর ভিত্তি করে নির্ধারণ করা সহজ, তবে অন্য সময় আমাকে নিবন্ধ বা ডকুমেন্টেশনটি গভীরভাবে পড়ার আগে এটি বের করার আগে। আমি আশা করি আমি এটি সম্পর্কে আরও সুস্পষ্ট হতে পারি, তবে এটি সত্যিই একটি প্রাকৃতিক ম্লান শব্দ; এটির জন্য কখনও কখনও সাধারণ এক-আকারের ফিট-সব উত্তর হতে পারে না। আমি আশা করি এটি সাহায্য করবে.
টম মিশেল প্রদত্ত মেশিন লার্নিং সংজ্ঞাটি আমার পছন্দ হয়েছে ।
একটি কম্পিউটার প্রোগ্রাম টি E এর কিছু কর্মের ক্ষেত্রে T এবং পারফরম্যান্স পরিমাপের ক্ষেত্রে অভিজ্ঞতা E থেকে শিখতে বলে যদি টি এর কাজগুলিতে তার পরিমাপ, পি দ্বারা পরিমাপ করা হয়, অভিজ্ঞতা E এর সাথে উন্নতি করে if
সুতরাং, এই সংজ্ঞা দেওয়া, আমার বলা উচিত যে একটি মডেল হ'ল কিছু ক্লাস টি করার পরে অর্জিত অভিজ্ঞতা।
অ্যামাজন মেশিন লার্নিংয়ের নিবন্ধ থেকে
একটি এমএল মডেলকে প্রশিক্ষণের প্রক্রিয়াটিতে শিখার জন্য প্রশিক্ষণের ডেটা সহ একটি এমএল অ্যালগরিদম (যা শিখার অ্যালগরিদম) সরবরাহ করা জড়িত। The term ML model refers to the model artifact that is created by the training process.
একটি মডেল, আলগাভাবে বলতে, কিছু জিনিস বা প্রক্রিয়া সরলকরণ। উদাহরণস্বরূপ, পৃথিবীর আকৃতি আসলে কোনও গোলক নয়, তবে আমরা যদি কোনও গ্লোব ডিজাইন করি তবে আমরা এটির মতো বিবেচনা করতে পারি। একইভাবে, মহাবিশ্বকে নির্বিচারবাদী বলে ধরে নেওয়া, এমন একটি প্রাকৃতিক প্রক্রিয়া রয়েছে যা কোনও গ্রাহক কোনও ওয়েবসাইটে কোনও পণ্য কিনবেন কিনা তা নির্ধারণ করে। আমরা এমন কিছু নির্মাণ করতে পারি যা সেই প্রক্রিয়াটির সমান হয়, যা আমরা কোনও গ্রাহক সম্পর্কে কিছু তথ্য দিতে পারি এবং যা আমাদের যদি মনে করে যে গ্রাহক কোনও পণ্য কিনবে কিনা।
একটি "মেশিন লার্নিং মডেল", তখন মেশিন লার্নিং সিস্টেম দ্বারা নির্মিত একটি মডেল।
(এটি একটি কঠোর উত্তর না হওয়ার জন্য ক্ষমা চাই, তবে আমি আশা করি এটি এখনও কার্যকর হবে))
মেশিন লার্নিং প্যারাডাইমে মডেল প্রতিটি অনুমান, শ্রেণি এবং রেগ্রেশন, শ্রেণিবিন্যাস এবং শক্তিবৃদ্ধি বিভাগের জন্য যথাক্রমে ক্রিয়াকলাপের জন্য ইনপুট স্থানধারীদের পাশাপাশি মডেল পরামিতিগুলির গাণিতিক প্রকাশকে বোঝায়।
এই অভিব্যক্তিটি মডেল হিসাবে একক নিউরনে এম্বেড হয়েছে।
একক স্তর পার্সেপট্রন এবং গভীর শেখার মডেলটির জন্য, একটি অর্ডার করা ফ্যাশনে অ্যাক্টিভেশন ফাংশন সংগ্রহ এবং সেলাইয়ের জন্য নিউরন এবং স্তরগুলি সাবধানতার সাথে হাঁটার মাধ্যমে এই মডেলটি বের করতে হবে।
মেশিন লার্নিংয়ে, মডেলটি মাধ্যাকর্ষণ কেন্দ্র এবং সবকিছুই মডেলের চারদিকে ঘোরে। যদিও বিভিন্ন ব্যক্তির মডেলটির বিভিন্ন সংজ্ঞা রয়েছে। তবে আমার মতে, এখানে আমরা কীভাবে মডেলটিকে "মেশিন লার্নিংয়ে মডেলটি সংজ্ঞায়িত করতে পারি তা হ'ল হাইপোথিসিস যা ডেটা মাপসই করে এবং অদেখা তথ্যের পূর্বাভাস দিতে শেখে"।
মেশিন লার্নিংয়ে, একটি মডেল হ'ল বিমূর্ততা যা পূর্বাভাস সম্পাদন করতে পারে, (পুনরায়) ক্রিয়া বা ইনপুট মানগুলির উদাহরণের সাথে সম্মতিতে রূপান্তর করতে পারে। একটি মডেল এমন একক সংখ্যক হতে পারে যেমন পর্যবেক্ষণের সেটগুলির গড় মূল্য যা প্রায়শই বেসলাইন মডেল হিসাবে ব্যবহৃত হয়, একটি বহুপদী অভিব্যক্তি বা নিয়মের একটি সেট (যেমন সিদ্ধান্তের গাছ) যা আউটপুটটি কীভাবে উত্পন্ন করতে হবে তা নির্ধারণ করে।
সাধারণভাবে, একটি মডেলকে নিয়মের একটি সেট এবং হাইপার-পরামিতি দ্বারা সংজ্ঞায়িত করা হয় যা মডেলটির কাঠামো এবং ক্ষমতাটি হাতে টাস্কটি সম্পাদনের জন্য অনুকূলিত করার জন্য সংজ্ঞায়িত করে। একটি হাইপার-প্যারামিটার বহুপথের ডিগ্রি বা সিদ্ধান্ত গাছের গভীরতা হতে পারে। কোনও মডেলকে একটি অপ্টিমাইজেশন প্রক্রিয়াতে আটকানো যেতে পারে যেখানে নির্দিষ্ট উদ্দেশ্যগুলির বিরুদ্ধে পরামিতিগুলি অনুকূলিত হয়।
অপ্টিমাইজেশন প্রক্রিয়াটি প্রায়শই ফিটিংয়ের প্রশিক্ষণ হিসাবে বিবেচিত হয় এবং ফলিত মডেলের ফলাফল হয়, যা কেবল মডেল হিসাবেও উল্লেখ করা যেতে পারে। যদি কোনও মডেল প্রশিক্ষিত হয় বা না হয় তবে প্রায়শই প্রসঙ্গ থেকে হ্রাস করা প্রয়োজন।
এটি একটি মজার আলোচনা! আমার দুটি সেন্ট হ'ল একটি মডেল এমন তথ্য সংরক্ষণ করে যে কোনও কম্পিউটার সম্ভাব্য ইনপুটগুলির কিছু সেট থেকে উপযুক্ত আউটপুটগুলির সেটগুলিতে ম্যাপিংয়ের অনুমান করতে পারে। কোনও মডেল হ'ল একটি সাধারণ ফাংশনের সংজ্ঞা যা আরও জটিল ফাংশনটির সমান হয় তার চেয়ে বেশি বা কম কিছুই নয়। জটিল ফাংশনটির জন্য এটি বাস্তব-বিশ্বের ঘটনা হওয়ার প্রয়োজন হয় না, কেবলমাত্র মডেলটির জন্য সঠিকভাবে পুনরুত্পাদন করার জন্য পর্যাপ্ত তথ্য সংরক্ষণ না করে জটিল ফাংশনটিকে প্রায় অনুমান করা যায়।