আমি যখন থেকেই মেশিন লার্নিংয়ের অ্যাডাম গিটিংয়ের ব্লগটি এসেছি তখন থেকেই আমি নিউরাল নেটওয়ার্কগুলি বোঝার চেষ্টা করছি । আমি এই বিষয়টিতে যতটুকু পড়তে পেরেছি (যা আমি বুঝতে পারি) এবং বিশ্বাস করি যে আমি সমস্ত বিস্তৃত ধারণা এবং কিছু কাজ বুঝতে পারি (গণিতে খুব দুর্বল থাকা সত্ত্বেও), নিউরনস, সিনাপেস, ওজন, ব্যয় ক্রিয়াকলাপ, ব্যাকপ্রকাশ ইত্যাদি। তবে, আমি কীভাবে আসল বিশ্বের সমস্যাগুলি নিউরাল নেটওয়ার্ক সলিউশনে অনুবাদ করতে পারি তা বুঝতে সক্ষম হয়েছি।
উদাহরণস্বরূপ, অ্যাডাম গিটিজি উদাহরণ হিসাবে ব্যবহার করে, একটি বাড়ির দামের পূর্বাভাস সিস্টেম যেখানে শয়নকক্ষের সংখ্যা , বর্গ সহ একটি ডেটা সেট দেওয়া হয় । ফুট , প্রতিবেশী এবং বিক্রয় মূল্য আপনি কোনও নিউরাল নেটওয়ার্ককে কোনও বাড়ির মূল্য অনুমান করতে সক্ষম করতে প্রশিক্ষণ দিতে পারেন। তবে তিনি কোডের কোনও সম্ভাব্য সমাধান বাস্তবায়নে অবিচল থাকেন। উদাহরণস্বরূপ, তিনি যে নিকটতম হন তা হ'ল মৌলিক একটি ফাংশন যা আপনি ওজন কীভাবে প্রয়োগ করবেন তা প্রদর্শন করে:
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
price = 0
# a little pinch of this
price += num_of_bedrooms * 1.0
# and a big pinch of that
price += sqft * 1.0
# maybe a handful of this
price += neighborhood * 1.0
# and finally, just a little extra salt for good measure
price += 1.0
return price
অন্যান্য সংস্থানগুলি গণিতগুলিতে আরও বেশি মনোযোগ নিবদ্ধ করে এবং একমাত্র বেসিক কোড উদাহরণটি আমি বুঝতে পেরেছিলাম যে আমি বুঝতে পেরেছি (অর্থাত্ এটি সমস্ত গাওয়া নয়, সমস্ত নাচের চিত্রের শ্রেণিবদ্ধকরণ কোডবেস) এমন একটি বাস্তবায়ন যা নিউরাল নেটওয়ার্ককে একটি এক্সওআর হতে প্রশিক্ষণ দেয় গেটটি কেবল 1 এবং 0 এর মধ্যে ডিল করে।
সুতরাং আমার জ্ঞানের এমন একটি ফাঁক আছে যা আমি কেবল পূরণ করতে পারি না। যদি আমরা বাড়ির দামের পূর্বাভাসের সমস্যায় ফিরে যাই তবে কীভাবে একজন নিউরাল নেটওয়ার্কে খাওয়ার জন্য ডেটা উপযুক্ত করে? উদাহরণ স্বরূপ:
- শয়নকক্ষের সংখ্যা: 3
- বর্গ। পা: 2000
- প্রতিবেশী: নরমালটাউন
- বিক্রয় মূল্য: $ 250,000
সংখ্যার কারণে আপনি কেবল নিউরাল নেটওয়ার্কে সরাসরি 3 এবং 2000 খাওয়াতে পারেন ? বা এগুলি কি অন্য কিছুতে রূপান্তর করার দরকার আছে? একইভাবে নরমালটাউনের মান সম্পর্কে কী বলা যায় , এটি একটি স্ট্রিং, কীভাবে আপনি নিউরাল নেটওয়ার্ক বুঝতে পারে এমন একটি মান হিসাবে এটি অনুবাদ করতে যায়? আপনি কি কেবল সূচকের মতো একটি সংখ্যা বাছাই করতে পারবেন যতক্ষণ না এটি পুরো ডেটা জুড়ে থাকে?
স্নায়বিক নেটওয়ার্কের বেশিরভাগ উদাহরণ আমি দেখেছি স্তরগুলির মধ্যে পাসের সংখ্যাটি হয় 0 থেকে 1 বা -1 থেকে 1 হয়। সুতরাং প্রক্রিয়া শেষে আপনি কীভাবে আউটপুট মানটিকে ব্যবহারযোগ্য কিছুতে 185,000 ডলারে রূপান্তর করবেন ?
আমি জানি যে বাড়ির দামের পূর্বাভাসের উদাহরণটি সম্ভবত বিশেষত কার্যকর সমস্যা নয় যে এটি মাত্র তিনটি ডাটা পয়েন্টে ব্যাপকভাবে ছড়িয়ে দেওয়া হয়েছে। তবে আমি কেবল অনুভব করি যে আমি যদি এই প্রতিবন্ধকতাটি অতিক্রম করতে পারি এবং একটি চূড়ান্ত প্রাথমিক অ্যাপটি লিখতে পারি যে ট্রেনগুলি ছদ্ম বাস্তব জীবনের ডেটা ব্যবহার করে এবং একটি ছদ্ম বাস্তব জীবনের উত্তর ছুঁড়ে দেয় তবে আমি এর পেছনটি ভেঙে ফেলেছিলাম এবং লাথি মারতে সক্ষম হব চালু করুন এবং মেশিন লার্নিংয়ের আরও তদন্ত করুন।