লিনিয়ার রিগ্রেশন জন্য গ্রেডিয়েন্ট বংশদ্ভুত ব্যবহারের মূল কারণ হ'ল গণনা সংক্রান্ত জটিলতা: কিছু ক্ষেত্রে গ্রেডিয়েন্ট বংশদ্ভুত ব্যবহার করে সমাধানটি সন্ধান করার জন্য এটি গণনাগতভাবে সস্তা (দ্রুত) হয়।
আপনি যে সূত্রটি লিখেছেন তা দেখতে খুব সহজ, এমনকি গণনামূলকভাবে দেখায়, কারণ এটি কেবল ইউনিভারিয়েট ক্ষেত্রে ক্ষেত্রে কাজ করে, যখন আপনার কেবলমাত্র একটি পরিবর্তনশীল থাকে। বহুচলকীয় ক্ষেত্রে, আপনি অনেক ভেরিয়েবল আছে, সূত্র কাগজে সামান্য বেশি জটিল এবং প্রয়োজন অনেক বেশি গণনার যখন আপনি সফ্টওয়্যার তা বাস্তবায়ন:
এখানে, আপনি ম্যাট্রিক্স গণনা করতে হবে তারপরে এটিকে দিন (নীচের নোটটি দেখুন)। এটি একটি ব্যয়বহুল হিসাব। আপনার রেফারেন্সের জন্য, (নকশা) ম্যাট্রিক্স এক্স-এর কে + 1 কলাম রয়েছে যেখানে কে অনুমানকারীদের সংখ্যা এবং পর্যবেক্ষণগুলির N সারি রয়েছে। মেশিন লার্নিং অ্যালগরিদমটিতে আপনি কে> 1000 এবং এন> 1,000,000 দিয়ে শেষ করতে পারেন। ম্যাট্রিক্স নিজেই গণনা করতে একটু সময় লাগে, তারপর আপনি invert আছেএক্স ′ এক্স এক্স ′ এক্স কে × কে
β=(X′X)−1X′Y
X′XX′XK×K ম্যাট্রিক্স - এটি ব্যয়বহুল।
সুতরাং, গ্রেডিয়েন্ট বংশোদ্ভূত গণনাগুলিতে প্রচুর সময় সাশ্রয় করতে দেয়। তদুপরি, এটির কাজটি তুচ্ছ সমান্তরালকরণের অনুমতি দেয়, অর্থাত একাধিক প্রসেসর বা মেশিনে গণনাগুলি বিতরণ করে। লিনিয়ার বীজগণিত সমাধানটিও সমান্তরাল হতে পারে তবে এটি আরও জটিল এবং এখনও ব্যয়বহুল।
অতিরিক্ত হিসাবে, গ্রেডিয়েন্ট বংশোদ্ভূত সংস্করণগুলি রয়েছে যখন আপনি মেমরিতে কেবলমাত্র আপনার ডেটার টুকরো রাখেন, কম্পিউটার মেমোরির প্রয়োজনীয়তাগুলি কম করে। সামগ্রিকভাবে, অতিরিক্ত বড় সমস্যার জন্য এটি লিনিয়ার বীজগণিত সমাধানের চেয়ে বেশি দক্ষ।
আপনার যখন মেশিন লার্নিংয়ের মতো হাজারো ভেরিয়েবল থাকে তখন এটি মাত্রা বৃদ্ধির সাথে সাথে আরও গুরুত্বপূর্ণ হয়ে ওঠে।
মন্তব্য । এনজি এর বক্তৃতাগুলিতে গ্রেডিয়েন্ট বংশোদ্ভূত দিকে কতটা মনোযোগ দেওয়া হচ্ছে তা দেখে আমি অবাক হয়েছি। তিনি এ বিষয়ে কথা বলার ক্ষেত্রে অযৌক্তিক সময় ব্যয় করেন, সম্ভবত পুরো কোর্সের 20%। আমার কাছে এটি কেবল একটি বাস্তবায়ন বিশদ, আপনি ঠিক কীভাবে সর্বোত্তমটি খুঁজে পান এটি। কীটি অপ্টিমাইজেশান সমস্যাটি তৈরি করতে এবং আপনি কীভাবে এটি সঠিকভাবে খুঁজে পেয়েছেন তা অযৌক্তিক। আমি এ নিয়ে খুব বেশি চিন্তা করব না। এটিকে কম্পিউটার বিজ্ঞানের লোকদের কাছে ছেড়ে দিন এবং একজন পরিসংখ্যানবিদ হিসাবে আপনার কাছে কী গুরুত্বপূর্ণ on
আমি এই বলে যে এটা সত্যিই হয় যোগ্যতা অর্জন করতে হবে বলেন বুঝতে গুরুত্বপূর্ণ গণনীয় জটিলতা এবং সংখ্যাসূচক স্থায়িত্ব সমাধান আলগোরিদিম। আমি এখনও মনে করি না যে আপনাকে অবশ্যই অ্যালগরিদমের বাস্তবায়ন এবং কোডের বিশদ জানতে হবে। সাধারণত পরিসংখ্যানবিদ হিসাবে এটি আপনার সময়ের সেরা ব্যবহার নয়।
নোট 1 । আমি লিখেছিলাম যে আপনাকে ডেট্যাকটিক উদ্দেশ্যে ম্যাট্রিক্সটি উল্টাতে হবে এবং আপনি সাধারণত সমীকরণটি সমাধান করেন না এমনটি হয় না। অনুশীলনে, লিনিয়ার বীজগণিত সমস্যাগুলি QR এর মতো এক ধরণের ফ্যাক্টেরাইজেশন ব্যবহার করে সমাধান করা হয়, যেখানে আপনি সরাসরি ম্যাট্রিক্সটি উল্টান না তবে উত্তর পেতে কিছু অন্যান্য গাণিতিক সমতুল্য ম্যানিপুলেশন করেন। আপনি এটি করছেন কারণ ম্যাট্রিক্স বিপরীকরণ একটি ব্যয়বহুল এবং সংখ্যাগতভাবে অস্থির অপারেশন।
পার্শ্ব প্রতিক্রিয়া হিসাবে গ্রেডিয়েন্ট বংশদ্ভুত অ্যালগরিদমের আরও কিছুটা সুবিধা এনেছে: এটি যখন ডিজাইন ম্যাট্রিক্সে কোলাইনারিটির সমস্যা রয়েছে তখনও এটি কাজ করে। স্বাভাবিক লিনিয়ার বীজগণিতের পথটি ফুঁ দিয়ে উঠবে এবং গ্রেডিয়েন্ট বংশোদ্ভূত কলিনিয়ার পূর্বাভাসকারীদের জন্য এমনকি চলতে থাকবে।