প্রশ্ন ট্যাগ «deep-learning»

মেশিন লার্নিং গবেষণার একটি নতুন ক্ষেত্র যা মূলত গভীর নিউরাল নেটওয়ার্কগুলি (যেমন দুটি বা আরও বেশি গোপন স্তরযুক্ত নেটওয়ার্কগুলি) দ্বারা সম্পন্ন করা হয় তথ্যের ডায়াগ্রামালিকাল উপস্থাপনা শেখার জন্য ব্যবহৃত প্রযুক্তিগুলির সাথে সম্পর্কিত, তবে কোনও প্রকার সম্ভাব্য গ্রাফিকাল মডেলগুলির সাথেও।

5
নিউরাল নেটওয়ার্কগুলিতে "ডাইং রিলু" সমস্যাটি কী?
ভিজ্যুয়াল স্বীকৃতির জন্য কনভলিউশনাল নিউরাল নেটওয়ার্কগুলিতে স্ট্যানফোর্ড কোর্সের নোটগুলি উল্লেখ করে একটি অনুচ্ছেদ বলে: "দুর্ভাগ্যক্রমে, প্রশিক্ষণ চলাকালীন রিলু ইউনিটগুলি ভঙ্গুর হতে পারে এবং" মরা "হতে পারে For উদাহরণস্বরূপ, আরএলইউ নিউরনের মধ্য দিয়ে প্রবাহিত একটি বৃহত্তর গ্রেডিয়েন্ট ওজনকে এমনভাবে আপডেট করতে পারে যে নিউরনটি আর কোনও ডেটাপয়েন্টে আবার সক্রিয় না হয় …

6
কখন এলএসটিএম-এর উপর জিআরইউ ব্যবহার করবেন?
একটি জিআরইউ এবং এলএসটিএমের মধ্যে মূল পার্থক্যটি হ'ল জিআরইউতে দুটি গেট রয়েছে ( রিসেট এবং আপডেট গেটস) যেখানে একটি এলএসটিএমের তিনটি গেট রয়েছে (যথা ইনপুট , আউটপুট এবং ভুলে যাওয়া গেট)। এলএসটিএম মডেলটির (যেমন আমাদের তিনটি গেট রয়েছে) মাধ্যমে নেটওয়ার্কে স্পষ্টভাবে আরও নিয়ন্ত্রণ থাকে আমরা কেন জিআরইউ ব্যবহার করব? কোন …

8
শিক্ষার হার নির্বাচন করা
আমি বর্তমানে স্টোচাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূতিকে বাস্তবায়ন করার জন্য কাজ করছি, SGDব্যাক-বর্ধন ব্যবহার করে নিউরাল জালগুলির জন্য, এবং আমি এর উদ্দেশ্য বুঝতে গিয়ে শিখার হারের জন্য মানগুলি কীভাবে বেছে নেব সে সম্পর্কে আমার কিছু প্রশ্ন রয়েছে। শেখার হারটি কী ত্রুটির গ্রেডিয়েন্টের আকারের সাথে সম্পর্কিত, যেমন এটি বংশোদ্ভূত হারকে নির্দেশ করে? যদি …

15
আপনি কীভাবে নিউরাল নেটওয়ার্ক আর্কিটেকচারটি ভিজ্যুয়ালাইজ করবেন?
স্নায়ুবিক নেটওয়ার্ক সম্পর্কিত একটি বিষয় সম্পর্কে একটি কাগজ লেখার / উপস্থাপনা করার সময়, কেউ সাধারণত নেটওয়ার্ক আর্কিটেকচারটি ভিজ্যুয়ালাইজ করে। সাধারণ স্থাপত্যগুলি স্বয়ংক্রিয়ভাবে দেখার জন্য ভাল / সহজ উপায়গুলি কী কী?

5
ডিপ লার্নিং নেটওয়ার্ক আর্কিটেকচার ডায়াগ্রামগুলি কীভাবে আঁকবেন?
আমি আমার মডেল তৈরি করেছি। এখন আমি আমার গবেষণা কাগজের জন্য নেটওয়ার্ক আর্কিটেকচার ডায়াগ্রাম আঁকতে চাই। উদাহরণ নীচে দেখানো হয়েছে:

5
আরিমা বনাম এলএসটিএম ব্যবহার করে টাইম সিরিজের ভবিষ্যদ্বাণী
আমি যে সমস্যাটি নিয়ে কাজ করছি তা হ'ল সময় সিরিজের মানগুলির পূর্বাভাস। আমি এক সময় এক সময় সিরিজ দেখছি এবং উদাহরণস্বরূপ ইনপুট ডেটার 15% এর উপর ভিত্তি করে, আমি এর ভবিষ্যতের মানগুলি পূর্বাভাস দিতে চাই। এখন পর্যন্ত আমি দুটি মডেল জুড়ে এসেছি: LSTM (দীর্ঘ স্বল্পমেয়াদী মেমরি; পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলির একটি …

2
ইউনিফর্ম আরম্ভের মাধ্যমে কখন (তিনি বা গ্লোরোট) সাধারণ সূচনা ব্যবহার করবেন? এবং ব্যাচ সাধারণকরণের সাথে এর প্রভাবগুলি কী কী?
আমি জানতাম যে রেসিডুয়াল নেটওয়ার্ক (রেসনেট) তাকে স্বাভাবিক প্রাথমিককরণ জনপ্রিয় করেছে। রেসনেটে, তিনি সাধারণ সূচনা ব্যবহৃত হয় , যখন প্রথম স্তরটি তিনি অভিন্ন সূচনা ব্যবহার করে। আমি রেসনেট পেপার এবং "ডেলিভিং ডিপ ইন রেকটিফায়ার্স" পেপার (তিনি ইনিশিয়ালাইজেশন পেপার) দিয়ে দেখেছি, তবে সাধারণ থিমের তুলনায় ইউনিফর্ম ডিআইআই-তে কোনও উল্লেখ পাইনি। এছাড়াও: …

3
কীভাবে গভীর স্নায়ুর জালে আন্ডারফিটিংয়ের লড়াই করা যায়
যখন আমি কৃত্রিম নিউরাল নেটওয়ার্কগুলি (এনএন) দিয়ে শুরু করেছি তখন আমি ভেবেছিলাম যে আমাকে মূল সমস্যা হিসাবে ওভারফিটিংয়ের সাথে লড়াই করতে হবে। তবে অনুশীলনে আমি আমার এনএনকে 20% ত্রুটি হারের বাধা পেরিয়ে আনতে পারি না। আমি এলোমেলো বনেও আমার স্কোরকে হারাতে পারি না! আমি কোনও এনএনএনকে ডেটাতে ট্রেন্ড ক্যাপচার শুরু …

3
একটি এলএসটিএম মডেলের পরামিতিগুলির সংখ্যা
একটি একক স্ট্যাকড এলএসটিএম এর কতটি পরামিতি রয়েছে? প্যারামিটারের সংখ্যা প্রয়োজনীয় প্রশিক্ষণের উদাহরণগুলির সংখ্যার উপর কম চাপ দেয় এবং প্রশিক্ষণের সময়কেও প্রভাবিত করে। সুতরাং প্যারামিটারের সংখ্যা জানার জন্য এলএসটিএম ব্যবহার করে প্রশিক্ষণের মডেলগুলি কার্যকর।

4
টাইম সিরিজ মডেল এলএসটিএম-এ বৈশিষ্ট্য যুক্ত করা হচ্ছে
সময় সিরিজের জন্য এলএসটিএম এর ব্যবহার এবং তাদের ব্যবহার সম্পর্কে কিছুটা পড়ছি এবং এটি একই সময়ে আকর্ষণীয় তবে কঠিন ছিল। আমার বুঝতে সমস্যা হয়েছে এমন একটি বিষয় হ'ল ইতিমধ্যে টাইম সিরিজের বৈশিষ্ট্যগুলির তালিকায় থাকা অতিরিক্ত বৈশিষ্ট্যগুলি যুক্ত করার পদ্ধতি। ধরে নিচ্ছি আপনার নিজের ডেটাসেটটি এভাবে রয়েছে: টি-3, টি-2, টি-1, আউটপুট …

4
সমস্ত প্রশিক্ষণের ডেটা সহ মিনি ব্যাচের আকার কেন একক "ব্যাচ" এর চেয়ে ভাল?
আমি প্রায়শই পড়েছি যে ডিপ লার্নিং মডেলগুলির ক্ষেত্রে নিয়মিত অনুশীলনটি হ'ল বিভিন্ন প্রশিক্ষণ পর্বগুলির উপরে মিনি ব্যাচগুলি (সাধারণত একটি ছোট, 32/64) প্রয়োগ করা। আমি এর পিছনে কারণটি সত্যই বুঝতে পারি না। আমি ভুল না হলে ব্যাচের আকারটি প্রশিক্ষণের পুনরাবৃত্তি চলাকালীন মডেলটির দ্বারা দেখা ট্রেনিংয়ের সংখ্যা; এবং প্রশিক্ষণের প্রতিটি উদাহরণ যখন …

3
কেরাসে ব্যাচ_সাইজের ফলাফলের মানের কোনও প্রভাব আছে?
আমি প্রায় ২-৩ মিলিয়ন নিবন্ধ নিয়ে একটি বড় এলএসটিএম নেটওয়ার্ক প্রশিক্ষণ দিতে চলেছি এবং মেমোরি ত্রুটিগুলির সাথে লড়াই করছি (আমি এডাব্লুএস ইসি 2 জি 2 এক্স 2 লার্জ ব্যবহার করি)। আমি খুঁজে পেয়েছি যে একটি সমাধান হ'ল হ্রাস করা batch_size। তবে, আমি নিশ্চিত নই যে এই পরামিতিটি কেবল মেমরি দক্ষতার …

3
"অনুবাদে সমতুল্য" এবং "অনুবাদে আক্রমণকারী" এর মধ্যে পার্থক্য কী?
আমি কষ্ট মধ্যে পার্থক্য বুঝতে হচ্ছে অনুবাদটি equivariant এবং অনুবাদটি পরিবর্তিত । ডিপ লার্নিং বইটিতে । এমআইটি প্রেস, ২০১ ((আই। গুডফেলো, এ। করভিল, এবং ওয়াই। বেনজিও), কেউ কনভলশনাল নেটওয়ার্কগুলিতে খুঁজে পেতে পারেন: [...] প্যারামিটার ভাগ করে নেওয়ার নির্দিষ্ট ফর্মটির কারণে স্তরটির একটি সমান সম্পত্তি হিসাবে অনুবাদ হয় called [...] পুলিং …

13
তথ্য বিজ্ঞান সম্পর্কিত মজার উদ্ধৃতি
বিভিন্ন সম্প্রদায়ের ব্যবহারকারীদের তাদের ক্ষেত্রগুলি সম্পর্কে মজার বিষয় উদ্ধৃত করার প্রচলন রয়েছে। মেশিন লার্নিং, ডিপ লার্নিং, ডেটা সায়েন্স এবং আপনি প্রতিদিন যে জিনিসগুলির মুখোমুখি হন সেগুলি সম্পর্কে আপনার মজাদার জিনিসগুলি ভাগ করে নেওয়া মজাদার হতে পারে!

6
ক্রস-এনট্রপি লোকসানের ব্যাখ্যা
ধরুন আমি শ্রেণিবিন্যাসের জন্য একটি এনএন তৈরি করি। শেষ স্তরটি সফটম্যাক্স অ্যাক্টিভেশন সহ একটি ঘন স্তর। শ্রেণিবদ্ধ করার জন্য আমার পাঁচটি আলাদা ক্লাস রয়েছে। ধরুন, একক প্রশিক্ষণের উদাহরণ হিসাবে, ভবিষ্যদ্বাণীগুলি true labelহ'ল । এই উদাহরণটির জন্য আমি ক্রস এনট্রপি ক্ষতি কীভাবে গণনা করব?[1 0 0 0 0][0.1 0.5 0.1 0.1 …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.