তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
বড় ডেটা কেস স্টাডি বা কেস উদাহরণ ব্যবহার করুন
আমি প্রচুর ব্লগ পড়েছি different বিভিন্ন ধরণের শিল্প কীভাবে বিগ ডেটা অ্যানালিটিক ব্যবহার করছে সে সম্পর্কে নিবন্ধ। তবে এই নিবন্ধগুলির বেশিরভাগই উল্লেখ করতে ব্যর্থ এই সংস্থাগুলি কী কী ডেটা ব্যবহার করেছিল। তথ্য আকার ছিল কি ডেটা প্রক্রিয়া করার জন্য তারা কী ধরণের সরঞ্জাম প্রযুক্তি ব্যবহার করেছিল তারা কী সমস্যার মুখোমুখি …

5
ড্রপআউট মডেল থেকে কিছু নিউরনকে দমন করে, কেন একটি ড্রপআউট স্তর যুক্ত গভীর / মেশিন লার্নিং কর্মক্ষমতা উন্নত করে?
যদি কিছু নিউরোন অপসারণের ফলে আরও ভাল পারফরম্যান্স মডেল আসে, তবে প্রথম স্তরটিতে কম স্তর এবং কম নিউরন সহ একটি সরল নিউরাল নেটওয়ার্ক ব্যবহার করবেন না কেন? কেন প্রথমদিকে আরও বড়, আরও জটিল মডেল তৈরি করেন এবং এর অংশগুলি পরে দমন করেন?

3
গ্রাফ এম্বেডিং কি?
আমি সম্প্রতি ডিপওয়াক এবং লাইন হিসাবে গ্রাফ এম্বেডিং জুড়ে এসেছি। তবে গ্রাফ এম্বেডিং বলতে কী বোঝায় এবং কখন এটি ব্যবহার করতে হবে (অ্যাপ্লিকেশনগুলি) তা এখনও আমার কাছে পরিষ্কার ধারণা নেই? কোন পরামর্শ স্বাগত!
13 graphs 

3
মাত্রা হ্রাস সমান্তরাল জন্য স্বয়ংক্রিয় কোডার্স কেন?
আমি কোনও উপায়ে অটোরকোডার বা নিউরাল নেটওয়ার্কগুলির বিশেষজ্ঞ নই, সুতরাং যদি এটি নির্বোধ প্রশ্ন হয় তবে আমাকে ক্ষমা করুন। হাই ডাইমেনশনাল ডেটাতে মাত্রা হ্রাস বা দৃশ্যমান ক্লাস্টারগুলির উদ্দেশ্যে, আমরা দুটি নোডের সাহায্যে নেটওয়ার্ক স্তরটির আউটপুট পরিদর্শন করে একটি (ক্ষতিগ্রস্ত) 2 মাত্রিক প্রতিনিধিত্ব তৈরি করতে একটি অটোরকোডার ব্যবহার করতে পারি। উদাহরণস্বরূপ, …

3
কেন কনভোলশানগুলি সর্বদা বিজোড় সংখ্যাগুলি ফিল্টার_ আকার হিসাবে ব্যবহার করে
যদি আমাদের সিএনএন (কনভনেট) ব্যবহার করে প্রকাশিত কাগজগুলির 90-99%% তে নজর থাকে। তাদের মধ্যে বেশিরভাগই বিজোড় সংখ্যার ফিল্টার আকার ব্যবহার করেন: সর্বাধিক ব্যবহৃত হওয়ার জন্য {1, 3, 5, 7।। এই পরিস্থিতিটি কিছু সমস্যার সৃষ্টি করতে পারে: এই ফিল্টার আকারগুলির সাথে সাধারণত কনভলিউশন অপারেশন 2 (সাধারণ প্যাডিং) এর প্যাডিংয়ের সাথে নিখুঁত …

2
ওজন এবং পক্ষপাতের সূচনা কেন 0-এর কাছাকাছি বেছে নেওয়া উচিত?
আমি এটি পড়েছি: আমাদের নিউরাল নেটওয়ার্কটি প্রশিক্ষণের জন্য, আমরা প্রতিটি প্যারামিটার ডাব্লু (এল) ইজভিজ (এল) এবং প্রতিটি খ (এল) আইবি (l) শূন্যের নিকটে একটি ছোট এলোমেলো মান থেকে শুরু করব (সাধারণ (0, ϵ2) অনুযায়ী স্বাভাবিক (0) , ϵ2) কিছু ছোট distribution এর জন্য বিতরণ, 0.01 বলুন) ব্যাকপ্রপাগেশন অ্যালগরিদমের 7 ম …

3
স্নায়ুবহুল নেটওয়ার্কগুলির কি সিদ্ধান্ত গাছের মতো ব্যাখ্যাযোগ্যতা রয়েছে?
সিদ্ধান্ত গাছগুলিতে, আমরা গাছের কাঠামোর আউটপুট বুঝতে পারি এবং কীভাবে সিদ্ধান্ত গাছ সিদ্ধান্ত নেয় তা আমরা কল্পনাও করতে পারি। সুতরাং সিদ্ধান্ত গাছগুলির ব্যাখ্যাযোগ্যতা রয়েছে (তাদের আউটপুট সহজেই ব্যাখ্যা করা যায়)) সিদ্ধান্ত গাছের মতো নিউরাল নেটওয়ার্কগুলিতে কি আমাদের ব্যাখ্যাযোগ্যতা রয়েছে?

1
পক্ষপাত কীভাবে আরম্ভ এবং নিয়মিত করা উচিত?
আমি কার্নেল ইনিশিয়ালাইজেশন সম্পর্কে বেশ কয়েকটি কাগজ পড়েছি এবং অনেকগুলি কাগজে উল্লেখ করা হয়েছে যে তারা কার্নেলের L2 নিয়মিতকরণ ব্যবহার করে (প্রায়শই )।λ=0.0001λ=0.0001\lambda = 0.0001 ধ্রুব শূন্যের সাথে পক্ষপাতিত্ব শুরু করা এবং এটি নিয়মিত না করা ছাড়া কি কেউ আলাদা কিছু করে? কার্নেল প্রারম্ভিককরণের কাগজপত্র মিশকিন ও মাতাস: আপনার যা …

1
ডিপ লার্নিংয়ে 1D কনভোলিউশনাল স্তর কী?
আমার 2 ডি বা 3 ডি বাস্তবায়নের ক্ষেত্রে ইমেজ প্রসেসিংয়ের জন্য ডিপ লার্নিংয়ে কনভোলশনাল স্তরগুলির ভূমিকা এবং প্রক্রিয়া সম্পর্কে ভাল ধারণা রয়েছে - তারা "সহজভাবে" চিত্রগুলিতে 2 ডি প্যাটার্ন ধরার চেষ্টা করে (3 ডি ক্ষেত্রে ক্ষেত্রে 3 চ্যানেলে)। তবে সম্প্রতি আমি প্রাকৃতিক ভাষা প্রক্রিয়াজাতকরণের প্রসঙ্গে 1D কনভ্যুশনাল স্তরগুলিতে ঝাঁপিয়েছি, যা …

1
একটি পুনরাবৃত্তি নিউরাল নেটওয়ার্ক (আরএনএন) এ স্তরটি ভুলে যান -
আমি ভুলে যাওয়া স্তরটিতে একটি আরএনএন-এ প্রতিটি ভেরিয়েবলের মাত্রাগুলি বের করার চেষ্টা করছি, তবে আমি নিশ্চিত নই যে আমি সঠিক পথে রয়েছি কিনা। পরের ছবি এবং সমীকরণটি কোলার ব্লগ পোস্ট "বোঝার এলএসটিএম নেটওয়ার্কগুলি" থেকে : কোথায়: এম ∗ 1এক্সটিxtx_t হ'ল আকারের ভেক্টরের ইনপুটমি * 1m∗1m*1 এন ∗ 1জটি - 1ht−1h_{t-1} …

3
ক্রস-বৈধতার পরে শ্রেণিবদ্ধকারী কীভাবে চয়ন করবেন?
যখন আমরা কে-ফোল্ড ক্রস বৈধকরণ করি, তখন কি আমাদের কেবল শ্রেণিবদ্ধ ব্যবহার করা উচিত যা সর্বোচ্চ পরীক্ষার নির্ভুলতা রয়েছে? ক্রস বৈধতা থেকে শ্রেণিবদ্ধকারী পেতে সাধারণত সর্বোত্তম পদ্ধতির কী?

1
একটি হট এনকোডিং এবং একটি এনকোডিং ছেড়ে দেওয়ার মধ্যে পার্থক্য কী?
আমি একটি উপস্থাপনাটি পড়ছি এবং এটি একটি ছাড়ার এনকোডিং ব্যবহার না করার পরামর্শ দিচ্ছে, তবে এটি একটি গরম এনকোডিং সহ ঠিক আছে। আমি ভেবেছিলাম তারা দুজনই এক রকম ছিল। তাদের মধ্যে পার্থক্য কি কেউ বর্ণনা করতে পারেন?

4
আমরা কী ওয়ার্ড টুভেক মডেলদের প্রশিক্ষণ দেওয়ার সময় ট্রান্সফার শেখার সুবিধাটি নিতে পারি?
আমি গুগল নিউজ ডেটা ইত্যাদির মতো ইতিমধ্যে প্রশিক্ষিত মডেলগুলির প্রাক-প্রশিক্ষিত ওজনগুলি সন্ধান করতে চাই I সুতরাং, আমি স্থানান্তর শেখার থেকে সুবিধা নিতে চাই যাতে আমি প্রাক-প্রশিক্ষিত স্তর ওজন পেতে এবং আমার ডোমেনের নির্দিষ্ট শব্দগুলিতে সেই ওজনগুলি পুনরায় প্রশিক্ষণ করতে সক্ষম হতে পারি। সুতরাং, অবশ্যই প্রশিক্ষণে তুলনামূলকভাবে কম সময় লাগবে। যে …

2
নৈতিক ও ব্যয়বহুলভাবে স্কেলিং ডেটা স্ক্র্যাপগুলি
জীবনের কিছু জিনিস আমাকে ইন্টারনেট থেকে কাঠামোগত এবং কাঠামোগত ডেটা স্ক্র্যাপ করা এবং এটি আমার মডেলগুলিতে ব্যবহার করার মতো আনন্দ দেয়। উদাহরণস্বরূপ, ডেটা সায়েন্স টুলকিট (বা RDSTKআর প্রোগ্রামারদের জন্য) আমাকে আইপি বা ঠিকানা ব্যবহার করে প্রচুর ভাল অবস্থান-ভিত্তিক ডেটা টানতে দেয় এবং tm.webmining.pluginআর এর tmপ্যাকেজটির জন্য আর্থিক এবং নিউজ ডেটা …

3
মিশ্র প্রকারের বৈশিষ্ট্য সহ ডেটাसेटগুলিকে শ্রেণিবদ্ধ করার সর্বোত্তম উপায়
আমি জানতে চাই মিশ্রিত ধরণের বৈশিষ্ট্যের সমন্বয়ে ডেটা সেটকে শ্রেণিবদ্ধ করার সর্বোত্তম উপায় কী, উদাহরণস্বরূপ, পাঠ্য এবং সংখ্যাসূচক। আমি জানি যে আমি পাঠ্যকে বুলেয়ানে রূপান্তর করতে পারি, তবে শব্দভান্ডারটি বৈচিত্র্যময় এবং ডেটা খুব বিচ্ছিন্ন হয়ে যায়। আমি পৃথক বৈশিষ্ট্যের ধরণগুলি পৃথকভাবে শ্রেণিবদ্ধ করার চেষ্টা করেছি এবং মেটা-শিখার কৌশলগুলির মাধ্যমে ফলাফলগুলি …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.