তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

6
ফিচার ইঞ্জিনিয়ারিংয়ের জন্য কি কোনও সরঞ্জাম আছে?
বিশেষত আমি যা খুঁজছি তা হ'ল কিছু কার্যকারিতা সহ সরঞ্জাম যা ইঞ্জিনিয়ারিং বৈশিষ্ট্যযুক্ত। আমি সহজেই মসৃণ করতে, কল্পনা করতে, ফাঁকগুলি পূরণ করতে সক্ষম হতে চাই, এমএস এক্সেলের অনুরূপ কিছু, তবে এতে ভিবির পরিবর্তে অন্তর্নিহিত ভাষা হিসাবে আর রয়েছে।

4
পরবর্তী সমঝোতার স্তরগুলি কীভাবে কাজ করবে?
এই প্রশ্নটি "কীভাবে কনভলিউশন স্তরগুলি ঠিক কাজ করে তা উত্সাহিত করে । ধরুন আমার কাছে একটি গ্রেস্কেল চিত্র রয়েছে। সুতরাং চিত্রটির একটি চ্যানেল রয়েছে। প্রথম স্তরে, আমি ফিল্টার এবং প্যাডিংয়ের সাথে কনভলিউশন প্রয়োগ করি । তারপর আমি সাথে অন্য সংবর্তন স্তর রয়েছে convolutions এবং ফিল্টার। আমার কাছে কতগুলি বৈশিষ্ট্যের মানচিত্র …

4
অত্যন্ত ভারসাম্যহীন ডেটা সেট প্রশিক্ষণের জন্য দ্রুত গাইড
প্রশিক্ষণ সেটটিতে প্রায় 1000 ইতিবাচক এবং 10000 নেতিবাচক নমুনাগুলির সাথে আমার একটি শ্রেণিবদ্ধকরণ সমস্যা রয়েছে। সুতরাং এই ডেটা সেটটি বেশ ভারসাম্যহীন। সরল এলোমেলো বন কেবল সমস্ত পরীক্ষার নমুনাকে সংখ্যাগরিষ্ঠ শ্রেণি হিসাবে চিহ্নিত করার চেষ্টা করছে। সাব-স্যাম্পলিং এবং ওজনযুক্ত এলোমেলো বন সম্পর্কে কিছু ভাল উত্তর এখানে দেওয়া হয়েছে: উচ্চ পক্ষপাতদুষ্ট ডেটাসেটের …

6
কীভাবে বড় ডেটা সহ এসভিডি এবং পিসিএ করবেন?
আমার কাছে প্রচুর ডেটা রয়েছে (প্রায় 8 জিবি)। আমি এটি বিশ্লেষণ করতে মেশিন লার্নিং ব্যবহার করতে চাই। সুতরাং, আমি মনে করি দক্ষতার জন্য ডেটা মাত্রিকতা হ্রাস করার জন্য আমার এসভিডি তখন পিসিএ ব্যবহার করা উচিত। তবে ম্যাটল্যাব এবং অকটাভ এত বড় ডেটাসেট লোড করতে পারে না। এত বড় ডেটা দিয়ে …

3
নিউরাল নেটওয়ার্ক প্রশিক্ষণের জন্য সিপিইউ এবং জিপিইউয়ের মধ্যে নির্বাচন করা
আমি একটি জিপিইউর 'ওভারহেড' সম্পর্কে আলোচনা দেখেছি এবং এটি 'ছোট' নেটওয়ার্কগুলির জন্য, কোনও জিপিইউর তুলনায় সিপিইউতে (বা সিপিইউগুলির নেটওয়ার্ক) প্রশিক্ষণ দেওয়া আসলে দ্রুততর হতে পারে। 'ছোট' বলতে কী বোঝায়? উদাহরণস্বরূপ, 100 লুকানো ইউনিট সহ একটি একক স্তর এমএলপি 'ছোট' হবে? আমাদের সংক্ষিপ্ত সংজ্ঞাটি কি পুনরাবৃত্ত স্থপতিগুলির জন্য পরিবর্তিত হয়? সিপিইউ …

3
শ্রেণিবদ্ধ ডেটা ফর্ম্যাট। বিকল্প ফরম্যাটের তুলনায় সুবিধা কী কী?
এইচডিএফ-এ ডেটা সংরক্ষণ করার মূল সুবিধা কী? এবং এইচডিএফ সত্যিই উপযুক্ত এবং দরকারী যেখানে প্রধান তথ্য বিজ্ঞান কাজগুলি কি?

4
নিউরাল নেটওয়ার্ক পার্সিং স্ট্রিং ডেটা?
সুতরাং, আমি কেবল শিখতে শুরু করছি যে কোনও নিউরাল নেটওয়ার্ক কীভাবে নিদর্শনগুলি সনাক্ত করতে এবং ইনপুটগুলিকে শ্রেণীবদ্ধ করতে কাজ করতে পারে এবং আমি দেখেছি কীভাবে একটি কৃত্রিম নিউরাল নেটওয়ার্ক চিত্রের ডেটা পার্স করতে এবং চিত্রগুলিকে ( কনফনেটজ সহ ডেমো ) শ্রেণিবদ্ধ করতে পারে এবং সেখানে কী প্রতিচ্ছবিটি নিম্নোক্ত করা এবং …

4
এসভিএম ও তার বিপরীতে র্যান্ডম ফরেস্ট কখন ব্যবহার করবেন?
যখন ব্যবহার করেন Random Forestবেশি SVMবিপরীতভাবে এবং ভাইস? আমি বুঝতে পারি যে cross-validationএবং মডেল তুলনা একটি মডেল চয়ন করার একটি গুরুত্বপূর্ণ দিক, তবে এখানে আমি দুটি পদ্ধতির থাম্ব এবং হিউরিস্টিক সম্পর্কিত নিয়ম সম্পর্কে আরও জানতে চাই to শ্রেণিবদ্ধের সূক্ষ্মতা, শক্তি এবং দুর্বলতাগুলির পাশাপাশি সমস্যাগুলির, যা তাদের প্রত্যেকের জন্য সবচেয়ে উপযুক্ত, …

4
পুনঃসূচনা তথ্যের উপর ভিত্তি করে কাজের শ্রেণিবদ্ধকরণ করতে আমার কোন অ্যালগরিদম ব্যবহার করা উচিত?
দ্রষ্টব্য যে আমি আর-তে সবকিছু করছি সমস্যা অনুসরণ হিসাবে: মূলত, আমার কাছে পুনঃসূচনাগুলির একটি তালিকা রয়েছে (সিভি)। কিছু প্রার্থীর আগে কাজের অভিজ্ঞতা থাকবে এবং কিছু না থাকুক। এখানে লক্ষ্যটি হ'ল: তাদের সিভিগুলির পাঠ্যের উপর ভিত্তি করে, আমি তাদের বিভিন্ন কাজের ক্ষেত্রে শ্রেণিবদ্ধ করতে চাই। আমি সেই ক্ষেত্রে বিশেষভাবে রয়েছি, যেখানে …

4
নতুন পর্যবেক্ষণ উপলব্ধ থাকলে কোনও মডেলকে পুনরায় প্রশিক্ষণ দেওয়া উচিত?
সুতরাং, আমি এই বিষয়ে কোনও সাহিত্যের সন্ধান করতে পারিনি তবে মনে হচ্ছে এটি একটি মূল্যবান মূল্য দেওয়ার মতো: নতুন পর্যবেক্ষণ উপলব্ধ থাকলে মডেল প্রশিক্ষণ এবং অনুকূলকরণের সেরা অনুশীলনগুলি কী কী? পূর্বাভাস হ্রাস শুরু হওয়ার আগে কোনও মডেল পুনরায় প্রশিক্ষণের সময়কাল / ফ্রিকোয়েন্সি নির্ধারণ করার কোনও উপায় আছে কি? সামগ্রিক ডেটার …

3
মাল্টিআউটপুট ক্লাসিফায়ার থেকে ভবিষ্যদ্বাণী_প্রবাহ বোঝা
র্যান্ডম ফরেস্ট মডেলটির সাথে একটি মাল্টিআউটপুট শ্রেণিবিন্যাস সম্পাদন করতে আমি বিজ্ঞানী-শিখার ওয়েবসাইটে এই উদাহরণটি অনুসরণ করছি । from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, n_classes=2, random_state=1) y2 = shuffle(y1, random_state=1) Y …

6
মডেল হাইপারপ্যারামিটার এবং মডেল পরামিতিগুলির মধ্যে পার্থক্য কী?
আমি লক্ষ করেছি যে মডেল হাইপারপ্যারামিটার এবং মডেল প্যারামিটারের মতো পদগুলি পূর্বের স্পষ্টতা ছাড়াই ওয়েবে আন্তঃব্যবহারযোগ্যভাবে ব্যবহৃত হয়েছে। আমি মনে করি এটি ভুল এবং এর ব্যাখ্যা দরকার। একটি মেশিন লার্নিং মডেল, একটি এসভিএম / এনএন / এনবি ভিত্তিক ক্লাসিফিকেটর বা চিত্র শনাক্তকারী বিবেচনা করুন, যা প্রথমে মনে পড়বে। মডেলের হাইপারপ্যারামিটার …

3
হাইপারটুনিং এক্সজিবিস্ট পরামিতি
শ্রেণিবদ্ধ এবং ধারাবাহিকভাবে নির্ভরশীল ভেরিয়েবল উভয়ের সাথে কাজ করার ক্ষেত্রে এক্সজিবিস্ট একটি দুর্দান্ত কাজ করে চলেছে। তবে, আমি কীভাবে এক্সজিবিস্ট সমস্যার জন্য অনুকূলিত পরামিতিগুলি নির্বাচন করব? সাম্প্রতিক কাগল সমস্যার জন্য আমি এইভাবে পরামিতি প্রয়োগ করেছি: param <- list( objective = "reg:linear", booster = "gbtree", eta = 0.02, # 0.06, #0.01, …
27 r  python  xgboost 

4
জ্যাকার্ড মিল এবং কোসিন মিলের জন্য অ্যাপ্লিকেশন এবং পার্থক্য
আইটেমের মিলের তুলনা করার সময় জ্যাকার্ডের মিল এবং কোসাইন মিল দুটি অত্যন্ত সাধারণ পরিমাপ। তবে কোন পরিস্থিতিতে কোনটির চেয়ে অন্যের চেয়ে ভাল হওয়া উচিত সে বিষয়ে আমি খুব বেশি পরিষ্কার নই। কেউ কি এই দুটি পরিমাপের পার্থক্য (সংজ্ঞা বা নীতিতে পার্থক্য, সংজ্ঞা বা গণনা নয়) এবং তাদের পছন্দসই প্রয়োগগুলি পরিষ্কার …
27 similarity 

1
আরএনএন এর একাধিক বৈশিষ্ট্য রয়েছে
আমার কাছে মেশিন লার্নিং অ্যালগরিদম (বেসিক র্যান্ডম ফরেস্ট এবং লিনিয়ার রিগ্রেশন টাইপ স্টাফ) এর সাথে কাজ করে কিছুটা স্ব-শিক্ষিত জ্ঞান রয়েছে। আমি ব্রাঞ্চ বের করে আর কেরাসের সাথে আরএনএন শিখতে শুরু করব। বেশিরভাগ উদাহরণগুলির দিকে তাকানোর সময়, যা সাধারণত স্টক পূর্বাভাসগুলিতে জড়িত থাকে, আমি 1 টি কলাম ব্যতীত বৈশিষ্ট্যটির তারিখ …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.