তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

8
পাইথন কি বড় ডেটার জন্য উপযুক্ত?
আমি এই পোস্টে পড়েছি বড় ডেটা যে বিগ ডেটা গঠনের জন্য উপযুক্ত ভাষা5TB এবং এটি যখন এই ধরণের ডেটা নিয়ে কাজ করার সম্ভাব্যতা সম্পর্কে তথ্য সরবরাহ করার একটি ভাল কাজ করে তবে সে সম্পর্কে Rখুব কম তথ্য সরবরাহ করে Python। আমি ভাবছিলাম যে Pythonএই আরও ডেটা পাশাপাশি কাজ করতে পারেন।
14 bigdata  python 

4
LSTM সময় সিরিজের পূর্বাভাসের কাছাকাছি পূর্বাভাস ব্যবধান
এলএসটিএম (বা অন্যান্য পুনরাবৃত্ত) নিউরাল নেটওয়ার্ক থেকে টাইম সিরিজের পূর্বাভাসের আশেপাশে ভবিষ্যদ্বাণী ব্যবধান (সম্ভাব্যতা বিতরণ) গণনা করার কোনও পদ্ধতি আছে কি? বলুন, উদাহরণস্বরূপ, আমি ভবিষ্যতে 10 টি নমুনা (t + 1 থেকে t + 10) ভবিষ্যদ্বাণী করছি, গত 10 টি পর্যবেক্ষণ হওয়া নমুনার (টি -9 থেকে টি) এর উপর ভিত্তি …

2
এক্সজি বুস্টে জুটিওয়ালা র‌্যাঙ্কিং মডেলগুলি কীভাবে ফিট?
আমি যতদূর জানি, মডেলগুলি র‌্যাঙ্কে শেখার প্রশিক্ষণ নিতে আপনার ডেটাসেটে তিনটি জিনিস থাকা দরকার: লেবেল বা প্রাসঙ্গিকতা গোষ্ঠী বা কোয়েরি আইডি বৈশিষ্ট্য ভেক্টর উদাহরণস্বরূপ, মাইক্রোসফ্ট লার্নিং টু র্যাঙ্ক ডেটাसेट এই ফর্ম্যাটটি ব্যবহার করে (লেবেল, গ্রুপ আইডি এবং বৈশিষ্ট্য)) 1 qid:10 1:0.031310 2:0.666667 ... 0 qid:10 1:0.078682 2:0.166667 ... আমি এক্সজিস্টেস্ট …
14 search  ranking  xgboost  gbm 

4
0 থেকে 1 পর্যন্ত সীমাবদ্ধ স্বাক্ষরের পূর্ণসংখ্যার অ্যারে কীভাবে স্কেল করবেন?
আমি কোনও বৈশিষ্ট্য সেটটিতে নিউরাল নেটওয়ার্ক প্রশিক্ষণের জন্য মস্তিষ্ক ব্যবহার করছি যা ইতিবাচক এবং নেতিবাচক মান উভয়ই অন্তর্ভুক্ত করে। তবে মস্তিষ্কের 0 থেকে 1 এর মধ্যে ইনপুট মানগুলির প্রয়োজন my আমার ডেটা স্বাভাবিক করার সর্বোত্তম উপায় কোনটি?

3
মডেল.পরেডিক্ট ফাংশনটির কেরাস থেকে আউটপুট বলতে কী বোঝায়?
আমি কোওর অফিসিয়াল ডেটাসেটে সদৃশ প্রশ্নের পূর্বাভাস দেওয়ার জন্য একটি এলএসটিএম মডেল তৈরি করেছি। পরীক্ষার লেবেল 0 বা 1. হয় 1 টি প্রশ্নের জোড় নকল কিনা তা নির্দেশ করে। মডেলটি ব্যবহার করে নির্মাণের পরে model.fit, আমি model.predictপরীক্ষার ডেটা ব্যবহার করে মডেলটি পরীক্ষা করি । আউটপুট হ'ল নীচের মত মানগুলির একটি …

6
পাইথনে ভাল "ঘন ঘন ক্রম খনন" প্যাকেজগুলি?
এমএললিবের এফপিএম ব্যতীত পাইথনে অন্য কেউ "ঘন ঘন সিকোয়েন্স মাইনিং" প্যাকেজ ব্যবহার করেছেন (এবং পছন্দ করেছেন)? আমি একটি স্থিতিশীল প্যাকেজ খুঁজছি, লোকেরা দ্বারা রক্ষণাবেক্ষণের চেয়ে পছন্দসই স্তিমিত। ধন্যবাদ!

4
জেনসিম ওয়ার্ড 2 ভেক বাস্তবায়নে পর্বের সংখ্যা
ওয়ার্ড 2 ভেক বাস্তবায়নে একটি iterপ্যারামিটার রয়েছেgensim শ্রেণি = 1, এইচএস = 1, নেতিবাচক = 0, কিউবো_মেন = 0, হ্যাশফক্সন =, ইট = 1 , নাল_শব্দ = 0, ছাঁটাই_আরল = কিছুই নয়, বাছাই করা_ভোকাব = 1) এটি যুগের সংখ্যা নির্দিষ্ট করে, যেমন: এটির = কর্পাসের উপরে পুনরাবৃত্তির সংখ্যা (যুগ) কেউ …

2
পাঠ্য শ্রেণিবিন্যাসে আপনি কীভাবে SMOTE প্রয়োগ করবেন?
সিন্থেটিক মাইনরিটি ওভারসাম্পলিং টেকনিক (এসএমওটিই) ভারসাম্যহীন ডেটাসেট সমস্যায় ব্যবহৃত একটি ওভারস্যাম্পলিং কৌশল। এ পর্যন্ত জেনেরিক, কাঠামোগত ডেটাতে কীভাবে এটি প্রয়োগ করতে হয় সে সম্পর্কে আমার কাছে ধারণা আছে। তবে এটি কি পাঠ্য শ্রেণীবদ্ধের সমস্যায় প্রয়োগ করা সম্ভব? উপাত্তের কোন অংশটি আপনার ওভার স্যাম্পল করা দরকার? এটি সম্পর্কে ইতিমধ্যে আরও একটি …

3
পান্ডাস ডেটাফ্রেমে টু ডিএম্যাট্রিক্স
আমি সাইকিট শিখতে এক্সজিবিস্ট চালানোর চেষ্টা করছি। এবং আমি কেবল ডেটা ফ্রেমে ডেটা লোড করতে পান্ডাস ব্যবহার করি। এক্সজিবিস্টের সাথে আমার কীভাবে পান্ডাস ডিএফ ব্যবহার করার কথা। এক্সজিবিস্ট আলগো চালানোর জন্য ডিএম্যাট্রিক্স রুটিন দ্বারা আমি বিভ্রান্ত হয়ে পড়েছি।

4
মানব ডাটাবেস ছাড়াই আলফাগো (এবং অন্যান্য গেম প্রোগ্রামগুলি পুনর্বহালকরণ-শেখার সাহায্যে) ব্যবহার করে
আমি বিষয়টির বিশেষজ্ঞ নই, এবং আমার প্রশ্ন সম্ভবত খুব নিষ্পাপ। আলফাগো প্রোগ্রামে ব্যবহৃত শক্তিবৃদ্ধি শেখার ক্ষমতা এবং সীমাবদ্ধতা বোঝার জন্য এটি একটি প্রবন্ধ থেকে উদ্ভূত হয়েছে। আলফাগো প্রোগ্রামটি অন্যান্য জিনিসগুলির মধ্যে (গাছের মন্টি-কার্লো এক্সপ্লোরেশন ইত্যাদি) ব্যবহার করে তৈরি করা হয়েছে, নিউরাল নেটওয়ার্কগুলি যা মানব-খেলানো গো গেমগুলির একটি বিশাল ডাটাবেস থেকে …

2
জেনেটিক অ্যালগরিদমগুলি নিউরাল নেটওয়ার্কগুলি অনুকূল করার জন্য কেন ব্যবহার করা হয় না?
আমার উপলব্ধি থেকে, জেনেটিক অ্যালগরিদমগুলি বহু-উদ্দেশ্যমূলক অপ্টিমাইজেশানের শক্তিশালী সরঞ্জাম। তদ্ব্যতীত, নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দেওয়া (বিশেষত গভীরগুলি) খুব কঠিন এবং এর অনেকগুলি সমস্যা রয়েছে (নন-কনভেক্স ব্যয় ফাংশনগুলি - স্থানীয় মিনিমা, বিলুপ্ত হওয়া এবং বিস্ফোরক গ্রেডিয়েন্টস ইত্যাদি)। এছাড়াও আমি হ'ল জিএর সাথে একটি এনএনকে ধারণামূলকভাবে প্রশিক্ষণ দেওয়া সম্ভব। আমি ভাবছিলাম, কেন তারা …

1
সিএনএন-তে আপসাম্পলিং এবং দ্বি-লিনিয়ার আপসাম্পলিংয়ের মধ্যে পার্থক্য কী?
আমি এই কাগজটি বোঝার চেষ্টা করছি এবং দ্বি-লিনিয়ার আপসাম্পলিং কী তা সম্পর্কে নিশ্চিত নই। কেউ কি উচ্চ স্তরে এটি ব্যাখ্যা করতে পারেন? https://arxiv.org/abs/1606.00915

4
গ্রেডিয়েন্ট বংশোদ্ভূত কি প্রতিটি অপ্টিমাইজারের কেন্দ্রীয়?
আমি জানতে চাই যে গ্রেডিয়েন্ট ডেসেন্টটি অ্যাডাম, অ্যাডাগ্রেড, আরএমএসপ্রপ এবং অন্যান্য বেশ কয়েকটি অপ্টিমাইজারের মতো অপ্টিমাইজারে ব্যবহৃত মূল আলগোরিদিম কিনা।

2
কেন সবসময় অ্যাডাম অপটিমাইজেশন কৌশলটি ব্যবহার করবেন না?
মনে হচ্ছে অ্যাডাপটিভ মুহুর্তের প্রাক্কলন (অ্যাডাম) অপ্টিমাইজারটি প্রায় সবসময় আরও ভাল কাজ করে (দ্রুত এবং আরও নির্ভরযোগ্যভাবে একটি সর্বনিম্ন সর্বনিম্নে পৌঁছায়) যখন প্রশিক্ষণে নিউরাল নেটগুলি ব্যয় করা হয় function সব সময় আদমকে ব্যবহার করবেন না কেন? এমনকি আরএমএসপ্রপ বা গতিবেগ অপ্টিমাইজার ব্যবহার করে কেন বিরক্ত করবেন?

1
এক্সজিবিগ্রিজার বনাম xgboost.train বিশাল গতির পার্থক্য?
আমি যদি নিম্নলিখিত কোডগুলি ব্যবহার করে আমার মডেলটিকে প্রশিক্ষণ দিই: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) এটি প্রায় 1 মিনিটের মধ্যে শেষ হয়। আমি যদি সায়-কিট শিখার …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.