তথ্য বিজ্ঞান

8

আমি এই পোস্টে পড়েছি বড় ডেটা যে বিগ ডেটা গঠনের জন্য উপযুক্ত ভাষা5TB এবং এটি যখন এই ধরণের ডেটা নিয়ে কাজ করার সম্ভাব্যতা সম্পর্কে তথ্য সরবরাহ করার একটি ভাল কাজ করে তবে সে সম্পর্কে Rখুব কম তথ্য সরবরাহ করে Python। আমি ভাবছিলাম যে Pythonএই আরও ডেটা পাশাপাশি কাজ করতে পারেন।

14 bigdata python

4

LSTM সময় সিরিজের পূর্বাভাসের কাছাকাছি পূর্বাভাস ব্যবধান

এলএসটিএম (বা অন্যান্য পুনরাবৃত্ত) নিউরাল নেটওয়ার্ক থেকে টাইম সিরিজের পূর্বাভাসের আশেপাশে ভবিষ্যদ্বাণী ব্যবধান (সম্ভাব্যতা বিতরণ) গণনা করার কোনও পদ্ধতি আছে কি? বলুন, উদাহরণস্বরূপ, আমি ভবিষ্যতে 10 টি নমুনা (t + 1 থেকে t + 10) ভবিষ্যদ্বাণী করছি, গত 10 টি পর্যবেক্ষণ হওয়া নমুনার (টি -9 থেকে টি) এর উপর ভিত্তি …

14 machine-learning deep-learning time-series prediction lstm

2

এক্সজি বুস্টে জুটিওয়ালা র‌্যাঙ্কিং মডেলগুলি কীভাবে ফিট?

আমি যতদূর জানি, মডেলগুলি র‌্যাঙ্কে শেখার প্রশিক্ষণ নিতে আপনার ডেটাসেটে তিনটি জিনিস থাকা দরকার: লেবেল বা প্রাসঙ্গিকতা গোষ্ঠী বা কোয়েরি আইডি বৈশিষ্ট্য ভেক্টর উদাহরণস্বরূপ, মাইক্রোসফ্ট লার্নিং টু র্যাঙ্ক ডেটাसेट এই ফর্ম্যাটটি ব্যবহার করে (লেবেল, গ্রুপ আইডি এবং বৈশিষ্ট্য)) 1 qid:10 1:0.031310 2:0.666667 ... 0 qid:10 1:0.078682 2:0.166667 ... আমি এক্সজিস্টেস্ট …

14 search ranking xgboost gbm

4

0 থেকে 1 পর্যন্ত সীমাবদ্ধ স্বাক্ষরের পূর্ণসংখ্যার অ্যারে কীভাবে স্কেল করবেন?

আমি কোনও বৈশিষ্ট্য সেটটিতে নিউরাল নেটওয়ার্ক প্রশিক্ষণের জন্য মস্তিষ্ক ব্যবহার করছি যা ইতিবাচক এবং নেতিবাচক মান উভয়ই অন্তর্ভুক্ত করে। তবে মস্তিষ্কের 0 থেকে 1 এর মধ্যে ইনপুট মানগুলির প্রয়োজন my আমার ডেটা স্বাভাবিক করার সর্বোত্তম উপায় কোনটি?

14 machine-learning neural-network feature-scaling normalization javascript

3

মডেল.পরেডিক্ট ফাংশনটির কেরাস থেকে আউটপুট বলতে কী বোঝায়?

আমি কোওর অফিসিয়াল ডেটাসেটে সদৃশ প্রশ্নের পূর্বাভাস দেওয়ার জন্য একটি এলএসটিএম মডেল তৈরি করেছি। পরীক্ষার লেবেল 0 বা 1. হয় 1 টি প্রশ্নের জোড় নকল কিনা তা নির্দেশ করে। মডেলটি ব্যবহার করে নির্মাণের পরে model.fit, আমি model.predictপরীক্ষার ডেটা ব্যবহার করে মডেলটি পরীক্ষা করি । আউটপুট হ'ল নীচের মত মানগুলির একটি …

14 machine-learning python neural-network keras lstm

6

পাইথনে ভাল "ঘন ঘন ক্রম খনন" প্যাকেজগুলি?

এমএললিবের এফপিএম ব্যতীত পাইথনে অন্য কেউ "ঘন ঘন সিকোয়েন্স মাইনিং" প্যাকেজ ব্যবহার করেছেন (এবং পছন্দ করেছেন)? আমি একটি স্থিতিশীল প্যাকেজ খুঁজছি, লোকেরা দ্বারা রক্ষণাবেক্ষণের চেয়ে পছন্দসই স্তিমিত। ধন্যবাদ!

14 python sequential-pattern-mining

4

জেনসিম ওয়ার্ড 2 ভেক বাস্তবায়নে পর্বের সংখ্যা

ওয়ার্ড 2 ভেক বাস্তবায়নে একটি iterপ্যারামিটার রয়েছেgensim শ্রেণি = 1, এইচএস = 1, নেতিবাচক = 0, কিউবো_মেন = 0, হ্যাশফক্সন =, ইট = 1 , নাল_শব্দ = 0, ছাঁটাই_আরল = কিছুই নয়, বাছাই করা_ভোকাব = 1) এটি যুগের সংখ্যা নির্দিষ্ট করে, যেমন: এটির = কর্পাসের উপরে পুনরাবৃত্তির সংখ্যা (যুগ) কেউ …

14 gensim word2vec convergence

2

পাঠ্য শ্রেণিবিন্যাসে আপনি কীভাবে SMOTE প্রয়োগ করবেন?

সিন্থেটিক মাইনরিটি ওভারসাম্পলিং টেকনিক (এসএমওটিই) ভারসাম্যহীন ডেটাসেট সমস্যায় ব্যবহৃত একটি ওভারস্যাম্পলিং কৌশল। এ পর্যন্ত জেনেরিক, কাঠামোগত ডেটাতে কীভাবে এটি প্রয়োগ করতে হয় সে সম্পর্কে আমার কাছে ধারণা আছে। তবে এটি কি পাঠ্য শ্রেণীবদ্ধের সমস্যায় প্রয়োগ করা সম্ভব? উপাত্তের কোন অংশটি আপনার ওভার স্যাম্পল করা দরকার? এটি সম্পর্কে ইতিমধ্যে আরও একটি …

14 unbalanced-classes text smote

3

পান্ডাস ডেটাফ্রেমে টু ডিএম্যাট্রিক্স

আমি সাইকিট শিখতে এক্সজিবিস্ট চালানোর চেষ্টা করছি। এবং আমি কেবল ডেটা ফ্রেমে ডেটা লোড করতে পান্ডাস ব্যবহার করি। এক্সজিবিস্টের সাথে আমার কীভাবে পান্ডাস ডিএফ ব্যবহার করার কথা। এক্সজিবিস্ট আলগো চালানোর জন্য ডিএম্যাট্রিক্স রুটিন দ্বারা আমি বিভ্রান্ত হয়ে পড়েছি।

14 scikit-learn pandas xgboost

4

মানব ডাটাবেস ছাড়াই আলফাগো (এবং অন্যান্য গেম প্রোগ্রামগুলি পুনর্বহালকরণ-শেখার সাহায্যে) ব্যবহার করে

আমি বিষয়টির বিশেষজ্ঞ নই, এবং আমার প্রশ্ন সম্ভবত খুব নিষ্পাপ। আলফাগো প্রোগ্রামে ব্যবহৃত শক্তিবৃদ্ধি শেখার ক্ষমতা এবং সীমাবদ্ধতা বোঝার জন্য এটি একটি প্রবন্ধ থেকে উদ্ভূত হয়েছে। আলফাগো প্রোগ্রামটি অন্যান্য জিনিসগুলির মধ্যে (গাছের মন্টি-কার্লো এক্সপ্লোরেশন ইত্যাদি) ব্যবহার করে তৈরি করা হয়েছে, নিউরাল নেটওয়ার্কগুলি যা মানব-খেলানো গো গেমগুলির একটি বিশাল ডাটাবেস থেকে …

13 reinforcement-learning

2

জেনেটিক অ্যালগরিদমগুলি নিউরাল নেটওয়ার্কগুলি অনুকূল করার জন্য কেন ব্যবহার করা হয় না?

আমার উপলব্ধি থেকে, জেনেটিক অ্যালগরিদমগুলি বহু-উদ্দেশ্যমূলক অপ্টিমাইজেশানের শক্তিশালী সরঞ্জাম। তদ্ব্যতীত, নিউরাল নেটওয়ার্কগুলি প্রশিক্ষণ দেওয়া (বিশেষত গভীরগুলি) খুব কঠিন এবং এর অনেকগুলি সমস্যা রয়েছে (নন-কনভেক্স ব্যয় ফাংশনগুলি - স্থানীয় মিনিমা, বিলুপ্ত হওয়া এবং বিস্ফোরক গ্রেডিয়েন্টস ইত্যাদি)। এছাড়াও আমি হ'ল জিএর সাথে একটি এনএনকে ধারণামূলকভাবে প্রশিক্ষণ দেওয়া সম্ভব। আমি ভাবছিলাম, কেন তারা …

13 neural-network optimization genetic-algorithms

1

সিএনএন-তে আপসাম্পলিং এবং দ্বি-লিনিয়ার আপসাম্পলিংয়ের মধ্যে পার্থক্য কী?

আমি এই কাগজটি বোঝার চেষ্টা করছি এবং দ্বি-লিনিয়ার আপসাম্পলিং কী তা সম্পর্কে নিশ্চিত নই। কেউ কি উচ্চ স্তরে এটি ব্যাখ্যা করতে পারেন? https://arxiv.org/abs/1606.00915

13 deep-learning convnet cnn convolution

4

গ্রেডিয়েন্ট বংশোদ্ভূত কি প্রতিটি অপ্টিমাইজারের কেন্দ্রীয়?

আমি জানতে চাই যে গ্রেডিয়েন্ট ডেসেন্টটি অ্যাডাম, অ্যাডাগ্রেড, আরএমএসপ্রপ এবং অন্যান্য বেশ কয়েকটি অপ্টিমাইজারের মতো অপ্টিমাইজারে ব্যবহৃত মূল আলগোরিদিম কিনা।

13 machine-learning neural-network deep-learning optimization gradient-descent

2

কেন সবসময় অ্যাডাম অপটিমাইজেশন কৌশলটি ব্যবহার করবেন না?

মনে হচ্ছে অ্যাডাপটিভ মুহুর্তের প্রাক্কলন (অ্যাডাম) অপ্টিমাইজারটি প্রায় সবসময় আরও ভাল কাজ করে (দ্রুত এবং আরও নির্ভরযোগ্যভাবে একটি সর্বনিম্ন সর্বনিম্নে পৌঁছায়) যখন প্রশিক্ষণে নিউরাল নেটগুলি ব্যয় করা হয় function সব সময় আদমকে ব্যবহার করবেন না কেন? এমনকি আরএমএসপ্রপ বা গতিবেগ অপ্টিমাইজার ব্যবহার করে কেন বিরক্ত করবেন?

13 neural-network optimization

1

এক্সজিবিগ্রিজার বনাম xgboost.train বিশাল গতির পার্থক্য?

আমি যদি নিম্নলিখিত কোডগুলি ব্যবহার করে আমার মডেলটিকে প্রশিক্ষণ দিই: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) এটি প্রায় 1 মিনিটের মধ্যে শেষ হয়। আমি যদি সায়-কিট শিখার …

13 machine-learning python decision-trees xgboost efficiency