প্রশ্ন ট্যাগ «classification»

তত্ত্বাবধানে শেখার একটি উদাহরণ যা ডেটাসেটের একটি নতুন উদাহরণ অন্তর্ভুক্ত এমন বিভাগ বা বিভাগগুলি সনাক্ত করে।

8
কেরাসে ভারসাম্যহীন ক্লাসের জন্য শ্রেণি ওজন কীভাবে সেট করবেন?
আমি জানি যে ক্যারাসে ফিটিংয়ের ক্ষেত্রে class_weightsপ্যারামিটার অভিধান সহ একটি সম্ভাবনা রয়েছে তবে আমি এর কোনও উদাহরণ পাইনি। কেউ সরবরাহ করতে এত দয়াবান হবে? যাইহোক, এক্ষেত্রে উপযুক্ত প্রক্সিগুলি সংখ্যালঘু শ্রেণীর তুলনামূলকভাবে তার নিম্নোক্ততার তুলনায় ভার বাড়িয়ে তোলা?

6
দূরত্বের মেট্রিক হিসাবে ডস পণ্য বনাম কোসিন মিল
দেখে মনে হচ্ছে দুটি বৈশিষ্ট্যের কোসাইন মিল হ'ল কেবলমাত্র তাদের বিন্দুর পণ্য দ্বারা আকারযুক্ত তাদের বিন্দু পণ্য। কোসিনের মিলটি কখন বিন্দুর চেয়ে ভাল দূরত্বের মেট্রিক তৈরি করে? অর্থাৎ ডট পণ্য এবং কোসাইন মিলের বিভিন্ন পরিস্থিতিতে বিভিন্ন শক্তি বা দুর্বলতা থাকে?

1
বহু শ্রেণীর শ্রেণিবিন্যাসের জন্য সেরা কেরাস মডেল কী?
আমি গবেষণা, কাজ করছি যেখানে তিনটি ঘটনা বিজয়ী শ্রেণীভুক্ত এক করার প্রয়োজনীয়তা = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 আমার বর্তমান মডেলটি হ'ল: def build_model(input_dim, …

5
ডিপ লার্নিং বনাম গ্রেডিয়েন্ট বুস্টিং: কখন কী ব্যবহার করবেন?
বড় ডেটাসেট নিয়ে আমার বড় ডেটা সমস্যা রয়েছে (উদাহরণস্বরূপ 50 মিলিয়ন সারি এবং 200 কলাম) take ডেটাসেটটিতে প্রায় 100 সংখ্যার কলাম এবং 100 শ্রেণীবদ্ধ কলাম এবং একটি প্রতিক্রিয়া কলাম থাকে যা বাইনারি শ্রেণীর সমস্যা উপস্থাপন করে। প্রতিটি শ্রেণীবদ্ধ কলামের কার্ডিনালিটি 50 এরও কম। আমি গভীর শিক্ষা গ্রহণ পদ্ধতি বা বৃক্ষভিত্তিক …

1
এক্সজিবিস্ট স্কলারন গ্রেডিয়েন্টবুস্টিং ক্লাসিফায়ারের চেয়ে এত দ্রুত কেন?
আমি 100 সংখ্যার বৈশিষ্ট্য সহ 50 কে উদাহরণের মাধ্যমে গ্রেডিয়েন্ট বুস্টিং মডেলটি প্রশিক্ষণের চেষ্টা করছি। XGBClassifierআমার মেশিনে 43 সেকেন্ডের মধ্যে 500 গাছ হ্যান্ডল করে, যখন GradientBoostingClassifier1 মিনিট 2 সেকেন্ডের মধ্যে কেবল 10 টি গাছ (!) পরিচালনা করে :( আমি কয়েক ঘন্টা লাগবে বলে 500 গাছ বাড়ানোর চেষ্টা করতে বিরক্ত করিনি। …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

4
অত্যন্ত ভারসাম্যহীন ডেটা সেট প্রশিক্ষণের জন্য দ্রুত গাইড
প্রশিক্ষণ সেটটিতে প্রায় 1000 ইতিবাচক এবং 10000 নেতিবাচক নমুনাগুলির সাথে আমার একটি শ্রেণিবদ্ধকরণ সমস্যা রয়েছে। সুতরাং এই ডেটা সেটটি বেশ ভারসাম্যহীন। সরল এলোমেলো বন কেবল সমস্ত পরীক্ষার নমুনাকে সংখ্যাগরিষ্ঠ শ্রেণি হিসাবে চিহ্নিত করার চেষ্টা করছে। সাব-স্যাম্পলিং এবং ওজনযুক্ত এলোমেলো বন সম্পর্কে কিছু ভাল উত্তর এখানে দেওয়া হয়েছে: উচ্চ পক্ষপাতদুষ্ট ডেটাসেটের …

4
এসভিএম ও তার বিপরীতে র্যান্ডম ফরেস্ট কখন ব্যবহার করবেন?
যখন ব্যবহার করেন Random Forestবেশি SVMবিপরীতভাবে এবং ভাইস? আমি বুঝতে পারি যে cross-validationএবং মডেল তুলনা একটি মডেল চয়ন করার একটি গুরুত্বপূর্ণ দিক, তবে এখানে আমি দুটি পদ্ধতির থাম্ব এবং হিউরিস্টিক সম্পর্কিত নিয়ম সম্পর্কে আরও জানতে চাই to শ্রেণিবদ্ধের সূক্ষ্মতা, শক্তি এবং দুর্বলতাগুলির পাশাপাশি সমস্যাগুলির, যা তাদের প্রত্যেকের জন্য সবচেয়ে উপযুক্ত, …

4
পুনঃসূচনা তথ্যের উপর ভিত্তি করে কাজের শ্রেণিবদ্ধকরণ করতে আমার কোন অ্যালগরিদম ব্যবহার করা উচিত?
দ্রষ্টব্য যে আমি আর-তে সবকিছু করছি সমস্যা অনুসরণ হিসাবে: মূলত, আমার কাছে পুনঃসূচনাগুলির একটি তালিকা রয়েছে (সিভি)। কিছু প্রার্থীর আগে কাজের অভিজ্ঞতা থাকবে এবং কিছু না থাকুক। এখানে লক্ষ্যটি হ'ল: তাদের সিভিগুলির পাঠ্যের উপর ভিত্তি করে, আমি তাদের বিভিন্ন কাজের ক্ষেত্রে শ্রেণিবদ্ধ করতে চাই। আমি সেই ক্ষেত্রে বিশেষভাবে রয়েছি, যেখানে …

4
কেরাস মডেলের সঠিকতা, এফ 1, নির্ভুলতা এবং পুনর্বিবেচনা কীভাবে পাবেন?
আমি আমার বাইনারি কেরাসক্ল্যাসিফায়ার মডেলের জন্য নির্ভুলতা, পুনরায় কল এবং এফ 1-স্কোর গণনা করতে চাই, তবে কোনও সমাধান খুঁজে পাই না। আমার আসল কোডটি এখানে: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, …

5
সিদ্ধান্ত গাছ অ্যালগোরিদম লিনিয়ার বা ননলাইনার হয়
সম্প্রতি আমার এক বন্ধুকে জিজ্ঞাসা করা হয়েছিল যে কোনও সিদ্ধান্তের ট্রি অ্যালগোরিদমগুলি একটি সাক্ষাত্কারে লিনিয়ার না ননলাইনার অ্যালগোরিদম কিনা। আমি এই প্রশ্নের উত্তর খোঁজার চেষ্টা করেছি কিন্তু সন্তোষজনক ব্যাখ্যা খুঁজে পেলাম না। এই প্রশ্নের সমাধান এবং উত্তর কি কেউ দিতে পারবেন? এছাড়াও, ননলাইনার মেশিন লার্নিং অ্যালগরিদমের আরও কয়েকটি উদাহরণ কী?

3
পাঠ্য শ্রেণিবিন্যাস এবং বিষয় মডেলগুলির মধ্যে পার্থক্য কী?
আমি মেশিন লার্নিংয়ে ক্লাস্টারিং এবং শ্রেণিবিন্যাসের মধ্যে পার্থক্য জানি, তবে আমি নথির জন্য পাঠ্য শ্রেণিবিন্যাস এবং বিষয় মডেলিংয়ের মধ্যে পার্থক্য বুঝতে পারি না। কোনও বিষয় শনাক্ত করার জন্য আমি কী নথির উপরে টপিক মডেলিং ব্যবহার করতে পারি? আমি এই নথির ভিতরে থাকা পাঠ্যকে শ্রেণিবদ্ধ করতে শ্রেণিবদ্ধকরণ পদ্ধতিগুলি ব্যবহার করতে পারি?

4
এক্সজিবিস্টের সাথে ভারসাম্যহীন মাল্টিক্লাস ডেটা
এই বিতরণ সহ আমার 3 টি ক্লাস রয়েছে: Class 0: 0.1169 Class 1: 0.7668 Class 2: 0.1163 এবং আমি xgboostশ্রেণিবদ্ধকরণের জন্য ব্যবহার করছি। আমি জানি যে সেখানে একটি প্যারামিটার বলা হয়েছে scale_pos_weight। তবে কীভাবে এটি 'মাল্টিক্লাস' কেসের জন্য পরিচালিত হয় এবং আমি কীভাবে এটি সঠিকভাবে সেট করতে পারি?

2
পাঠ্য শ্রেণীবদ্ধকরণ: বিভিন্ন ধরণের বৈশিষ্ট্যগুলির সংমিশ্রণ
আমি যে সমস্যার মুখোমুখি হচ্ছি তা হ'ল সংক্ষিপ্ত পাঠকে একাধিক শ্রেণিতে শ্রেণিবদ্ধ করা হচ্ছে। আমার বর্তমান পদ্ধতির টিএফ-আইডিএফ ওজনযুক্ত শব্দ ফ্রিকোয়েন্সি ব্যবহার করা এবং একটি সাধারণ লিনিয়ার শ্রেণিবদ্ধ (লজিস্টিক রিগ্রেশন) শিখতে হবে। এটি যুক্তিসঙ্গতভাবে ভাল কাজ করে (পরীক্ষার সেটটিতে 90% ম্যাক্রো এফ -1, প্রশিক্ষণে প্রায় 100%)। একটি বড় সমস্যা হ'ল …

4
ইউক্লিডিয়ান দূরত্বের বিপরীতে কেউ কখন ম্যানহাটনের দূরত্ব ব্যবহার করবে?
আমি কেন এক ব্যবহার করেন একটি ভাল যুক্তি জন্য চেহারা চেষ্টা করছি ম্যানহাটন দূরত্ব ওভার ইউক্লিডিয় দূরত্ব Machine Learning এর মধ্যে। আমি এখনও পর্যন্ত একটি ভাল যুক্তি খুঁজে পেয়েছি নিকটতম জিনিস এই এমআইটি বক্তৃতা হয় । 36:15 এ আপনি নীচের বিবৃতি স্লাইডগুলিতে দেখতে পারেন: "সাধারণত ইউক্যালিডিয়ান মেট্রিক ব্যবহার করুন; ম্যানহাটান …

2
শ্রেণিবদ্ধের নির্ভুলতা কীভাবে বাড়ানো যায়?
আমি এলোমেলো গাছ এবং অন্যান্য শ্রেণিবদ্ধের উপর পরীক্ষার জন্য ওপেনসিভি লেটার_রেকগ। পিপি উদাহরণ ব্যবহার করছি। এই উদাহরণে ছয় শ্রেণিবদ্ধের প্রয়োগ রয়েছে - এলোমেলো গাছ, বুস্টিং, এমএলপি, কেএনএন, নিষ্পাপ বয়েস এবং এসভিএম। 20000 দৃষ্টান্ত এবং 16 টি বৈশিষ্ট্য সহ ইউসিআই লেটার স্বীকৃতি ডেটাসেট ব্যবহার করা হয়েছে, যা আমি প্রশিক্ষণ এবং পরীক্ষার …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.