প্রশ্ন ট্যাগ «scikit-learn»

সাইকিট-লার মেশিন লার্নিং, ডেটা মাইনিং এবং ডেটা বিশ্লেষণের জন্য সহজ এবং দক্ষ সরঞ্জাম সমন্বয়ে একটি পাইথন মডিউল। এটি NumPy, SciPy, এবং matplotlib এ নির্মিত। এটি 3-ক্লজ বিএসডি লাইসেন্সের আওতায় বিতরণ করা হয়েছে।

8
সাইকিট_লার্ন মডেলগুলিতে ফিট এবং ফিট_ ট্রান্সফর্মের মধ্যে পার্থক্য?
আমি ডেটা বিজ্ঞান নবাগত এবং আমি পার্থক্য বুঝতে পারছি না fitএবং fit_transformপদ্ধতি scikit-শিখতে। কেউ কি কেবল ব্যাখ্যা করতে পারে যে আমাদের কেন ডেটা ট্রান্সফর্ম করার প্রয়োজন হতে পারে? প্রশিক্ষণের ডেটা এবং টেস্টের ডেটাতে রূপান্তরকরণের জন্য উপযুক্ত মডেলটির অর্থ কী? এর অর্থ কি উদাহরণস্বরূপ ট্রেনের শ্রেণিবদ্ধ ভেরিয়েবলকে সংখ্যায় রূপান্তর করা এবং …

3
ওয়ান হট এনকোডিং বনাম লেবেলএনকোডার বনাম ডিকটেক্টরিজর কখন ব্যবহার করবেন?
আমি কিছুক্ষণের জন্য বিভাগীয় ডেটা সহ মডেলগুলি তৈরি করে চলেছি এবং যখন এই পরিস্থিতিতে আমি মডেল তৈরির আগে এই ডেটাটি রূপান্তর করতে বিজ্ঞান-শিখার লেবেল এনকোডার ফাংশনটি ব্যবহার করে মূলত ডিফল্ট হয়েছি। আমি মধ্যে পার্থক্য বুঝতে OHE, LabelEncoderএবং DictVectorizorযা তারা ডেটাতে করছেন পরিপ্রেক্ষিতে, কিন্তু কি আমার কাছে পরিষ্কার নয় যখন অন্য …

11
এসভিএম স্কাইকিট লার্ন ব্যবহার করে নিরবচ্ছিন্নভাবে রান চালায় এবং কখনই কার্যকর হয় না
আমি 595605 সারি এবং 5 কলাম (বৈশিষ্ট্য) এবং টেস্ট ডেটাসেটে 397070 সারি রয়েছে এমন একটি প্রশিক্ষণ ডেটাসেটে সাইকিট লার্ন (পাইথন) ব্যবহার করে এসভিআর চালানোর চেষ্টা করছি। ডেটা প্রাক-প্রক্রিয়াজাতকরণ এবং নিয়মিত করা হয়েছে। আমি পরীক্ষার উদাহরণগুলি সফলভাবে চালাতে সক্ষম হয়েছি কিন্তু আমার ডেটাসেট ব্যবহার করে এবং এক ঘন্টারও বেশি সময় চালাতে …

6
সিদ্ধান্ত গাছ / এলোমেলো বন হিসাবে বৈশিষ্ট্য হিসাবে স্ট্রিং
আমি সিদ্ধান্ত গাছ / এলোমেলো বন প্রয়োগের ক্ষেত্রে কিছু সমস্যা করছি। আমি এমন একটি সমস্যার সাথে ফিট করার চেষ্টা করছি যা বৈশিষ্ট্যগুলির মতো সংখ্যাগুলির পাশাপাশি স্ট্রিংগুলি (যেমন দেশের নাম) রয়েছে। এখন লাইব্রেরি, সাইকিট-লার্ন কেবল পরামিতি হিসাবে সংখ্যা নিয়েছে, তবে আমি স্ট্রিংগুলি ইনজেক্ট করতে চাই এবং পাশাপাশি তারা উল্লেখযোগ্য পরিমাণে জ্ঞান …

9
ট্রেন / পরীক্ষা / বৈধকরণ স্কেলনারিতে বিভক্তকরণ
আমি কীভাবে এলোমেলোভাবে একটি ডেটা ম্যাট্রিক্স এবং সংশ্লিষ্ট লেবেল ভেক্টরকে একটি এক্স_ট্রেইন, এক্স_টেষ্ট, এক্স_ওয়াল, ওয়_ট্রেইন, ওয়াই_স্টেস্ট, ওয়_ওয়ালায় স্ক্লেয়ার্ন দিয়ে বিভক্ত করতে পারি? আমি যতদূর জানি, sklearn.cross_validation.train_test_splitকেবল তিনটি নয়, কেবল দুটিতে বিভক্ত করতে সক্ষম ...

5
সাইকিট-লার্নের কী ফরোয়ার্ড সিলেকশন / স্টেপওয়াইজ রিগ্রেশন অ্যালগরিদম আছে?
আমি অনেকগুলি বৈশিষ্ট্য নিয়ে সমস্যা নিয়ে কাজ করছি এবং আমার মডেলগুলি প্রশিক্ষণ দিচ্ছি অনেক দীর্ঘ। বৈশিষ্ট্যগুলি চয়ন করতে আমি ফরোয়ার্ড নির্বাচন অ্যালগরিদম বাস্তবায়ন করেছি। যাইহোক, আমি ভাবছিলাম যে বিজ্ঞান-শিখার কি ফরোয়ার্ড নির্বাচন / ধাপে ধাপে রিগ্রেশন অ্যালগরিদম আছে?

1
এক্সজিবিস্ট স্কলারন গ্রেডিয়েন্টবুস্টিং ক্লাসিফায়ারের চেয়ে এত দ্রুত কেন?
আমি 100 সংখ্যার বৈশিষ্ট্য সহ 50 কে উদাহরণের মাধ্যমে গ্রেডিয়েন্ট বুস্টিং মডেলটি প্রশিক্ষণের চেষ্টা করছি। XGBClassifierআমার মেশিনে 43 সেকেন্ডের মধ্যে 500 গাছ হ্যান্ডল করে, যখন GradientBoostingClassifier1 মিনিট 2 সেকেন্ডের মধ্যে কেবল 10 টি গাছ (!) পরিচালনা করে :( আমি কয়েক ঘন্টা লাগবে বলে 500 গাছ বাড়ানোর চেষ্টা করতে বিরক্ত করিনি। …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
মাল্টিআউটপুট ক্লাসিফায়ার থেকে ভবিষ্যদ্বাণী_প্রবাহ বোঝা
র্যান্ডম ফরেস্ট মডেলটির সাথে একটি মাল্টিআউটপুট শ্রেণিবিন্যাস সম্পাদন করতে আমি বিজ্ঞানী-শিখার ওয়েবসাইটে এই উদাহরণটি অনুসরণ করছি । from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, n_classes=2, random_state=1) y2 = shuffle(y1, random_state=1) Y …

3
লিনিয়ার প্রতিরোধে ওজনকে কীভাবে অ-নেতিবাচক হতে বাধ্য করা যায়
আমি পাইথনে সাইকিট-লার্ন ব্যবহার করে একটি স্ট্যান্ডার্ড লিনিয়ার রিগ্রেশন ব্যবহার করছি। তবে, আমি প্রতিটি বৈশিষ্ট্যের জন্য ওজনকে সমস্ত ধনাত্মক হতে বাধ্য করতে চাই (নেতিবাচক নয়), আমি কী এটি সম্পাদন করতে পারি? আমি ডকুমেন্টেশনে সন্ধান করছিলাম কিন্তু তা সম্পাদনের কোনও উপায় খুঁজে পাইনি। আমি বুঝতে পারি আমি সেরা সমাধানটি নাও পেতে …

4
সাইকিট-লার্ন: এসজিডিসি ক্লাসিফায়ার হিসাবে লজিস্টিক রিগ্রেশন হিসাবে পূর্বাভাস দেওয়া
লজিস্টিক রিগ্রেশনকে প্রশিক্ষণের একটি উপায় হ'ল স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভুত ব্যবহার, যা বিজ্ঞানী-শিখতে একটি ইন্টারফেস দেয়। আমি কি করতে চান একটি scikit-শিখতে এর নিতে হয় SGDClassifier এবং এটি একটি পণ্য সরবরাহ রিগ্রেশন হিসাবে একই স্কোর আছে এখানে । তবে আমার স্কোর সমতুল্য না হওয়ায় অবশ্যই আমি অবশ্যই কিছু মেশিন লার্নিং বর্ধনগুলি …

5
পাইথনে কেএল ডাইভারজেন গণনা করা হচ্ছে
আমি এটির পরিবর্তে নতুন এবং এটির পিছনে তাত্ত্বিক ধারণা সম্পর্কে আমার সম্পূর্ণ ধারণা আছে তা বলতে পারি না। আমি পাইথনের কয়েকটি পয়েন্টের তালিকার মধ্যে কেএল ডাইভারজেন গণনা করার চেষ্টা করছি। আমি এটি ব্যবহার করার জন্য http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html ব্যবহার করছি । যে সমস্যাটির মধ্যে আমি চালিয়ে যাচ্ছি তা হ'ল মানটি যে কোনও …

2
ট্রেন_স্টেস্ট_স্প্লিট () ত্রুটি: নমুনার অসঙ্গত সংখ্যার সাথে ইনপুট ভেরিয়েবলগুলি পাওয়া গেছে
পাইথনে মোটামুটি নতুন তবে কিছু শ্রেণিবিন্যাসের তথ্যের ভিত্তিতে আমার প্রথম আরএফ মডেল তৈরি করছে। আমি সমস্ত লেবেলগুলিকে int64 সংখ্যাসূচক ডেটাতে রূপান্তর করেছি এবং একটি অদ্ভুত অ্যারে হিসাবে এক্স এবং ওয়াইতে লোড করেছি, তবে আমি যখন মডেলগুলি প্রশিক্ষণের চেষ্টা করছি তখন আমি একটি ত্রুটি মারছি। আমার অ্যারেগুলি দেখতে এখানে কী: >>> …

3
স্ট্যান্ডার্ডস্কেলার ডেটা বিভক্ত করার আগে এবং পরে
যখন আমি ব্যবহার সম্পর্কে পড়ছিলাম StandardScaler, বেশিরভাগ সুপারিশই বলেছিল যে ডেটা ট্রেন / পরীক্ষায় বিভক্ত করার StandardScaler আগে আপনার ব্যবহার করা উচিত , তবে যখন আমি অনলাইনে পোস্ট করা কিছু কোড (স্কলারান ব্যবহার করে) পরীক্ষা করছিলাম তখন দুটি বড় ব্যবহার ছিল। 1- StandardScalerসমস্ত ডেটা ব্যবহার করে। যেমন from sklearn.preprocessing import …

2
স্কলারনের সাথে লজিস্টিক রিগ্রেশন-এ কীভাবে পি-মান এবং আত্মবিশ্বাসের ব্যবধানটি পাবেন?
আমি স্ক্লার্ন (লজিস্টিক রিগ্রেশন) দিয়ে একটি বহু-জাতীয় লজিস্টিক রিগ্রেশন তৈরি করছি। তবে এটি শেষ হওয়ার পরে, আমি কীভাবে আমার মডেলের একটি পি-মান এবং আত্মবিশ্বাসের ব্যবধান পেতে পারি? এটি কেবলমাত্র প্রদর্শিত হবে যে স্ক্লার্নন কেবলমাত্র গুণনীয় এবং বিরতি সরবরাহ করে। আপনাকে অনেক ধন্যবাদ.

2
আপনি কী বিজ্ঞান-শিখায় এসভিসি এবং লিনিয়ারএসভিসির মধ্যে পার্থক্যটি ব্যাখ্যা করতে পারেন?
আমি সম্প্রতি কাজ করা শিখতে শুরু করেছি sklearnএবং এই অদ্ভুত ফলাফলটি পেয়েছি । আমি বিভিন্ন মডেল এবং অনুমানের পদ্ধতিগুলি চেষ্টা করার জন্য digitsউপলব্ধ ডেটাসেট ব্যবহার করেছি sklearn। আমি যখন ডেটাতে একটি সাপোর্ট ভেক্টর মেশিনের মডেল পরীক্ষা করেছি, তখন আমি জানতে পারলাম sklearnএসভিএম শ্রেণিবদ্ধকরণের জন্য দুটি পৃথক শ্রেণি রয়েছে : SVCএবং …
19 svm  scikit-learn 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.