প্রশ্ন ট্যাগ «scikit-learn»

সাইকিট-লার পাইথনের একটি মেশিন-লার্নিং লাইব্রেরি যা মেশিন লার্নিংয়ে ফোকাস সহ ডেটা বিশ্লেষণ এবং ডেটা মাইনিংয়ের জন্য সহজ এবং দক্ষ সরঞ্জাম সরবরাহ করে। এটি সবার কাছে অ্যাক্সেসযোগ্য এবং বিভিন্ন প্রসঙ্গে পুনরায় ব্যবহারযোগ্য। এটি NumPy এবং SciPy তে নির্মিত। প্রকল্পটি ওপেন সোর্স এবং বাণিজ্যিকভাবে ব্যবহারযোগ্য (বিএসডি লাইসেন্স)।

20
সাইকিট-শিখায় একাধিক কলামে লেবেল এনকোডিং
আমি স্ট্রিং লেবেলের LabelEncoderএকটি পান্ডাকে এনকোড করতে সাইকিট-লার্নস ব্যবহার করার চেষ্টা করছি DataFrame। যেহেতু ডেটাফ্রেমে অনেকগুলি (50+) কলাম রয়েছে, তাই আমি LabelEncoderপ্রতিটি কলামের জন্য একটি অবজেক্ট তৈরি করা এড়াতে চাই ; আমি বরং একটি বড় LabelEncoderঅবজেক্ট থাকব যা আমার সমস্ত ডেটা কলাম জুড়ে কাজ করে। সমগ্র নিক্ষেপ DataFrameমধ্যে LabelEncoderত্রুটি নিচে …

12
NumPy এ অ্যারে কিভাবে স্বাভাবিক করবেন?
আমি একটি নম্পপি অ্যারের আদর্শ পেতে চাই। আরও সুনির্দিষ্টভাবে, আমি এই ফাংশনটির সমতুল্য সংস্করণটি খুঁজছি def normalize(v): norm = np.linalg.norm(v) if norm == 0: return v return v / norm এর মধ্যেও কি এমন কিছু আছে skearnনাকি numpy? এই ফাংশনটি এমন পরিস্থিতিতে কাজ করে যেখানে v0 ভেক্টর।

6
ক্লাসিফায়ারকে ডিস্কে স্কাইকিট-লার্নে সংরক্ষণ করুন
আমি কিভাবে সংরক্ষণ একজন প্রশিক্ষণপ্রাপ্ত না ক্লাসিফায়ার সাদাসিধা বায়েসের করার ডিস্ক এবং এটি ব্যবহার করার জন্য ভবিষ্যদ্বাণী করা ডেটা? বিজ্ঞান-শিখার ওয়েবসাইট থেকে আমার নীচের নমুনা প্রোগ্রাম রয়েছে: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points …

15
আমদানি ত্রুটি: কোনও মডিউল স্কলেয়ার.ক্রস_ বৈধকরণ নামে পরিচিত নয়
আমি উবুন্টু 14.04 এ পাইথন ২. 2. ব্যবহার করছি using আমি এই কমান্ডগুলির সাথে স্কাইকিট-লার্ন, নম্পটি এবং ম্যাটপ্ল্লিটিব ইনস্টল করেছি: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython তবে আমি যখন এই প্যাকেজগুলি আমদানি করি: from sklearn.cross_validation import train_test_split এটি আমাকে এই ত্রুটিটি ফিরিয়ে …

7
স্কিকিট-লার্ন কে-মিনস ক্লাস্টারিং ব্যবহার করে আপনার নিজের দূরত্বের কার্যকারিতা নির্দিষ্ট করা সম্ভব?
স্কিকিট-লার্ন কে-মিনস ক্লাস্টারিং ব্যবহার করে আপনার নিজের দূরত্বের কার্যকারিতা নির্দিষ্ট করা সম্ভব?

10
পাইথনটিতে মূলের স্কোয়ার ত্রুটি (আরএমএসই) এর জন্য কোনও লাইব্রেরি ফাংশন রয়েছে?
আমি জানি যে আমি এই জাতীয় মূল স্কোয়ার ত্রুটি ফাংশনটি প্রয়োগ করতে পারি: def rmse(predictions, targets): return np.sqrt(((predictions - targets) ** 2).mean()) আমি কি খুঁজছি যদি এই আরএমএস ফাংশনটি কোথাও কোনও লাইব্রেরিতে প্রয়োগ করা হয়, সম্ভবত স্কিপি বা সাইকিট-শিখে?

21
বিজ্ঞান-শিখার সিদ্ধান্ত-বৃক্ষ থেকে কীভাবে সিদ্ধান্তের বিধি নিষেধ করবেন?
আমি কি পাঠ্য তালিকায় প্রশিক্ষণপ্রাপ্ত গাছ থেকে অন্তর্নিহিত সিদ্ধান্ত-বিধিগুলি (বা 'সিদ্ধান্তের পথগুলি) আহরণ করতে পারি? কিছুটা এইরকম: if A>0.4 then if B<0.2 then if C>0.8 then class='X' আপনার সাহায্যের জন্য ধন্যবাদ.


10
রানটাইম সতর্কতা: numpy.dtype আকার পরিবর্তন হয়েছে, বাইনারি অসঙ্গতি নির্দেশ করতে পারে
সংরক্ষিত এসভিএম মডেলটি লোড করার চেষ্টা করার জন্য আমার এই ত্রুটি রয়েছে। আমি স্কেলারন, নম্পপি এবং সায়্পাই আনইনস্টল করার চেষ্টা করেছি, সর্বশেষ সংস্করণগুলি আবার একসাথে পুনরায় ইনস্টল করেছি (পাইপ ব্যবহার করে)। আমি এখনও এই ত্রুটি পাচ্ছি। কেন? In [1]: import sklearn; print sklearn.__version__ 0.18.1 In [3]: import numpy; print numpy.__version__ …

6
এলোমেলো অবস্থা (সিউডো-র্যান্ডম সংখ্যা) সাইকিট শিখুন
আমি স্কাইকিট লার্নিতে একটি মেশিন লার্নিং অ্যালগরিদম বাস্তবায়ন করতে চাই, তবে এই পরামিতিটি কী করে তা আমি বুঝতে পারি না random_state? আমি কেন এটি ব্যবহার করব? আমি বুঝতে পারছিলাম না যে একটি সিউডো-র্যান্ডম নম্বর কী।

5
কীভাবে 3 টি সেটে ডেটা বিভক্ত করবেন (ট্রেন, বৈধতা এবং পরীক্ষা)?
আমার কাছে পান্ডাস ডেটাফ্রেম রয়েছে এবং আমি এটিকে 3 টি আলাদা সেটে ভাগ করতে চাই wish আমি জানি যে থেকে ট্রেন_স্টেট_স্প্লিট ব্যবহার করে sklearn.cross_validation, কেউ ডেটা দুটি সেটে বিভাজন করতে পারে (ট্রেন এবং পরীক্ষা)। তবে আমি তিনটি উপায়ে ডেটা বিভক্ত করার কোনও সমাধান খুঁজে পাইনি। সাধারণত, আমি মূল তথ্য সূচকগুলি …

6
স্ক্যান্ডার্ন দিয়ে প্যান্ডাস ডেটা ফ্রেম কলামগুলি স্কেলিং
আমার কাছে মিশ্র প্রকারের কলামগুলির সাথে একটি পান্ডাস ডেটা ফ্রেম রয়েছে এবং আমি কিছু কলামে স্ক্লার্ন এর মিনি_ম্যাক্স_স্কেলার প্রয়োগ করতে চাই। আদর্শভাবে, আমি এই জায়গায় রূপান্তরগুলি করতে চাই, তবে এখনও এটি করার কোনও উপায় খুঁজে পাইনি। আমি নিম্নলিখিত কোড লিখেছি যা কাজ করে: import pandas as pd import numpy as …

3
কেন একটি গরম এনকোডিং মেশিন লার্নিংয়ের কার্যকারিতা উন্নত করে?
আমি লক্ষ করেছি যে যখন ওয়ান হট এনকোডিং নির্দিষ্ট ডেটা সেট (একটি ম্যাট্রিক্স) এ ব্যবহৃত হয় এবং অ্যালগরিদম শেখার প্রশিক্ষণ ডেটা হিসাবে ব্যবহৃত হয়, তখন এটি প্রশিক্ষণের ডেটা হিসাবে মূল ম্যাট্রিক্সের তুলনায় নিজেকে পূর্বাভাসের সঠিকতার সাথে উল্লেখযোগ্যভাবে আরও ভাল ফলাফল দেয়। এই পারফরম্যান্স বৃদ্ধি কিভাবে হয়?

13
স্কলারন ত্রুটি ভ্যালুএররার: ইনপুটটিতে NaN, অসীম বা dtype ('float64') এর জন্য খুব বড় একটি মান রয়েছে
আমি স্ক্লার্ন ব্যবহার করছি এবং স্নেহের প্রচারের ক্ষেত্রে সমস্যা হচ্ছে। আমি একটি ইনপুট ম্যাট্রিক্স তৈরি করেছি এবং আমি নিম্নলিখিত ত্রুটিটি পেতে থাকি। ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). আমি দৌড়েছি np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True আমি ব্যবহার করার চেষ্টা করেছি mat[np.isfinite(mat) …

6
র‌্যান্ডমফোরস্টক্ল্যাসিফায়ারে ফিচার_প্রয়োজনগুলি কীভাবে নির্ধারণ করা হয়?
ডেটা ইনপুট হিসাবে টাইম-সিরিজ সহ আমার একটি শ্রেণিবদ্ধকরণ টাস্ক রয়েছে, যেখানে প্রতিটি অ্যাট্রিবিউট (এন = ২৩) সময় একটি নির্দিষ্ট পয়েন্ট উপস্থাপন করে। পরম শ্রেণিবদ্ধকরণ ফলাফল ছাড়াও আমি এটি জানতে চাই, কোন বৈশিষ্ট্য / তারিখগুলি ফলাফলকে কতটা অবদান রাখে। অতএব আমি কেবলমাত্র ব্যবহার করছি feature_importances_, যা আমার পক্ষে ভাল কাজ করে। …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.