পাইথনে মোটামুটি নতুন তবে কিছু শ্রেণিবিন্যাসের তথ্যের ভিত্তিতে আমার প্রথম আরএফ মডেল তৈরি করছে। আমি সমস্ত লেবেলগুলিকে int64 সংখ্যাসূচক ডেটাতে রূপান্তর করেছি এবং একটি অদ্ভুত অ্যারে হিসাবে এক্স এবং ওয়াইতে লোড করেছি, তবে আমি যখন মডেলগুলি প্রশিক্ষণের চেষ্টা করছি তখন আমি একটি ত্রুটি মারছি।
আমার অ্যারেগুলি দেখতে এখানে কী:
>>> X = np.array([[df.tran_cityname, df.tran_signupos, df.tran_signupchannel, df.tran_vmake, df.tran_vmodel, df.tran_vyear]])
>>> Y = np.array(df['completed_trip_status'].values.tolist())
>>> X
array([[[ 1, 1, 2, 3, 1, 1, 1, 1, 1, 3, 1,
3, 1, 1, 1, 1, 2, 1, 3, 1, 3, 3,
2, 3, 3, 1, 1, 1, 1],
[ 0, 5, 5, 1, 1, 1, 2, 2, 0, 2, 2,
3, 1, 2, 5, 5, 2, 1, 2, 2, 2, 2,
2, 4, 3, 5, 1, 0, 1],
[ 2, 2, 1, 3, 3, 3, 2, 3, 3, 2, 3,
2, 3, 2, 2, 3, 2, 2, 1, 1, 2, 1,
2, 2, 1, 2, 3, 1, 1],
[ 0, 0, 0, 42, 17, 8, 42, 0, 0, 0, 22,
0, 22, 0, 0, 42, 0, 0, 0, 0, 11, 0,
0, 0, 0, 0, 28, 17, 18],
[ 0, 0, 0, 70, 291, 88, 234, 0, 0, 0, 222,
0, 222, 0, 0, 234, 0, 0, 0, 0, 89, 0,
0, 0, 0, 0, 40, 291, 131],
[ 0, 0, 0, 2016, 2016, 2006, 2014, 0, 0, 0, 2015,
0, 2015, 0, 0, 2015, 0, 0, 0, 0, 2015, 0,
0, 0, 0, 0, 2016, 2016, 2010]]])
>>> Y
array(['NO', 'NO', 'NO', 'YES', 'NO', 'NO', 'YES', 'NO', 'NO', 'NO', 'NO',
'NO', 'YES', 'NO', 'NO', 'YES', 'NO', 'NO', 'NO', 'NO', 'NO', 'NO',
'NO', 'NO', 'NO', 'NO', 'NO', 'NO', 'NO'],
dtype='|S3')
>>> X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3)
ট্রেসব্যাক (সবচেয়ে সাম্প্রতিকতম কল সর্বশেষ):
File "<stdin>", line 1, in <module> File "/Library/Python/2.7/site-packages/sklearn/cross_validation.py", line
2039, ট্রেন_েস্ট_স্প্লিট অ্যারে = ইনডেক্সযোগ্য (* অ্যারে) ফাইল "/ লাইব্রেরি / পাইথন/2.7/site-packages/sklearn/utils/ লাডিয়ালিটি.পি", লাইন 206, ইনডেক্সযোগ্য চেক_সংশ্লিষ্ট_ দৈর্ঘ্য (* ফলাফল) ফাইল "/ গ্রন্থাগার / পাইথন / ২.7 / সাইট-প্যাকেজ / স্ক্লেয়ার্ন / ইউটিস / বৈধতা.পি ", লাইন 181, চেক_সংশ্লিষ্ট_ দৈর্ঘ্যের" নমুনাগুলিতে:% আর "% [ইনট্রি (এল) দৈর্ঘ্যের জন্য ল]]
ValueError: Found input variables with inconsistent numbers of samples: [1, 29]