একটি র্যান্ডমফোরেস্ট মডেল ব্যবহার করে পরীক্ষার ডেটা পূর্বাভাস দেওয়ার সময় আমি ভ্যালুয়েরর পেয়েছি।
আমার কোড:
clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2)
clf.fit(X_fit, y_fit)
df_test.fillna(df_test.mean())
X_test = df_test.values
y_pred = clf.predict(X_test)
ভূল:
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
টেস্ট ডেটাসেটে আমি কীভাবে খারাপ মানগুলি খুঁজে পাব? এছাড়াও, আমি এই রেকর্ডগুলি ফেলে দিতে চাই না, আমি কি কেবল তাদের গড় বা মধ্যমা দিয়ে প্রতিস্থাপন করতে পারি?
ধন্যবাদ।