আমার কাছে বিভিন্ন লাইব্রেরি থেকে দুটি ভিন্ন পদ্ধতি সম্পর্কে একটি প্রশ্ন রয়েছে যা মনে হয় একই কাজ করছে। আমি লিনিয়ার রিগ্রেশন মডেল তৈরি করার চেষ্টা করছি।
আমি ওএলএস সহ স্ট্যাটাসমডেল লাইব্রেরিটি ব্যবহার করছি এমন কোডটি এখানে:
X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1)
x_train = sm.add_constant(X_train)
model = sm.OLS(y_train, x_train)
results = model.fit()
print "GFT + Wiki / GT R-squared", results.rsquared
এই প্রিন্ট আউট জিএফটি + উইকি / জিটি আর-স্কোয়ার 0.981434611923
এবং দ্বিতীয়টি হ'ল সাইকিট লাইব্রেরি লিনিয়ার মডেল পদ্ধতি:
model = LinearRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)
print 'GFT + Wiki / GT R-squared: %.4f' % model.score(X_test, y_test)
এই মুদ্রণটি জিএফটি + উইকি / জিটি আর-স্কোয়ার: 0.8543
সুতরাং আমার প্রশ্ন উভয় পদ্ধতিই আমাদের আর ^ 2 ফলাফল মুদ্রণ করে তবে একটি প্রিন্ট আউট 0.98 এবং অন্যটি 0.85 হয় 0.
আমার উপলব্ধি থেকে, ওএলএস প্রশিক্ষণ ডেটাসেটের সাথে কাজ করে। সুতরাং আমার প্রশ্নগুলি,
- ওএলএসের সাথে টেস্ট ডেটা সেট করার কোনও উপায় আছে কি?
- ট্র্যানিং ডেটা সেট স্কোরটি আমাদের কোনও অর্থ দেয় (ওএলএস-এ আমরা পরীক্ষা ডেটা সেট ব্যবহার করি নি)? আমার অতীত জ্ঞান থেকে আমাদের পরীক্ষার ডেটা নিয়ে কাজ করতে হবে।
- ওএলএস এবং সাইকিট লিনিয়ার রিগ্রেশন এর মধ্যে পার্থক্য কী। আমরা মডেলটির স্কোর গণনার জন্য কোনটি ব্যবহার করি?
কোন সাহায্যের জন্য ধন্যবাদ।