এমএএনআইএসটিতে 2.8% পরীক্ষার ত্রুটির চেয়ে এলোমেলো বন কি আরও ভাল করতে পারে?


10

এমএনআইএসটি, সিআইএফএআর, এসটিএল -10 ইত্যাদিতে র্যান্ডম ফরেস্টের প্রয়োগের জন্য আমি কোনও সাহিত্যের সন্ধান পাইনি তাই আমি ভেবেছিলাম যে আমি নিজেই সেগুলি ক্রম- আক্রমণকারী এমএনআইএসটি দিয়ে চেষ্টা করব।

ইন আর , আমি চেষ্টা:

randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500)

এটি ২ ঘন্টা চালিয়েছে এবং ২.৮% পরীক্ষার ত্রুটি পেয়েছে।

আমিও চেষ্টা scikit-শিখতে , সঙ্গে

RandomForestClassifier(n_estimators=2000,
                       max_features="auto", 
                       max_depth=None)

70 মিনিটের পরে, আমি একটি 2.9% পরীক্ষার ত্রুটি পেয়েছি, তবে এর পরিবর্তে এন_স্টিমেটারগুলি = ২০০ দিয়ে আমি মাত্র 7 মিনিটের পরে একটি 2.8% পরীক্ষার ত্রুটি পেয়েছি।

সঙ্গে OpenCV , আমি চেষ্টা

rf.train(images.reshape(-1, 28**2), 
         cv2.CV_ROW_SAMPLE, 
         labels.astype('int'))

এটি 6.5 মিনিটের জন্য চলল, এবং rfপূর্বাভাসের জন্য ব্যবহার করে একটি পরীক্ষার ত্রুটি 15% দেওয়া হয়েছিল। আমি জানি না যে এটি কতগুলি গাছ প্রশিক্ষিত করেছে, কারণ এলোমেলো বনগুলির জন্য পাইথন বাঁধাই paramsযুক্তিটিকে উপেক্ষা করে বলে মনে হচ্ছে , কমপক্ষে সংস্করণ ২.৩.১ এ। আমিও চিন্তা করতে পারেনি তা কিভাবে OpenCV সাফ যে, আমি একজন শ্রেণীবিন্যাস সমস্যা সমাধান করতে চান, বরং রিগ্রেশন চেয়ে করা - আমি আমার সন্দেহ হচ্ছে, কারণ প্রতিস্থাপন astype('int')সঙ্গে astype('float32')একই ফলাফল দেয়।

ইন স্নায়ুর নেটওয়ার্ক , জন্য বিন্যাস-পরিবর্তিত MNIST বেঞ্চমার্ক, শিল্প রাজ্যের 0.8% পরীক্ষা ত্রুটি, যদিও প্রশিক্ষণ সম্ভবত এক CPU তে চেয়ে বেশি 2 ঘন্টা লাগবে।

এলোমেলো বন ব্যবহার করে কি এমএনআইএসটিতে 2.8% পরীক্ষার ত্রুটির চেয়ে আরও ভাল কিছু করা সম্ভব? আমি ভেবেছিলাম যে সাধারণ sensকমত্যটি ছিল এলোমেলো বনগুলি সাধারণত কার্নেল এসভিএমগুলির চেয়ে কম ভাল, যা আমি বিশ্বাস করি যে পরীক্ষার ত্রুটিটি 1.4% পেতে পারে।


5
মনে রাখবেন যে এলোমেলো বন একটি সময়ে 1 ভেরিয়েবল (অর্থাত পিক্সেল) সিদ্ধান্ত নিচ্ছে। সুতরাং ইমেজ প্রসেসিং-র জন্য এটি খুব ভাল নয়। আরও অর্থপূর্ণ সিদ্ধান্তের ভেরিয়েবলগুলি বিকাশের জন্য
কোনও প্রকার প্রিপ্রোসেসিং

Seanv507 ঠিক কী বলেছে। বৈশিষ্ট্য নিষ্কাশন করার জন্য ওপেনসিভিতে প্রচুর ফাংশন রয়েছে যা এলোমেলো বনের সাথে কাজ করার জন্য বেশ কার্যকর ব্যাখ্যামূলক ভেরিয়েবল সনাক্ত করতে পারে।
জেকুইয়া

3
আমি ভেবেছিলাম যে সাধারণ sensকমত্যটি ছিল এলোমেলো বনগুলি সাধারণত কার্নেল এসভিএমগুলির চেয়ে কমপক্ষে ভাল । এরকম কোনও sensক্যমত্য নেই।
মার্ক ক্লেসেন

উত্তর:


15

এলোমেলো বন ব্যবহার করে কি এমএনআইএসটিতে 2.8% পরীক্ষার ত্রুটির চেয়ে আরও ভাল কিছু করা সম্ভব?

সম্ভবত হ্যাঁ. তবে এর অর্থ এই নয় যে আপনি পূর্বনির্ধারিতভাবে একই বৈশিষ্ট্যগুলি ব্যবহার করবেন। সাধারণভাবে সিদ্ধান্তের গাছগুলি এর মতো উচ্চ মাত্রিক সমস্যার উপর ভাল কাজ করে না, কারণ আপনি একবারে কেবল একটি বৈশিষ্ট্যে বিভক্ত হয়ে যাচ্ছেন। র্যান্ডম ফরেস্ট সিদ্ধান্ত গাছগুলির কার্যকারিতা প্রসারিত করে তবে তাদের এখনও একই সমস্যা রয়েছে। আরএফ দিয়ে ২.৮% পিটানোর জন্য সম্ভবত আপনাকে কিছু বৈশিষ্ট্য প্রাক-প্রক্রিয়াকরণ করতে হবে এবং বৈশিষ্ট্যগুলিকে আরও দরকারী সাবসেটে রূপান্তর করতে হবে।

নিউরাল নেটওয়ার্ক এবং কার্নেল এসভিএমগুলি সুস্পষ্টভাবে কিছু বৈশিষ্ট্য রূপান্তর / ইঞ্জিনিয়ারিং করছে। সুতরাং কিছুটা অর্থে এর চিত্তাকর্ষক যে র্যান্ডম ফরেস্ট কোনও অতিরিক্ত কাজ ছাড়াই শালীনভাবে কাছাকাছি পৌঁছেছে (সত্যিকার অর্থেই আরএফ জনপ্রিয় হয়ে উঠেছে এটি "যথেষ্ট ভাল" ফলাফল অর্জন করা বোকামিভাবে সহজ ছিল)।

আমি ভেবেছিলাম যে সাধারণ sensকমত্যটি ছিল এলোমেলো বনগুলি সাধারণত কার্নেল এসভিএমগুলির চেয়ে কমপক্ষে ভাল

এরকম কোনও sensক্যমত্য নেই। নির্ভুলতার ক্ষেত্রে তাদের প্রায়শই একই রকম ফলাফল থাকে - তবে তারা বিভিন্ন শক্তি / দুর্বলতাগুলির সাথে খুব আলাদা অ্যালগরিদম। অনেক সমস্যার ক্ষেত্রে যথাযথতা একইরকম, অন্যদের উপর এসভিএমগুলি ভাল ব্যবধানে জয়ী হয়, কিছু আরএফ জিতে ভাল ব্যবধানে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.