এমএনআইএসটিতে প্রশিক্ষিত কোনও মডেলের ডিজিটিক স্বীকৃতি কীভাবে উন্নত করবেন?


12

আমি handprinted বহু অঙ্ক স্বীকৃতি উপর কাজ করছি Javaব্যবহার OpenCVপ্রাক-প্রক্রিয়াকরণ ও সেগমেন্টেশন, এবং একটি জন্য লাইব্রেরী Kerasস্বীকৃতির জন্য মডেল (0.98 একটি সঠিকতা সঙ্গে) MNIST তালিম।

স্বীকৃতি মনে হয় এক জিনিস বাদে বেশ ভাল কাজ করে। নেটওয়ার্ক প্রায়শই এটিগুলি (সংখ্যা "একটি") সনাক্ত করতে ব্যর্থ হয়। বিভাগটি প্রিপ্রোসেসিং / ভুল প্রয়োগের কারণে এটি ঘটে কিনা তা আমি সনাক্ত করতে পারছি না, বা যদি মানক এমএনআইএসটিতে প্রশিক্ষিত কোনও নেটওয়ার্ক কেবল আমার পরীক্ষার কেসের মতো দেখতে প্রথম স্থানটি দেখেনি।

প্রিপ্রোসেসিং এবং বিভাগকরণের পরে সমস্যাযুক্ত অঙ্কগুলি দেখতে দেখতে এখানে:

এখানে চিত্র বর্ণনা লিখুনহয় এখানে চিত্র বর্ণনা লিখুনএবং হিসাবে শ্রেণীবদ্ধ করা হয় 4

এখানে চিত্র বর্ণনা লিখুনহয় এখানে চিত্র বর্ণনা লিখুনএবং হিসাবে শ্রেণীবদ্ধ করা হয় 7

এখানে চিত্র বর্ণনা লিখুনহয় এখানে চিত্র বর্ণনা লিখুনএবং হিসাবে শ্রেণীবদ্ধ করা হয় 4। এবং আরও ...

এটি কি এমন কিছু যা বিভাজন প্রক্রিয়াটির উন্নতি করে স্থির করা যায়? নাকি প্রশিক্ষণের সেট বাড়িয়ে দিয়ে?

সম্পাদনা করুন: প্রশিক্ষণ সেট (ডেটা বর্ধন) বাড়ানো অবশ্যই সাহায্য করবে, যা আমি ইতিমধ্যে পরীক্ষা করে নিচ্ছি, সঠিক প্রিপ্রোসেসিংয়ের প্রশ্ন এখনও রয়ে গেছে।

আমার প্রিপ্রোসেসিং-এ পুনরায় আকার দেওয়া, গ্রেস্কেল, বাইনারিকরণ, বিপরীতকরণ এবং প্রসারণ রচনা রয়েছে। কোডটি এখানে:

Mat resized = new Mat();
Imgproc.resize(image, resized, new Size(), 8, 8, Imgproc.INTER_CUBIC);

Mat grayscale = new Mat();
Imgproc.cvtColor(resized, grayscale, Imgproc.COLOR_BGR2GRAY);

Mat binImg = new Mat(grayscale.size(), CvType.CV_8U);
Imgproc.threshold(grayscale, binImg, 0, 255, Imgproc.THRESH_OTSU);

Mat inverted = new Mat();
Core.bitwise_not(binImg, inverted);

Mat dilated = new Mat(inverted.size(), CvType.CV_8U);
int dilation_size = 5;
Mat kernel = Imgproc.getStructuringElement(Imgproc.CV_SHAPE_CROSS, new Size(dilation_size, dilation_size));
Imgproc.dilate(inverted, dilated, kernel, new Point(-1,-1), 1);

প্রিপ্রোসেসড চিত্রটি স্বতন্ত্র অঙ্কগুলিতে নিম্নলিখিত হিসাবে বিভাগ করা হয়:

List<Mat> digits = new ArrayList<>();
List<MatOfPoint> contours = new ArrayList<>();
Imgproc.findContours(preprocessed.clone(), contours, new Mat(), Imgproc.RETR_EXTERNAL, Imgproc.CHAIN_APPROX_SIMPLE);

// code to sort contours
// code to check that contour is a valid char

List rects = new ArrayList<>();

for (MatOfPoint contour : contours) {
     Rect boundingBox = Imgproc.boundingRect(contour);
     Rect rectCrop = new Rect(boundingBox.x, boundingBox.y, boundingBox.width, boundingBox.height);

     rects.add(rectCrop);
}

for (int i = 0; i < rects.size(); i++) {
    Rect x = (Rect) rects.get(i);
    Mat digit = new Mat(preprocessed, x);

    int border = 50;
    Mat result = digit.clone();
    Core.copyMakeBorder(result, result, border, border, border, border, Core.BORDER_CONSTANT, new Scalar(0, 0, 0));

    Imgproc.resize(result, result, new Size(28, 28));
    digits.add(result);
}

1
আপনি কি আপনার শ্রেণিবিন্যাসের জন্য ইনপুট হিসাবে মাস্ক বা (মাস্কড?) আসল গ্রেস্কেল পিক্সেল ব্যবহার করছেন?
মিকা 14

@ মিকা আমি প্রিপ্রোসেসড (বাইনারিযুক্ত, বিপরীত, প্রসারিত) সংস্করণটি ব্যবহার করছি। এমএনআইএসটি প্রশিক্ষণের সাথে মেলে এমন ব্যক্তিরা। আমার পোস্টে প্রিপ্রোসেসিংয়ের পরে "1" নাম্বারের উদাহরণ রয়েছে।
ইয়ংপান্ডা

উত্তর:


5

আমি বিশ্বাস করি যে আপনার সমস্যা হ্রাস প্রক্রিয়া। আমি বুঝতে পেরেছি যে আপনি চিত্রের আকারগুলি স্বাভাবিক করতে চান তবে আপনার অনুপাতটি ভাঙা উচিত নয়, আপনাকে একটি অক্ষ দ্বারা সর্বাধিক পছন্দসই আকার পরিবর্তন করা উচিত (এমন এক যা অন্য অক্ষের মাত্রা সর্বাধিক আকার ছাড়িয়ে না দিয়েই বৃহত্তম পুনঃ-স্কেলকে অনুমতি দেয়) এবং পূরণ করুন ব্যাকগ্রাউন্ড রঙের সাথে ইমেজটির বাকি অংশ। এটি এমন নয় যে "স্ট্যান্ডার্ড এমএনআইএসটি কেবল এক নম্বরটি দেখেনি যা আপনার পরীক্ষার কেসের মতো দেখায়", আপনি আপনার চিত্রগুলি বিভিন্ন প্রশিক্ষিত সংখ্যার মতো দেখায় (যেগুলি স্বীকৃত)

উত্স ও প্রক্রিয়াজাতকরণ চিত্রগুলির ওভারল্যাপ

যদি আপনি আপনার চিত্রগুলির সঠিক দিকটি রেশন বজায় রাখেন (উত্স এবং পোস্ট-প্রক্রিয়াজাতকরণ), আপনি দেখতে পাচ্ছেন যে আপনি কেবল চিত্রটির আকার পরিবর্তন করেননি তবে এটি "বিকৃত" করেছেন। এটি হয় অ-সমজাতীয় প্রসারণ বা ভুল আকার পরিবর্তনের ফলাফল হতে পারে


আমি বিশ্বাস করি যে @ সিআইআর এর কিছু ওজন রয়েছে, সংখ্যার আখর্যের অনুপাতের অনুপাতটি পরিবর্তন না করে চেষ্টা করুন।
জেডডিআর

দুঃখিত, আমি বেশিরভাগ অনুসরণ করি না। আপনি কি মনে করেন আমার প্রসারণ প্রক্রিয়া বা আকার পরিবর্তন প্রক্রিয়াটি সমস্যা? আমি শুরুতে এই লাইনটি দিয়ে শুরুতে চিত্রটির আকার পরিবর্তন করি Imgproc.resize(image, resized, new Size(), 8, 8, Imgproc.INTER_CUBIC);। এখানে দিক রেশন একই থাকে, আমি অনুপাত কোথায় ভাঙবো?
ইয়ংপান্ডা

@ উপরের আপনার সম্পাদনাগুলির উত্তরে সিআইআর: হ্যাঁ, আমি কেবল চিত্রটিকে পুনরায় আকার দেই না, আমি বিভিন্ন অপারেশন প্রয়োগ করি, এর মধ্যে একটি হ'ল প্রসারণ, যা একটি রূপচর্চা, যা সামান্য "বিকৃতি" সৃষ্টি করে কারণ এটি একটির মধ্যে উজ্জ্বল অঞ্চল সৃষ্টি করে চিত্রটি "বেড়ে উঠতে হবে" Or বা আপনার অর্থ কী একেবারে শেষের দিকে, যেখানে আমি ছবিগুলি 28x28 বানিয়েছি?
ইয়ংপান্ডা

@ ইয়ুংপান্ডা, আপনি এখানে আলোচনাটি স্ট্যাকওভারফ্লো / কোয়েশনস / ২৮৮৫২৪৪436 / আকর্ষণীয় দেখতে পাবেন। এটি হয়ত আপনাকে একটি ক্লু দেয় যে কেন আপনার পদ্ধতির ভাল ফলাফল আসে না
সিআর

@ সিআইআর এই লিঙ্কটির জন্য আপনাকে ধন্যবাদ জানায়, আমি লেনেটের সাথে পরিচিত, তবে এটি আবার পড়তে ভালো
লাগছে

5

ইতিমধ্যে কিছু উত্তর পোস্ট করা হয়েছে তবে এগুলির কোনওটিই চিত্র প্রাকপ্রসেসিং সম্পর্কে আপনার আসল প্রশ্নের উত্তর দেয় না ।

আমার পালাটিতে আমি আপনার বাস্তবায়নের ক্ষেত্রে কোনও উল্লেখযোগ্য সমস্যা দেখতে পাচ্ছি না যতক্ষণ না এটি একটি সমীক্ষা প্রকল্প, ভাল কাজ হয়ে গেছে।

তবে একটি জিনিস খেয়াল করার জন্য আপনি মিস করতে পারেন। গাণিতিক রূপচর্চায় মৌলিক ক্রিয়াকলাপ রয়েছে: ক্ষয় এবং প্রসারণ (আপনি ব্যবহৃত)। এবং সেখানে জটিল অপারেশন: বেসিকগুলির বিভিন্ন সংমিশ্রণ (যেমন উদ্বোধন এবং সমাপ্তি)। উইকিপিডিয়া লিঙ্কটি সেরা সিভি রেফারেন্স নয়, তবে আপনি ধারণাটি পেতে এটি দিয়ে শুরু করতে পারেন।

সাধারণত ক্ষয়ের পরিবর্তে খোলার এবং প্রসারণের পরিবর্তে বন্ধ করার পরিবর্তে এই ক্ষেত্রে আসল বাইনারি চিত্রটি খুব কম পরিবর্তিত হয় (তবে ধারালো প্রান্তগুলি পরিষ্কার করার বা ফাঁক ফাঁক পূরণের কাঙ্ক্ষিত প্রভাব পৌঁছে যায়) is সুতরাং আপনার ক্ষেত্রে আপনার ক্লোজিংটি পরীক্ষা করা উচিত (একই কার্নেলের সাথে ক্ষয়ের পরে চিত্রের বিস্তৃতি)। অতিরিক্ত-ছোট চিত্র 8 * 8 এর ক্ষেত্রে আপনি যখন 1 * 1 কার্নেল (1 পিক্সেলের চেয়ে বেশি চিত্রের চেয়ে 16% এর বেশি) ডিলিট করেন তখন বড় আকারে সংশোধন করা হয় যা বড় চিত্রগুলিতে কম থাকে "।

ধারণাটি কল্পনা করতে নীচের চিত্রগুলি দেখুন (ওপেনসিভি টিউটোরিয়াল: 1 , 2 থেকে ):

প্রসারণ: আসল প্রতীক এবং একটি dilated

বন্ধ: মূল প্রতীক এবং একটি বন্ধ

আশা করি এটা সাহায্য করবে.


ইনপুট জন্য আপনাকে ধন্যবাদ! আসলে এটা না একটি গবেষণা প্রকল্প, তাই কি সমস্যা তারপর হবে? .. আমার ইমেজ বেশ বড় যখন আমি প্রসারণ প্রযোজ্য 8x8 ইমেজ আকার নয়, এটা উচ্চতা এবং প্রস্থ জন্য মাপ ফ্যাক্টর আছে। তবে এটি বিভিন্ন গাণিতিক ক্রিয়াকলাপ চেষ্টা করে দেখতে উন্নত বিকল্প হতে পারে। আমি খোলার এবং বন্ধ হওয়ার বিষয়ে জানতাম না, আমি এটি চেষ্টা করে দেখব! ধন্যবাদ.
ইয়ংপান্ডা

আমার দোষ, অপরিবর্তিত পুনরায় আকারের কলটি যেমন নতুন আকার হিসাবে 8 * 8 ছিল। আপনি যদি সত্যিকারের বিশ্বে ওসিআর ব্যবহার করতে চান তবে আপনি আপনার ব্যবহারের ক্ষেত্রে নির্দিষ্ট ডেটাতে আপনার মূল নেট শিখার স্থানান্তর করার বিকল্প বিবেচনা করবেন। এটি নির্ভুলতার উন্নতি করে কিনা তা অন্তত যাচাই করুন, সাধারণত এটি করা উচিত।
f4f

আর একটি জিনিস যাচাই করার জন্য হ'ল গ্রেডস্কেল-> বাইনারি-> বিপরীত-> আকার পরিবর্তন করুন ize আকার পরিবর্তন একটি ব্যয়বহুল ক্রিয়াকলাপ এবং এটি রঙিন ইমেজে প্রয়োগ করার প্রয়োজন দেখছি না। এবং আপনার কিছু নির্দিষ্ট ইনপুট ফর্ম্যাট থাকলে কনট্যুর সনাক্তকরণ ছাড়াই প্রতীকগুলি পৃথককরণ করা যেতে পারে (কম ব্যয়বহুল কিছু সহ) তবে এটি কার্যকর করা কঠিন হতে পারে।
f4f

আমার কাছে যদি এমএনআইএসটি বাদে অন্য একটি ডেটাसेट থাকে তবে আমি স্থানান্তর শেখার চেষ্টা করতে পারি :) আমি প্রিপ্রসেসিং ক্রম পরিবর্তন করার চেষ্টা করব এবং আপনার কাছে ফিরে আসব। ধন্যবাদ! এখনও আমার সমস্যার জন্য কনট্যুর সনাক্তকরণের চেয়ে সহজ বিকল্প আমি খুঁজে পাইনি ...
ইয়ংপান্ডা

1
ঠিক আছে. আপনি সেই চিত্রগুলি থেকে নিজেকে ডেটাসেট সংগ্রহ করতে পারেন এটিতে একটি সাধারণ অভ্যাসের উপর আপনি ওসিআর ব্যবহার করবেন।
f4f

4

সুতরাং, আপনার পূর্ববর্তী ফলাফলের উপর ভিত্তি করে আপনার কম্পিউটিং ক্যাসকেডের প্রতিটি পদক্ষেপের জটিল পদ্ধতির প্রয়োজন। আপনার অ্যালগরিদমে আপনার পরবর্তী বৈশিষ্ট্য রয়েছে:

  1. চিত্র প্রাকপ্রসেসিং

পূর্বে উল্লিখিত হিসাবে, আপনি যদি পুনরায় আকারটি প্রয়োগ করেন তবে আপনি চিত্রটির দিক অনুপাত সম্পর্কে তথ্য হারাবেন। প্রশিক্ষণ প্রক্রিয়াতে অন্তর্ভুক্ত একই ফলাফলগুলি পেতে আপনাকে একইভাবে অঙ্কের চিত্রগুলির পুনরায় প্রসেসিং করতে হবে।

আপনি যদি ঠিক আকারের ছবি দ্বারা চিত্রটি ক্রপ করেন তবে আরও ভাল উপায়। সেই রূপটিতে আপনার প্রশিক্ষণের প্রক্রিয়া করার আগে অঙ্কের সন্ধান এবং আকার পরিবর্তন করতে হবে না cont তারপরে আপনি আরও ভাল করে সনাক্ত করার জন্য আপনার ক্রপ অ্যালগরিদমে কিছুটা পরিবর্তন করতে পারেন: স্বতন্ত্র কনট্যুরটি সন্ধান করুন এবং স্বীকৃতির জন্য প্রাসঙ্গিক চিত্র ফ্রেমের কেন্দ্রে কোনও আকার পরিবর্তন না করে নিজের অঙ্কটি রাখুন।

এছাড়াও আপনার দ্বির্মুখীকরণ অ্যালগরিদমের প্রতি আরও মনোযোগ দেওয়া উচিত। শেখার ত্রুটিতে দ্বির্মুখীকরণ থ্রেশহোল্ড মানগুলির প্রভাব অধ্যয়ন করার অভিজ্ঞতা পেয়েছি: আমি বলতে পারি যে এটি একটি খুব গুরুত্বপূর্ণ উপাদান। এই ধারণাটি পরীক্ষা করতে আপনি বাইনারিাইজের আরও একটি অ্যালগরিদম চেষ্টা করতে পারেন। উদাহরণস্বরূপ আপনি বিকল্প বাইনারিাইজেশন অ্যালগরিদমগুলি পরীক্ষা করার জন্য এই লাইব্রেরিটি ব্যবহার করতে পারেন ।

  1. অ্যালগরিদম শিখছে

স্বীকৃতির গুণমান উন্নত করতে আপনি প্রশিক্ষণ প্রক্রিয়াতে ক্রস-বৈধতা ব্যবহার করেন। এটি আপনার সমস্যা এড়ানোর সাহায্য করে overfitting আপনার প্রশিক্ষণ ডেটার জন্য। উদাহরণস্বরূপ আপনি এই নিবন্ধটি পড়তে পারেন যেখানে কেরাসের সাথে এটি কীভাবে ব্যবহার করা যায় তা ব্যাখ্যা করা হয়েছে।

কখনও কখনও উচ্চতর নির্ভুলতার পরিমাপের সত্যিকারের স্বীকৃতি মানের কারণ প্রশিক্ষণ প্রাপ্ত এএনএন প্রশিক্ষণের ডেটাতে প্যাটার্নটি খুঁজে পায়নি anything এটি উপরে বর্ণিত হিসাবে প্রশিক্ষণ প্রক্রিয়া বা ইনপুট ডেটাসেটের সাথে সংযুক্ত থাকতে পারে বা এটিএএনএন আর্কিটেকচার দ্বারা চয়ন হতে পারে।

  1. এএনএন আর্কিটেকচার

এটি একটি বড় সমস্যা। টাস্কটি সমাধান করার জন্য কীভাবে আরও উন্নত এএনএন আর্কিটেকচারটি সংজ্ঞায়িত করবেন? জিনিসটি করার কোনও সাধারণ উপায় নেই। তবে আদর্শের আরও কাছে যাওয়ার কয়েকটি উপায় রয়েছে। উদাহরণস্বরূপ আপনি এই বইটি পড়তে পারেন । এটি আপনাকে আপনার সমস্যার জন্য আরও ভাল দৃষ্টি তৈরি করতে সহায়তা করে। এছাড়াও আপনি এখানে আপনার এএনএন এর জন্য লুকানো স্তর / উপাদানগুলির সংখ্যা ফিট করতে কিছু হিউরিস্টিক সূত্র পেতে পারেন। এছাড়াও এখানে আপনি এই জন্য একটি সামান্য ওভারভিউ পাবেন।

আমি আশা করি এটি সাহায্য করবে।


১. যদি আমি আপনাকে সঠিকভাবে বুঝতে পারি তবে আমি স্থির আকারে ক্রপ করতে পারছি না, এটি একটি বহু ডিজিটের সংখ্যার ছবি এবং সমস্ত ক্ষেত্রে আকার / স্থানে আলাদা Or বা আপনার অর্থ কিছু আলাদা ছিল? হ্যাঁ, আমি বিভিন্ন বাইনারিাইজেশন পদ্ধতি এবং টুইটারের প্যারামিটারগুলি চেষ্টা করেছি, যদি এটি আপনি বোঝাতে চান। ২. প্রকৃতপক্ষে এমএনআইএসটিতে স্বীকৃতি দুর্দান্ত, এখানে খুব বেশি কিছু ঘটছে না, আমি যে যথার্থতা উল্লেখ করেছি তা পরীক্ষার যথার্থতা। নেটওয়ার্ক বা এর প্রশিক্ষণ দুটিই সমস্যা নয়। ৩. সমস্ত লিঙ্কের জন্য ধন্যবাদ, আমি যদিও আমার আর্কিটেকচারে বেশ খুশি, অবশ্যই উন্নতির জন্য সবসময়ই জায়গা রয়েছে।
ইয়ংপান্ডা

হ্যাঁ, আপনি এটি পেয়েছেন তবে আপনার ডেটাসেটটিকে আরও একীভূত করার জন্য আপনার সর্বদা সম্ভাবনা থাকে। আপনার ক্ষেত্রে ইতিমধ্যে যেমন করা হয়েছে তেমন অঙ্কের দ্বারা অঙ্কের চিত্রগুলি কাটা আরও ভাল। তবে এর পরে x এবং y স্কেল দ্বারা কোনও ডিজিটের চিত্রের সর্বাধিক আকার অনুসারে আপনার সংখ্যার চিত্রগুলি ইউনিফাইড আকারে প্রসারিত করা ভাল। আপনি এটি করতে ডিজিটের কনট্যুর অঞ্চলের কেন্দ্র পছন্দ করতে পারেন। এটি আপনার প্রশিক্ষণের অ্যালগোরিদমের জন্য আরও পরিষ্কার ইনপুট ডেটা দেবে।
ডিমের জামোটায়েভ

তুমি কি বলতে চাও যে আমাকে বিসর্জন দিতে হবে? শেষের দিকে আমি ইতিমধ্যে চিত্রটি মাঝখানে রেখেছি, যখন আমি সীমানাটি প্রয়োগ করি (প্রতিটি দিকে 50 পিক্সেল)। এর পরে আমি প্রতিটি অঙ্ককে 28x28 এ আকার দিচ্ছি, যেহেতু এমএনআইএসটির জন্য এটি আমাদের প্রয়োজনীয় আকার size আপনার অর্থ কি আমি পৃথকভাবে 28x28 এর আকার পরিবর্তন করতে পারি?
ইয়ংপান্ডা

1
হ্যাঁ, প্রসারণ অযাচিত। আপনার সংক্ষিপ্তসারগুলির উচ্চতা এবং প্রস্থের দ্বারা আলাদা অনুপাত থাকতে পারে, এজন্য আপনার এখানে আপনার অ্যালগোরিদমের উন্নতি প্রয়োজন। কমপক্ষে আপনার একই অনুপাত সহ চিত্রের মাপ করা উচিত। যেহেতু আপনার কাছে 28x28 ইনপুট ছবির আকার রয়েছে, আপনাকে অবশ্যই x এবং y স্কেল দ্বারা একই 1: 1 অনুপাত সহ চিত্রগুলি প্রস্তুত করতে হবে। প্রতিটি ছবির পাশের জন্য আপনার 50 পিক্সের সীমানা পাওয়া উচিত নয়, তবে এক্স, ওয়াই পিএক্স সীমানা যা শর্তটি পূরণ করে: কনট্যুর সাইজএক্স + বর্ডারসাইজএক্স == কনট্যুর সাইজওয়াই + বর্ডারসাইজওয়াই। এখানেই শেষ.
ডিম জামোটেভ

আমি ইতিমধ্যে প্রসারণ ছাড়াই চেষ্টা করেছি (পোস্টে উল্লেখ করতে ভুলে গেছি)। এটি কোনও ফলাফল পরিবর্তন করে নি ... আমার সীমান্ত নম্বরটি পরীক্ষামূলক ছিল। আদর্শভাবে আমার 20x20 বাক্সে ফিট করার জন্য আমার অঙ্কগুলি প্রয়োজন (ডেটাসেটের মতো আকার-সাধারণকরণ) এবং তারপরে এটি ভর কেন্দ্রকে ব্যবহার করে স্থানান্তরিত করুন ...
ইয়ংপান্ডা

1

কিছু গবেষণা এবং পরীক্ষা-নিরীক্ষার পরে, আমি এই সিদ্ধান্তে পৌঁছেছি যে ইমেজটি নিজেই প্রসেসোসিংয়ের সমস্যা ছিল না (যেমন আমি কিছু প্রস্তাবিত প্যারামিটারগুলি পরিবর্তন করেছি, যেমন উদ্বোধনের আকার এবং আকার তবে সেগুলি ফলাফলের পক্ষে গুরুত্বপূর্ণ ছিল না)। তবে 2 টি নিম্নলিখিত জিনিসগুলি কী সাহায্য করেছিল:

  1. @ F4f হিসাবে লক্ষ্য করা গেছে যে, বাস্তব জগতের ডেটা সহ আমার নিজের ডেটাসেট সংগ্রহ করা দরকার। এটি ইতিমধ্যে দুর্দান্ত সাহায্য করেছে helped

  2. আমি আমার সেগমেন্টেশন প্রিপ্রোসেসিংয়ে গুরুত্বপূর্ণ পরিবর্তন করেছি। স্বতন্ত্র রূপ নেওয়ার পরে, আমি চিত্রগুলি প্রথম 20x20পিক্সেল বাক্সে ফিট করার জন্য আকার-স্বাভাবিক করি (তারা যেমন থাকে তেমন MNIST)। এর পরে আমি 28x28ভর কেন্দ্রকে (যা বাইনারি চিত্রগুলির জন্য উভয় মাত্রার মধ্যবর্তী গড় মূল্য) ব্যবহার করে চিত্রের মাঝখানে বক্সটি কেন্দ্র করে রাখি ।

অবশ্যই, ওভারল্যাপিং বা সংযুক্ত অঙ্কগুলির মতো এখনও পৃথক বিভাগের জটিল সমস্যা রয়েছে, তবে উপরের পরিবর্তনগুলি আমার প্রাথমিক প্রশ্নের উত্তর দিয়েছে এবং আমার শ্রেণিবিন্যাসের কার্যকারিতা উন্নত করেছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.