আমি একটি রিগ্রেশন সমস্যা নিয়ে কাজ করছি যেখানে ইনপুটটি একটি চিত্র এবং লেবেলটি 80 এবং 350 এর মধ্যে একটি অবিচ্ছিন্ন মান। ছবিগুলি প্রতিক্রিয়া হওয়ার পরে কিছু রাসায়নিকের are যে রঙটি বেরিয়ে আসে তা অন্য রাসায়নিকের ঘনত্বকে বোঝায় যা ছেড়ে গেছে এবং সেই মডেলের আউটপুট - সেই রাসায়নিকের ঘনত্ব। চিত্রগুলি ঘোরানো, উল্টানো, মিরর করা যেতে পারে এবং প্রত্যাশিত আউটপুটটি এখনও একই রকম হওয়া উচিত। এই ধরণের বিশ্লেষণটি বাস্তব ল্যাবগুলিতে করা হয় (খুব বিশেষ মেশিনগুলি রঙ বিশ্লেষণ ব্যবহার করে রাসায়নিকগুলির ঘনত্বকে আউটপুট দেয় ঠিক যেমন আমি এই মডেলটি করতে প্রশিক্ষণ দিচ্ছি)।
এখনও অবধি আমি মোটামুটি ভিজিজি ভিত্তিক মডেলগুলির সাথে পরীক্ষা করেছি (কনভ-কন-কন-কন-পুল ব্লকের একাধিক ক্রম)। আরও সাম্প্রতিক আর্কিটেকচার (ইনসেপশন, রেসনেটস, ইত্যাদি) নিয়ে গবেষণা করার আগে আমি ভেবেছিলাম ছবিগুলি ব্যবহার করে রিগ্রেশন করার জন্য যদি অন্য কোনও স্থাপত্যগুলি বেশি ব্যবহৃত হয় তবে আমি গবেষণা করতাম।
ডেটাসেটটি এরকম দেখাচ্ছে:
ডেটাসেটে প্রায় 5,000 250x250 টি নমুনা রয়েছে, যা আমি x৪x৪৪ এ পরিবর্তন করেছি যাতে প্রশিক্ষণ সহজ হয় easier একবার আমি একটি প্রতিশ্রুতিবদ্ধ আর্কিটেকচারটি খুঁজে পেয়েছি, আমি আরও বড় রেজোলিউশন ইমেজ নিয়ে পরীক্ষা করব।
এখনও অবধি, আমার সেরা মডেলগুলির প্রায় 0.3 এর প্রশিক্ষণ এবং বৈধতা উভয় সেটগুলিতে একটি গড় স্কোয়ার ত্রুটি রয়েছে, যা আমার ব্যবহারের ক্ষেত্রে গ্রহণযোগ্য নয়।
আমার সেরা মডেলটি এখনও অবধি এমন দেখাচ্ছে:
// pseudo code
x = conv2d(x, filters=32, kernel=[3,3])->batch_norm()->relu()
x = conv2d(x, filters=32, kernel=[3,3])->batch_norm()->relu()
x = conv2d(x, filters=32, kernel=[3,3])->batch_norm()->relu()
x = maxpool(x, size=[2,2], stride=[2,2])
x = conv2d(x, filters=64, kernel=[3,3])->batch_norm()->relu()
x = conv2d(x, filters=64, kernel=[3,3])->batch_norm()->relu()
x = conv2d(x, filters=64, kernel=[3,3])->batch_norm()->relu()
x = maxpool(x, size=[2,2], stride=[2,2])
x = conv2d(x, filters=128, kernel=[3,3])->batch_norm()->relu()
x = conv2d(x, filters=128, kernel=[3,3])->batch_norm()->relu()
x = conv2d(x, filters=128, kernel=[3,3])->batch_norm()->relu()
x = maxpool(x, size=[2,2], stride=[2,2])
x = dropout()->conv2d(x, filters=128, kernel=[1, 1])->batch_norm()->relu()
x = dropout()->conv2d(x, filters=32, kernel=[1, 1])->batch_norm()->relu()
y = dense(x, units=1)
// loss = mean_squared_error(y, labels)
প্রশ্ন
একটি চিত্র ইনপুট থেকে রিগ্রেশন আউটপুট জন্য উপযুক্ত স্থাপত্য কি?
সম্পাদন করা
আমি আমার ব্যাখ্যাটি পুনরায় চাপিয়ে দিয়েছি এবং নির্ভুলতার উল্লেখগুলি মুছে ফেলেছি।
সম্পাদনা 2
আমি আমার প্রশ্নের পুনর্গঠন করেছি তাই আশা করি এটি পরিষ্কার হয়ে গেছে আমি কী করছি