বাস্তবসম্মত রেন্ডারিং: মানুষের চোখ এবং মস্তিষ্কের কোন প্রক্রিয়াগুলি আমার বিবেচনা করা উচিত?

প্রকৃত ক্যামেরা এটি ক্যাপচার করবে বলে চিত্রিতাত্ত্বিক রেন্ডারিংয়ের লক্ষ্য রয়েছে কোনও চিত্রের রেন্ডারিংয়ের । যদিও এটি ইতিমধ্যে একটি উচ্চাভিলাষী লক্ষ্য, নির্দিষ্ট পরিস্থিতিতে আপনি এটি আরও গ্রহণ করতে চাইতে পারেন: একটি চিত্র রেন্ডার করুন যেমন মানুষের চোখ এটি ধারণ করবে বা এমনকি মানুষ এটি উপলব্ধি করবে। আপনি এটিকে ভিজিওরিয়ালিস্টিক বা পার্সেপটিওরিয়ালিস্টিক রেন্ডারিং বলতে পারেন, তবে কেউ যদি ধরা পড়ার শর্তটি নিয়ে আসতে পারেন (বা আমাকে বলতে পারেন যে ইতিমধ্যে একটি বিদ্যমান রয়েছে) আমি এটির প্রশংসা করব।

আমার বক্তব্য পরিষ্কার করার জন্য এখানে কয়েকটি উদাহরণ দেওয়া হল। আপনি যখন কম আলোকসজ্জার স্তরে কোনও ক্যামেরা সহ ছবি তোলেন, আপনি হয় একটি ভাল লেন্স রাখেন বা একটি শোরগোলের চিত্র পাবেন। একটি মানবিক পর্যবেক্ষক জন্য, scotopic দৃষ্টি মধ্যে kicks এবং বৃদ্ধি দেয় Purkinje প্রভাব (রং নীল দিকে স্থানান্তরিত করা হয়)। এই প্রভাবটি এইচডিআর লুমিন্যান্স তথ্যের উপর নির্ভর করে, যা আমি যখন কোনও এলডিআর ডিসপ্লেতে চিত্রটি প্রদর্শন করি তখন হারিয়ে যায়। এছাড়াও, মানব মস্তিষ্ক অনুভূত চিত্রটি 'ফিল্টার' করতে গভীরতার তথ্য ব্যবহার করতে পারে - এমন তথ্য যা চূড়ান্ত (নন-স্টিরিও) রেন্ডারিংয়ে হারিয়ে যায়।

একটি বিস্তৃত তালিকা জড়ো করা সম্ভবত একটি অধরা লক্ষ্য। চোখ এবং মস্তিস্কের যে প্রভাবগুলি আমার বিবেচনা করা উচিত তা কি আপনি বলতে পারেন?

human-vision

— ডেভিড কুড়ি
সূত্র

আমি একবার শুনেছিলাম যে আমরা ক্যামেরার চেয়ে একই শব্দ পাই কারণ শব্দটি কেবল শারীরিক এবং কেবল বৈদ্যুতিক নয়। (অর্থাত্ এতগুলি ফোটন পরে নেই)। কিন্তু মস্তিষ্ক এটি মুছে দেয়, টেম্পোরাল অ্যান্টিঅ্যালিয়াসিং ব্যবহার করে আমি গণনা করি। (অর্থাত্‍ রাতে আমরা প্রচুর গতি ঝাপসা দেখি)।

— v.oddou

আমি বেশ ধারণা পাই না। আপনি যদি কম আলোতে একটি চিত্র রেন্ডার করেন এবং একটি পূর্কিঞ্জি এফেক্ট সিমুলেট করেন, তবে এটি বাস্তববাদী মনে হবে না কারণ মানুষের চোখ তার নিজস্ব প্রভাব যুক্ত করবে, তাই না?

— ইয়ভেস দাউস্ট

@ ইয়ভেসডাউস্ট যেহেতু চিত্রটি অজানা আলো পরিস্থিতিতে এলডিআর মনিটরে দেখানো হয়েছে, সম্ভবত তা নয়। সোজা কথায়, আপনি পর্দায় যে চিত্রটি দেখছেন তা আরও উজ্জ্বল হবে যাতে এটি উপলব্ধি করা সহজ। যদি আমরা কোনও এইচডিআর মনিটর ব্যবহার করতাম এবং একটি রাতের সময়ের দৃশ্যের আলোকিত মানগুলি পুনরুত্পাদন করতে পারি (এবং অন্যথায় অন্ধকার ঘর আছে), আপনি ঠিক বলেছেন।

— ডেভিড কুড়ি

আপনার জন্য যা চেষ্টা করা হচ্ছে তাতে কোনও ভুল নেই, তবে আমি ভয় করি যে এটি আমার কাছে কিছুটা বিস্তৃত বলে মনে হচ্ছে কারণ আমাদের বিবেচনা করা দরকার এমন অনেকগুলি প্রভাব রয়েছে। আমি এটি এসই ফর্ম্যাটে লিখতে পারিনি, কারণ এটি সত্যই ভুল হবে। তবে আপনি যদি আপনার সুযোগটি কিছুটা সামঞ্জস্য করেন তবে এটি শুরু করা সহজ হওয়ার চেয়ে "আপনারা কীভাবে আমার বিবেচনা করতে হবে এমন কিছু পরামর্শের পরামর্শ দিতে পারেন" ?

— joojaa

@ Joojaa আপনার পরামর্শ অনুসারে আমি প্রশ্নগুলি পরিবর্তন করেছি, ধন্যবাদ।

— ডেভিড কুড়ি

উত্তর:

আপনি এটি আরও গ্রহণ করতে চাইতে পারেন: একটি চিত্র রেন্ডার করুন যেমন মানুষের চোখ এটি ক্যাপচার করবে বা এমনকি মানুষের এটি উপলব্ধি করবে।

এটি ব্যাখ্যা করার দুটি উপায় রয়েছে। দুটোই করবো।

ব্যাখ্যা 1: ধারণাটি বাস্তবসম্মত মনে হয় এমন একটি চিত্র রেন্ডার করুন।

দিনের শেষে, আপনার চিত্রটি কোথাও কোথাও প্রদর্শিত হওয়া দরকার । এখানে কীটি রয়েছে: আপনি নিজের চিত্রটি এমনভাবে রেন্ডার করতে চান যে আপনি যখন কোনও চিত্রের নির্দিষ্ট কোনও ডিভাইসে সেই চিত্রটি * প্রদর্শন * করেন, তখন এটি একই সংবেদন তৈরি করবে যে আসল রেডিওমেট্রিক চিত্রটি তৈরি করেছিল।

কীভাবে এই ধারণাটি আনপ্যাক করা যায় তা এখানে।

বাস্তব বিশ্বে, রেডিওমেট্রিক স্পেকট্রা (অর্থাত, আলোর প্রকৃত বিতরণ) আপনার চোখে প্রবেশ করে এবং প্রায় ¹ চার আলোক সংবর্ধককে উদ্দীপিত করে। রিসেপ্টরগুলির উদ্দীপনাগুলি আমরা চিত্রগুলির সাথে সংযুক্ত রঙের সংবেদনগুলি তৈরি করি।

রেন্ডারিংয়ে, আমরা যে বর্ণালী তৈরি করি তার উপর আমাদের নির্বিচারে নিয়ন্ত্রণ নেই। ভাগ্যক্রমে, যেহেতু আমাদের (সাধারণত) কেবল তিনটি শঙ্কু থাকে, যার প্রত্যেকটিতে কেবল একটি স্কেলারের মান উৎপন্ন হয়, ঠিক তিনটি প্রাথমিকের ব্যবহার করে রঙিন দৃষ্টি পুনরুত্পাদন করা যেতে পারে। নীচের লাইনটি হ'ল আপনি কেবল তিনটি তরঙ্গদৈর্ঘ্যের রৈখিক সংমিশ্রণটি ব্যবহার করে যে কোনও বর্ণ সংবেদন তৈরি করতে পারবেন (কয়েকটি রঙ যা নেতিবাচক হতে পারে, সেক্ষেত্রে আপনি কেবল বিভিন্ন প্রাইমারি ব্যবহার করেন)।

আপনার কাছে প্রাথমিকের পছন্দ নেই a প্রায় সব রঙিন ডিসপ্লে ডিভাইসগুলি এসআরজিবি স্ট্যান্ডার্ড ব্যবহার করে, যা তিনটি প্রাইমারি সরবরাহ করে (যা সাধারণত একটি তরঙ্গদৈর্ঘ্য না থাকে)। এটি ঠিক আছে কারণ দেখা যাচ্ছে যে এটি সমস্ত বিমূর্ত এবং আপনাকে যত্ন নিতে হবে না।

যথাযথভাবে যথাযথভাবে রেন্ডারিংয়ের জগাখিচুড়ি পরিষ্কার করার জন্য, এখানে আলগোরিদিম রয়েছে:

সঠিক রেডিওমেট্রিক গণনা ব্যবহার করে আপনার চিত্রটি রেন্ডার করুন। আপনি পৃথক তরঙ্গ দৈর্ঘ্যের আলোর তরঙ্গদৈর্ঘ্যের বালতিগুলি সনাক্ত করতে পারেন। যাই হোক. শেষ অবধি, আপনার একটি চিত্র রয়েছে যা প্রতিটি পয়েন্টে বর্ণালীটির প্রতিনিধিত্ব করে।
প্রতিটি পিক্সেল এ, আপনি যে বর্ণালীটি রেন্ডার করেছিলেন সেগুলি নিয়ে যান এবং এটিকে CIE XYZ রঙের জায়গাতে রূপান্তর করেন । এটি স্ট্যান্ডার্ড পর্যবেক্ষক ফাংশনগুলির সাথে বর্ণালীটির পণ্য সংহত করার জন্য কাজ করে (সিআইই এক্সওয়াইজেড সংজ্ঞা দেখুন) ।
এটি তিনটি স্কেলারের মান উত্পন্ন করে, যা সিআইই এক্সওয়াইজেড রঙ।
এটিকে রৈখিক আরজিবিতে রূপান্তর করতে একটি ম্যাট্রিক্স ট্রান্সফর্ম ব্যবহার করুন এবং তারপরে লিনিয়ার আরজিবিকে এসআরজিবিতে রূপান্তর করতে লিনিয়ার / পাওয়ার ট্রান্সফর্ম ব্যবহার করুন ।
ভাসমান বিন্দু থেকে uint8 তে রূপান্তর করুন এবং মানগুলি পরিসীমা ছাড়িয়ে বাঁচান (আপনার মনিটর সেগুলি উপস্থাপন করতে পারে না)।
Uint8 পিক্সেল ফ্রেমবফার প্রেরণ করুন।
ডিসপ্লেটি এসআরজিবি রঙগুলিতে নেয়, বিশেষ তীব্রতার তিনটি প্রাথমিকের উত্পাদন করতে বিপরীত রূপান্তর করে। প্রতিটি চিত্র উপাদান এর জন্য দায়বদ্ধ এর আউটপুট কে স্কেল করে। ছবির উপাদানগুলি আলোকসজ্জা করে, একটি বর্ণালী তৈরি করে। এই বর্ণালীটি আপনার প্রত্যাশিত মূল বর্ণালীটির ( আশাবাদী ) একটি রূপক হবে ।
আপনি বর্ণালী বুঝতে পেরেছিলেন যেমন আপনি রেন্ডার বর্ণালী বুঝতে পেরেছিলেন।

ব্যাখ্যা 2: মানব চোখ ভিজ্যুয়ালাইজেশনের উদ্দেশ্যে বা এলডিআর প্রদর্শনগুলির জন্য ক্ষতিপূরণের জন্য প্রাপ্ত শেষ ডেটা সিমুলেট করার চেষ্টা করে।

আমি মনে করি এটির একটি কম কার্যকর অর্থ রয়েছে। মূলত, আপনি এমন একটি চিত্র তৈরি করার চেষ্টা করছেন যা মস্তিষ্কের আনন্দ / মুনাফার জন্য যেভাবে বোঝায় সেভাবে টুইট করে।

উদাহরণস্বরূপ, এই বছর সিগগ্রাফে একটি কাগজ ছিল যেখানে তারা অনুমানকৃত চিত্রগুলি বর্ণনামূলকভাবে পৃথক করে তুলতে রঙিন হ্রাস এবং অনুকরণের সিমুলেট করে। অবশ্যই তারা এগুলি করার একমাত্র কারণ হ'ল আমরা যে ডিসপ্লেগুলির সাথে কাজ করছি তা হ'ল সমস্ত নিম্ন-গতিশীল রেঞ্জ (এলডিআর)। মূল বিষয়টি হ'ল প্রকৃত উচ্চ গতিশীল পরিসীমা (এইচডিআর) বাস্তব চিত্রের ডেটা হিসাবে প্রদর্শিত হলে কেউ যদি দেখতে পারা যায় এমন প্রভাবগুলির অনুকরণ করে।

অনুশীলনে, এটি খুব ভাল কাজ না করে দেখা যাচ্ছে। আফটারিমাজের জন্য, উদাহরণস্বরূপ, আমরা একটি খুব উজ্জ্বল উদ্দীপনা ক্লান্তিকর রঙের কোষগুলির কারণে afterimages দেখতে পাই। এর পরিবর্তে যদি আপনি জাল আফটারিমেজের সাথে প্রভাবটি উদ্দীপনার চেষ্টা করেন তবে এটি দেখতে অনুরূপ হতে পারে - তবে এটি যেহেতু একেবারে আলাদা প্রক্রিয়া, এটি খুব দৃ .়প্রত্যয়ী নয়।

আপনি যদি এটির দিকে যেতে চান তবে এই ধরণের গ্রাফিকগুলি সাহিত্যে আসলেই অপ্রত্যাশিত। উল্লিখিত কাগজটি আমাদের কাছে অত্যাধুনিক অত্যাধুনিক পদ্ধতির আরও কম-বেশি উদাহরণ। আমার মনে হয় বর্তমান sensক্যমত্যটি হ'ল এটি যে অনুকরণ করার চেষ্টা করা সত্য নয় (কমপক্ষে এই সময়ে), সর্বোপরি আপনি কেবল ভিন্ন ভিন্ন ব্যক্তিকে প্রতিস্থাপনের মাধ্যমে বাস্তব দৃষ্টিকোণের প্রভাবগুলির কাছাকাছি যেতে চাইছেন এবং এটি সত্যিকারের নয় হবে।

¹ রড + 3 * শঙ্কু, সাধারণ ক্ষেত্রে। আনুমানিক কারণ মানুষের মধ্যে কম্পনিক সর্বাধিক সাত পর্যন্ত শূন্য কার্যক্ষম হালকা রিসেপ্টর থাকতে পারে (সর্বোচ্চ দেখা গেছে পাঁচটি)।

— imallett
সূত্র

আপনার উত্তরের জন্য ধন্যবাদ. যদিও আমি এটিকে অসম্পূর্ণ বলে মনে করি। ব্যাখ্যা 1 থেকে আপনার বক্তব্য "আপনি বর্ণালী বুঝতে পেরেছেন যে আপনি রেন্ডার বর্ণালী বুঝতে পেরেছেন" তর্কাতীতত ভুল। আসল বর্ণালী অনুধাবন করার সময়, আপনি বর্ণিত রূপান্তরটি ব্যবহার করার সময় প্রভাবগুলি কিক করে না (যেমন জেমসন, হুরভিচ: ভিজ্যুয়াল সাইকোফিজিক্সে উল্লিখিত হিসাবে আপনাকে কম আলোয় অবস্থানে স্কটপিক স্ট্যান্ডার্ড পর্যবেক্ষক ব্যবহার করতে হবে )। আপনি যা বর্ণনা করেছেন তা বর্ণালী রেন্ডারিংয়ের ধারণা। ব্যাখ্যা 2 আমি যা সম্পর্কে আরও জানতে চাই। কাগজটি একটি ভাল শুরু হবে, তার জন্য ধন্যবাদ।

— ডেভিড কুড়ি

যখন অনুধাবনের বিষয়টি আসে, তখন আমরা কী (প্রায়শই সম্পত্তি বা শৈল্পিক বিবেচনায়) অন্ধ এবং আমাদের কী উপলব্ধি প্রয়োগ করে তা নিয়েও সমস্যা রয়েছে।

উদাহরণস্বরূপ শব্দ হিসাবে, আপনার বিপরীতে বা ফ্রিকোয়েন্সি রয়েছে যা আপনাকে অন্যান্য বিষয়বস্তু সম্পর্কে কম বা সচেতন করে না (পুরানো সিগগ্রাফ পেপারটি টেক্সচার কীভাবে জাল রেজোলিউশনে মুখোশ বানাতে পারে), পাশাপাশি সর্বকালের দিকগুলি ("পরিবর্তনের অন্ধত্বের জন্য গুগল")। একইভাবে, পৃষ্ঠের বিবরণগুলি, নরমালগুলি, বিআরডিএফ মান এবং আপেক্ষিক মানের উপর নির্ভর করে হতে পারে বা নাও দেখা যায়।

এছাড়াও যেহেতু আমাদের উপলব্ধি ব্যবস্থা স্থানীয়ভাবে এবং বিশ্বব্যাপী মানিয়ে নিয়েছে, কম ফ্রিকোয়েন্সি মানগুলির জন্য সঠিক জায়গায় ম্যাক্সিমা এবং মিনিমা থাকা গুরুত্বপূর্ণ, তবে তাদের সঠিক মানটি লক্ষ করা যায় না।

কখনও কখনও জ্ঞান থাকতে পারে যেমন আপনি মেঘ এবং গাছগুলিতে প্রচুর ত্রুটির অনুমতি দেন তবে মানুষের মুখে অবশ্যই কম। (কখনও কখনও আপনি প্রদত্ত বিভাগের জন্য প্যারামিটারের পরিসংখ্যানগুলিতে এটি ডাউনগ্রেড করতে পারেন))

সে কারণেই আমি "আলোকিতাত্ত্বিক" শব্দটির চেয়ে "প্লেসিবল" শব্দটি ব্যবহার করতে পছন্দ করি।

বিপরীতভাবে, আমরা মিথ্যা পিক্সেল বা ঝাঁকুনি পিক্সেল, যেমন 1 ধূসর স্তরের ত্রুটিযুক্ত ফ্রন্টগুলির মত সম্পর্কের ক্ষেত্রে অতি সংবেদনশীল, মাইরি, আলিয়াসিং বা খারাপ র্যান্ডম ইত্যাদির মতো অযাচিত প্যাটার্নগুলির মতো অতিদ্রুত সংবেদনশীল are

উপায় দ্বারা এটি অন্যতম কারণ যে সাধারণ শক্তির মধ্যে সমস্ত কিছুকে সংমিশ্রণকারী অনুকূলিতকরণ-ভিত্তিক সমাধানগুলি খুব খারাপ ধারণা হতে পারে বোধগম্যভাবে বলতে গেলে সমস্ত বিপরীতমুখী পরিস্থিতিতে যেমন লাইন বা পয়েন্টগুলিতে ত্রুটিগুলির ঘনত্বের প্রবণতা হতে পারে। একই কারণে প্রাথমিক বৈশ্বিক আলোকসজ্জার লোকেরা সত্যই হতাশ হয়েছিল যে অ্যান্টি-এলিয়াসড আনুমানিক ছায়ার তুলনায় শক্তির সঠিক সমাধানগুলি কম গ্রহণ করা হয়েছিল (এবং তারপরে জাল-ভিত্তিক অভিযোজক পদ্ধতির ভিত্তিতে কোয়াড-ট্রি থেকে এসেছে)।

গ্রাফিক্সের উপলব্ধি সম্পর্কে একটি (বেশ সাধারণ) ওভারভিউ "গ্রাফিক্সে অনুভূতি, ভিজ্যুয়ালাইজেশন, ভার্চুয়াল এনভায়রনমেন্ট এবং অ্যানিমেশন" শীর্ষক এই সিগ্যাসিয়া'এ 11 কোর্সে পাওয়া যাবে graph

— Fabrice NEYRET
সূত্র