"অভিন্ন ব্যবধানে" নমুনাগুলি থেকে শুরু করে ইউনিট ডিস্কে রিগ্রেশন


9

ইউনিট ডিস্কের মাধ্যমে আমার একটি জটিল রিগ্রেশন সমস্যা সমাধান করা দরকার। মূল প্রশ্নটি কিছু আকর্ষণীয় মন্তব্য আকর্ষণ করেছিল, তবে দুর্ভাগ্যক্রমে কোনও উত্তর নেই। ইতিমধ্যে, আমি এই সমস্যাটি সম্পর্কে আরও কিছু শিখেছি, সুতরাং আমি মূল সমস্যাটিকে সাব-সমস্যায় বিভক্ত করার চেষ্টা করব এবং এইবার আমার আরও ভাগ্য ভালো আছে কিনা তা দেখুন।

আমার ইউনিট ডিস্কের অভ্যন্তরে একটি সরু রিংয়ে নিয়মিতভাবে 40 টি তাপমাত্রা সেন্সর রয়েছে: এখানে চিত্র বর্ণনা লিখুন

এই সেন্সরগুলি সময়ে তাপমাত্রা অর্জন করে। যাইহোক, সময় পরিবর্তনের স্থান পরিবর্তনের তুলনায় অনেক ছোট, আসুন সময়ের পরিবর্তনশীলতা উপেক্ষা করে সমস্যাটি সরল করুন এবং ধরে নিই যে প্রতিটি সেন্সর আমাকে কেবল সময়ের গড় দেয়। এর অর্থ হ'ল আমার কাছে 40 টি নমুনা (প্রতিটি সেন্সরের জন্য একটি) এবং আমার কাছে বারবার নমুনা নেই।

আমি একটি রিগ্রেশন পৃষ্ঠ তৈরি করতে চাই T=f(ρ,θ)+ϵসেন্সর তথ্য থেকে। প্রতিরোধের দুটি লক্ষ্য রয়েছে:

  1. আমার একটি গড় রেডিয়াল তাপমাত্রা প্রোফাইল অনুমান করা দরকার need Tmean=g1(ρ)+ϵ। লিনিয়ার রিগ্রেশন সহ, আমি ইতিমধ্যে এমন একটি পৃষ্ঠের অনুমান করতে পারি যা তাপমাত্রার গড় গড়, তাই কেবলমাত্র আমার পৃষ্ঠকে সম্মানের সাথে একীভূত করতে হবেθঠিক আছে? যদি আমি রিগ্রেশনের জন্য বহুভুজ ব্যবহার করি তবে এই পদক্ষেপটি একটি কেকের টুকরা হওয়া উচিত।
  2. আমার একটি রেডিয়াল তাপমাত্রা প্রোফাইল অনুমান করা দরকার need T95=g2(ρ)+ϵযেমন প্রতিটি রেডিয়াল অবস্থানে, P(T(ρ)<T95(ρ))=.95

এই দুটি লক্ষ্য দেওয়া, ইউনিট ডিস্কে প্রতিরোধের জন্য আমার কোন কৌশলটি ব্যবহার করা উচিত? অবশ্যই, গাউসিয়ান প্রক্রিয়াগুলি সাধারণত স্থানিক প্রতিরোধের জন্য ব্যবহৃত হয়। তবে ইউনিট ডিস্কের জন্য একটি ভাল কার্নেলের সংজ্ঞা তুচ্ছ নয়, তাই আমি জিনিসগুলি সহজ রাখতে এবং বহুবর্ষগুলি ব্যবহার করতে চাই, যদি না আপনি এটি হারানোর কৌশল মনে করেন। আমি জার্নাইক বহুপদী সম্পর্কে পড়েছি । জের্নাইক বহিরাগতগুলি ইউনিট ডিস্কের প্রতিরোধের জন্য উপযুক্ত বলে মনে হয়, কারণ তারা পর্যায়ক্রমিক হয়θ

একবার মডেলটি চয়ন হয়ে গেলে, আমার একটি অনুমানের পদ্ধতি নির্বাচন করা উচিত। যেহেতু এটি একটি স্থানিক রিগ্রেশন সমস্যা, বিভিন্ন স্থানে ত্রুটিগুলি সম্পর্কযুক্ত হওয়া উচিত। সাধারণ ন্যূনতম স্কোয়ারগুলি নিরবিচ্ছিন্ন ত্রুটিগুলি ধরে নেয়, সুতরাং আমি অনুমান করি যে জেনারেলাইজড লেস্ট স্কোয়ারগুলি আরও উপযুক্ত হবে। জিএলএস একটি অপেক্ষাকৃত সাধারণ পরিসংখ্যান কৌশল বলে মনে হচ্ছে যে glsস্ট্যান্ডার্ড আর বিতরণে একটি কার্যকারিতা রয়েছে। তবে আমি কখনই জিএলএস ব্যবহার করি নি, আমার সন্দেহ আছে। উদাহরণস্বরূপ, আমি কীভাবে সমবায় ম্যাট্রিক্স অনুমান করব? একটি পরিশ্রমযোগ্য উদাহরণ, এমনকি মাত্র কয়েকটি সেন্সর সহ দুর্দান্ত লাগবে।

পিএস আমি জার্নিকে বহুপদী এবং জিএলএস ব্যবহার করা বেছে নিয়েছি কারণ এখানে করা আমার কাছে যৌক্তিক জিনিস বলে মনে হয়। তবে আমি কোনও বিশেষজ্ঞ নই এবং আপনি যদি মনে করেন যে আমি ভুল পথে চলেছি তবে নির্দ্বিধায় সম্পূর্ণ ভিন্ন পন্থাটি ব্যবহার করুন।


চিত্রটিতে, একটি ইঞ্জিনকে নিখুঁত রেডিয়াল প্রতিসাম্য হিসাবে দেখানো হয়েছে। কিন্তু অক্ষগুলির অবস্থান কি কোনও ইঞ্জিনের কিছু শারীরিক বৈশিষ্ট্যের সাথে সম্পর্কিত, বা এটি সত্যই স্বেচ্ছাসেবী? দ্বিতীয় ক্ষেত্রে, পরিবর্তনশীলθএকটি নির্দিষ্ট ইঞ্জিনের সাথে সম্পর্কিত কেবল একটি অর্থ থাকবে।
ইয়ভেস

উত্তর:


2

আমি মনে করি আপনি জের্নাইক বহিরাগতের মতো কিছু নিয়ে ভাবতে সঠিক পথে আছেন । Jwimberly দ্বারা উত্তরে উল্লিখিত হিসাবে, এগুলি ডিস্কে অर्थোগোনাল ভিত্তিক ক্রিয়াগুলির সিস্টেমের একটি উদাহরণ । আমি জেরনিকে বহুবর্ষের সাথে পরিচিত নই, তবে অরথোগোনাল ফাংশনগুলির অনেকগুলি পরিবার (বেসেল ফাংশন সহ) কিছু আংশিক ডিফারেনশিয়াল সমীকরণের জন্য এগনফ্যাঙ্কশন হিসাবে শাস্ত্রীয় গাণিতিক পদার্থবিজ্ঞানে প্রাকৃতিকভাবে উত্থিত হয় (এই লেখার সময়, সেই লিঙ্কের শীর্ষে অ্যানিমেশন এমনকি একটি স্পন্দিত ড্রাম মাথার উদাহরণ দেখায়)।

দুটি প্রশ্ন আমার মনে আসে। প্রথমত, যদি আপনি তার পরে থাকেন তবে সবগুলিই রেডিয়াল প্রোফাইল (θগড়), তবে স্থানিক প্যাটার্নটিতে আপনার কতটা বাধা দরকার? দ্বিতীয়ত, স্পাটিও-টেম্পোরাল ডেটাতে কি ধরণের পরিবর্তনশীলতা ঘটে?

প্রথম প্রশ্নের পরিপ্রেক্ষিতে দুটি উদ্বেগ মনে মনে আসে। মেরু স্থানাঙ্কগুলির কারণে, প্রতিটি সেন্সরের সমর্থন-অঞ্চলটির প্রবণতা রয়েছেr। দ্বিতীয় উদ্বেগটি হ'ল আলিয়াজিংয়ের সম্ভাবনা , মূলত প্যাটার্নের ধাপের সাথে সম্পর্কিত আপনার সেন্সরগুলির একটি ভুল প্রান্তিককরণ (একটি ফুউরি / বেসেল উপমা ব্যবহারের জন্য)। দ্রষ্টব্য যে উচ্চমাত্রার তাপমাত্রাকে সীমাবদ্ধ করার ক্ষেত্রে অ্যালাইজিং সম্ভবত প্রাথমিক অনিশ্চয়তা (যেমনT95)।

এই দ্বিতীয় প্রশ্নের শর্তে, ডেটা ভেরিয়েবিলিটি আসলে যে কোনও এলিয়াসিং সমস্যাগুলির সাথে সহায়তা করতে পারে, মূলত কোনও ভুল-প্রান্তিককরণকে বিভিন্ন পরিমাপের উপরে গড়ে উঠতে দেয়। (কোনও নিয়মতান্ত্রিক পক্ষপাতিত্ব ধরে নিচ্ছি না ... তবে এটি কোনও পদ্ধতির সমস্যা হতে পারে, উদাহরণস্বরূপ কোনও তথ্য না দেওয়ার জন্য কোনও শারীরিক মডেল)।

সুতরাং একটি সম্ভাবনা হ'ল সংক্ষিপ্ত স্থানগুলির স্থলে আপনার স্থানিক অরথোগোনাল ফাংশনগুলি সংজ্ঞায়িত করা। এই "ইমিরিকাল অরথোগোনাল ফাংশনগুলি" আপনার স্পেসিওটেম্পোরাল ডেটা ম্যাট্রিক্সে পিসিএর মাধ্যমে গণনা করা যেতে পারে । (সম্ভবত আপনি ভেরিয়েবল সেন্সর সমর্থন ক্ষেত্রগুলির জন্য অ্যাকাউন্টের জন্য কিছু ওজন ব্যবহার করতে পারেন তবে অভিন্ন পোলার গ্রিড এবং রেডিয়াল গড়ের লক্ষ্যমাত্রা দেওয়া হলেও এটির প্রয়োজন হতে পারে না))

মনে রাখবেন যদি সেখানে হয় কোন শারীরিক মডেলিং তাপমাত্রার "প্রত্যাশিত" বৈচিত্র জন্য উপলব্ধ ডেটা, একটি ঘন spatiotemporal গণনীয় গ্রিড উপর পাওয়া যায়, তারপর একই পিসিএ পদ্ধতি প্রয়োগ করা যেতে পারে যে আহরণ লম্ব ফাংশন তথ্য। (এটি সাধারণত ইঞ্জিনিয়ারিংয়ে " প্রোপার অরথোগোনাল পচন " নামে পরিচিত , যেখানে এটি মডেল হ্রাসের জন্য ব্যবহৃত হয়, উদাহরণস্বরূপ, একটি ব্যয়বহুল গণনা তরল ডায়নামিক্স মডেল আরও নকশা ক্রিয়াকলাপে ব্যবহারের জন্য নিঃসৃত করা যেতে পারে))

একটি চূড়ান্ত মন্তব্য, যদি আপনি সমর্থন এলাকায় (যেমন মেরু সেল আকারের) দ্বারা সেন্সর ডেটা ওজন ছিল, এই তির্যক সহভেদাংক এক ধরনের, এর কাঠামো হবে GLS । (এটি আপনার ভবিষ্যদ্বাণী সমস্যার ক্ষেত্রে আরও বেশি প্রযোজ্য, যদিও ওয়েট পিসিএ খুব ঘনিষ্ঠভাবে সম্পর্কিত হবে))

আশা করি এটা কাজে লাগবে!

আপডেট: সেন্সর বিতরণের আপনার নতুন চিত্রটি আমার দৃষ্টিতে জিনিসগুলিকে যথেষ্ট পরিবর্তন করে। আপনি যদি ডিস্কের অভ্যন্তরের উপরে তাপমাত্রা অনুমান করতে চান তবে আপনার কেবল "ইউনিট ডিস্কে অর্থোগোনাল ফাংশনগুলির সেট" এর চেয়ে অনেক বেশি তথ্যবহুল প্রয়োজন । সেন্সর ডেটাতে খুব অল্প তথ্য আছে।

আপনি যদি ডিস্কের ওপরে স্থানিক তাপমাত্রার বৈচিত্রটি অনুমান করতে চান, তবে কেবলমাত্র যুক্তিসঙ্গত উপায়ই হ'ল সমস্যাটিকে ডেটা অ্যাসিমিলেন্স হিসাবে বিবেচনা করা । এখানে আপনাকে কিছু পদার্থবিজ্ঞান-ভিত্তিক বিবেচনার ভিত্তিতে স্থানিক বিতরণের প্যারাম্যাট্রিক ফর্মকে কমপক্ষে সীমাবদ্ধ করতে হবে (এগুলি সিমুলেশনগুলি থেকে হতে পারে, বা অনুরূপ গতিশীলতা সম্পর্কিত সিস্টেমে সম্পর্কিত ডেটা হতে পারে)।

আমি তোমার বিশেষ আবেদন জানি না, কিন্তু যদি আপনি এটা পছন্দ কিছু এই , তারপর আমি কল্পনা হবে একটি বিস্তৃত ইঞ্জিনিয়ারিং সাহিত্য যে আপনার উপর আঁকা পারে উপযুক্ত পূর্বে সীমাবদ্ধতার চয়ন করতে নেই। (এই ধরণের বিস্তারিত ডোমেন জ্ঞানের জন্য, এটি জিজ্ঞাসা করার জন্য এটি সম্ভবত সেরা স্ট্যাক এক্সচেঞ্জ সাইট নয়))


চিত্তাকর্ষক উত্তর! এটি হজম করার জন্য কিছু সময় প্রয়োজন। আপনি দুটি প্রশ্ন জিজ্ঞাসা করেছেন: আমি নিশ্চিত না যে আমি প্রথমটি বুঝতে পেরেছি ("স্থানীয় প্যাটার্নটির জন্য আপনার কতটা বাঁধা দরকার?") আমি ভেবেছিলাম যে সমস্ত 40 টি সেন্সর থেকে ডেটা ব্যবহার করা কেবলমাত্র পারিপার্শ্বিক দিক ধরে গড়ের চেয়ে ভাল হবে এবং তারপর ফিট ... আপনি কি বলছেন যে এটি অগত্যা সত্য নয়? দ্বিতীয়টির জন্য ("স্প্যাটিও-টেম্পোরাল ডেটাতে কী ধরণের পরিবর্তনশীলতা দেখা দেয়"), পরের এক বা দুদিনের মধ্যে আমি প্রথম ইঞ্জিনটি বিশ্লেষণ করব (আমার আসলে তাদের মধ্যে 5 আছে! তবে এটি একটি বিষয়টির বিষয় হবে) ভবিষ্যতের প্রশ্ন ...) সিটিডি ...
শে

... সিটিডি, আমি ডেটাটি স্বাভাবিক করব এবং আমি পাবলিক সাইটে কী প্রকাশ করতে পারি তা দেখতে পাব। কিছু স্থানিক নিদর্শন এবং কিছু সময়ের সিরিজ ... আমার মনে হয় আপনি কী জিজ্ঞাসা করছেন সে সম্পর্কে তাদের একটি ধারণা দেওয়া উচিত।
ডেল্টাভ

1
আমার প্রথম প্রশ্নের জন্য: যদি আপনার চূড়ান্ত লক্ষ্যটি মূলত "নতুন ইঞ্জিনের জন্য সেন্সর ফলাফলের পূর্বাভাস" (আপনার অন্যান্য প্রশ্ন থেকে অনুমান করা) হয় তবে কী আপনার "সেন্সরগুলির মধ্যে" থেকে কোনও তথ্য দরকার? এলিয়াসিং সম্পর্কে আমার মন্তব্যটি আপনার কেন এমন তথ্যের প্রয়োজন হবে তার উদাহরণ wasT95সেন্সরগুলি নির্ভরযোগ্যভাবে পরিমাপ করা হয় না।
জিওম্যাট 22

1
বিটিডাব্লু যদি এটি কোনও ডিজাইনের সমস্যা হয় এবং এর সাথে সম্পর্কিত সিএফডি-টাইপ সিমুলেশন রয়েছে, তবে এটি বর্তমান প্রশ্নের দ্বারা সূচিত হওয়ার চেয়ে উল্লেখযোগ্যভাবে আরও বেশি তথ্য। (উদাহরণস্বরূপ, ডেটা
অ্যাসিলেশন

আপনার উত্তর আমাকে ভাবতে বাধ্য করে: রিগ্রেশনের পরিবর্তে, কোনও পৃথক ফুরিয়ার ট্রান্সফর্মের 2 ডি সমতুল্য কি এটি করা যেতে পারে? উদাহরণস্বরূপ, এন-তম বেসেল ফাংশন (যথাযথভাবে সংশোধন) করা হয়েছে এবং তথ্যের অবিচ্ছেদ্য অংশ গ্রহণ করে, এবং তারপরে একটি অর্থোগোনাল পচন? এখানে উদ্বেগগুলি 1 হবে) যথাযথ পৃথক-আকৃতির ক্রিয়াটি সম্ভবত আপনার উত্তর হিসাবে একই লাইন বরাবর অনুসন্ধান করা এবং 2) এটি নমুনা পয়েন্টের সংখ্যার পক্ষে খুব সংবেদনশীল হবে এবং পচন আরও জটিল উচ্চতর অর্ডার শর্তে ঝুঁকবে কিনা ।
jwimberley

2

ইতিমধ্যে জার্নালাইক পলিনোমিয়ালগুলি খারাপ পছন্দ হিসাবে শোনাচ্ছে না R এবং θনির্ভরতা এবং অরথোগোনালিটি রান্না করা হয় However তবে, আপনি যেহেতু তাপমাত্রা অধ্যয়ন করছেন, তত যুক্তিযুক্ত আরও উপযুক্ত এবং আরও ভাল পছন্দ পছন্দ হবে বেসেল ফাংশন । এগুলি নলাকার বস্তু / স্থানাঙ্ক সিস্টেমে তাপ প্রবাহের অধ্যয়নের জন্য উঠে আসে এবং তাই শারীরিকভাবে আরও উপযুক্ত হওয়ার সম্ভাবনা রয়েছে। এন-তম বেসেল ফাংশনটি মেরু নির্ভরতার জন্য সংশ্লিষ্ট ত্রিকোণমিতি ফাংশনের সাথে সম্পর্কিত রেডিয়াল নির্ভরতা দেবে; আপনি অনেক পদার্থবিজ্ঞান এবং পিডিই পাঠ্যপুস্তকে বিশদটি পেতে পারেন।


(+1) পোলার-স্থানাংক তাপের সমীকরণ সংযোগটি একটি ভাল। আরেকটি সম্ভবত উল্লেখযোগ্য যে হ'ল গাউসিয়ান প্রসেসগুলির জন্য আমি সাধারণত আয়তক্ষেত্রাকার গ্রিডগুলিতে জানি যে কোভারিয়েন্স ম্যাট্রিক্স প্রচলিত, এবং ব্যবহারিকভাবে এফএফটি ব্যবহার করা হয়। সুতরাং বেসেল ফাংশনগুলি পোলার গ্রিডে অনুরূপ পদ্ধতির সম্ভাব্য প্রার্থী হবে।
GeoMatt22

একটি আকর্ষণীয় পরামর্শ! তবে, আমি ইঞ্জিনের শক্ত অংশে নয়, অপারেটিং তরলটিতে তাপমাত্রা পরিমাপ করছি। এইভাবে বাহন সমস্যার বিপরীতে আমি সংবহন সমস্যাটিতে আগ্রহী। বেসেল ফাংশনগুলি অবশ্যই তাপ সঞ্চালনের (ফুরিয়ার) সমীকরণের সমাধান, তবে আমি মনে করি না যে তারা তাপ সঞ্চালন সমীকরণেরও খুব সমাধান, কারণ সংবহন তরল প্রবাহ ক্ষেত্রের উপর নির্ভর করে। যাইহোক, আমি খুব কম সময়ে জর্নিকে বনাম তাদের পরীক্ষা করতে পারতাম। জিএলএস সম্পর্কে কী? আপনি প্রশ্নের অংশে কিছু যুক্ত করতে পারেন?
ডেল্টাভ

@ দেলতাভ আমি জিএলএসের সাথে খুব বেশি পরিচিত নই, তবে একটি প্রশ্ন - আপনি কেন বিভিন্ন স্থানের ত্রুটিগুলি সম্পর্কিত হওয়ার আশা করছেন? আমি সম্মত হই যে সত্যের ওঠানামাগুলি পয়েন্টগুলির মধ্যে সম্পর্কযুক্ত হবে, তবে আমি মনে করব যে ত্রুটিগুলি (যেমন সেন্সর রিডিংগুলিতে অনিশ্চয়তা) অসংলগ্ন হবে। সম্ভবত রিগ্রেশন ওঠানামা ত্রুটি হিসাবে গণনা? আমি অবশ্য শাস্তির শর্তাদি সম্পর্কে কিছু যুক্ত করার বিষয়ে বিবেচনা করছি। আপনি যে ভিত্তিতেই ব্যবহার করুন না কেন, আপনার কাছে স্যাম্পলিং পয়েন্টের সীমাবদ্ধ সংখ্যক পরিমাণ রয়েছে এবং বেসেল ফাংশনটির সাথে মিলিত খুব উচ্চতর অর্ডার পাওয়া যেতে পারে, তাই সর্বনিম্ন-ক্রমের শর্তগুলি পছন্দ করা উচিত।
jwimberley

@ ডেলটিআইভি আবার ওঠানামার বিষয়ে, যা স্থানিক পয়েন্টগুলির মধ্যে পারস্পরিক সম্পর্ককে পরিচয় করিয়ে দেয়: আপনার অবজেক্টটি কোনও তাপমাত্রার মানচিত্র পাওয়া যায়, তাই না? আপনি কি দেখতে চান না যা কিছু ওঠানামা ঘটছে? এবং একটি পরিসংখ্যান মডেল এমনকি তাদের জন্য অ্যাকাউন্ট করতে পারে, যেহেতু ওঠানামা তরল গতিবেগ দ্বারা পরিচালিত হবে এবং স্থান এবং সময় জটিল হবে? (এটি কি আপনার সরলতার জন্য ছেড়ে
গিয়েছে

গ্যালারী চ্যাট তৈরি করা হয়েছে
ডেল্টাভিউ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.