উপরের প্রশ্নটি সব বলে। মূলত আমার প্রশ্নটি জেনেরিক ফিটিং ফাংশনটির জন্য (নির্বিচারে জটিল হতে পারে) যা অনুমান করার চেষ্টা করছি সেই পরামিতিগুলিতে ননলাইন হবে, কীভাবে ফিটটি আরম্ভ করার জন্য কেউ প্রাথমিক মানগুলি বেছে নিতে পারে? আমি ননলাইনারে সর্বনিম্ন স্কোয়ার করার চেষ্টা করছি। কোন কৌশল বা পদ্ধতি আছে? এটি কি অধ্যয়ন করা হয়েছে? কোন রেফারেন্স? অ্যাডহক অনুমান করা ছাড়াও কিছু? বিশেষত, এখনই আমি যে ফিটিং ফর্মগুলির সাথে কাজ করছি তার মধ্যে একটি হ'ল একটি গাউসিয়ান প্লাস লিনিয়ার ফর্ম যার সাথে আমি পাঁচটি পরামিতি অনুমান করার চেষ্টা করছি, যেমন
যেখানে (অ্যাবস্কিসা ডেটা) এবং y = লগ 10 (ডেটা অর্ডিনেট) মানে লগ-লগ স্পেসে আমার ডেটা একটি সরলরেখার মতো এবং একটি গাঁয়ের মতো দেখতে লাগে যা আমি গাউসিয়ান দ্বারা সংক্ষেপণ করছি। আমার কোনও তত্ত্ব নেই, লাইনের opeালের মতো গ্রাফিং এবং আইবোলিং ছাড়া আর বাইরের কেন্দ্র / প্রস্থটি কী তা ছাড়া ননলাইনার ফিটকে কীভাবে আরম্ভ করতে হবে সে সম্পর্কে আমাকে গাইড করার কিছুই নেই। তবে আমি এর মধ্যে শতভাগেরও বেশি ফিট করে গ্রাফিকিং এবং অনুমানের পরিবর্তে এটি করতে পারি, আমি এমন কিছু পদ্ধতির পছন্দ করব যা স্বয়ংক্রিয়ভাবে করা যায়।
আমি লাইব্রেরিতে বা অনলাইনে কোনও রেফারেন্স পাই না। আমি কেবল ভাবতে পারি কেবল এলোমেলোভাবে প্রাথমিক মানগুলি বেছে নেওয়া। ম্যাটল্যাব [0,1] থেকে অভিন্নভাবে বিতরণ করা থেকে এলোমেলোভাবে মানগুলি চয়ন করতে অফার করে। সুতরাং প্রতিটি ডাটা সেট সহ, আমি এলোমেলোভাবে প্রাথমিকভাবে এক হাজারবার ফিট ফিট করে চালাব এবং তারপরে সর্বোচ্চ দিয়ে একটিটি বেছে নেব ? অন্য কোন (আরও ভাল) ধারণা?
পরিসংখ্যান # 1
প্রথমত, আমি কী ধরণের ডেটা নিয়ে কথা বলছি তা বলার জন্য আপনাকে এখানে ডেটা সেটগুলির কিছু ভিজ্যুয়াল উপস্থাপনা দেওয়া হয়েছে। আমি কোনও তথ্যই কোনও প্রকার রূপান্তর ছাড়াই তার মূল আকারে পোস্ট করছি এবং তারপরে লগ-লগ স্পেসে এর ভিজ্যুয়াল উপস্থাপনা যেমন এটি অন্যকে বিকৃত করার সময় ডেটার বৈশিষ্ট্যগুলির কিছু স্পষ্ট করে। আমি ভাল এবং খারাপ উভয় ডেটার একটি নমুনা পোস্ট করছি।
প্রতিটি চিত্রের ছয়টি প্যানেলে চারটি ডেটা সেট লাল, সবুজ, নীল এবং সায়ান একসাথে প্লট করা দেখায় এবং প্রতিটি ডাটা সেটে হুবহু ২০ টি ডাটা পয়েন্ট থাকে। আমি তাদের প্রত্যেককে একটি সরলরেখার সাথে আরও একটি গাউসির সাথে ফিট করার চেষ্টা করছি কারণ ডেটাগুলিতে দেখা যায় umps
প্রথম চিত্রটি কিছু ভাল ডেটা। দ্বিতীয় চিত্র হ'ল চিত্র প্রথম থেকে একই ভাল ডেটার লগ-লগ প্লট। তৃতীয় চিত্রটি কিছু খারাপ তথ্য is চতুর্থ চিত্রটি তিন নম্বরের লগ-লগ প্লট। আরও অনেক তথ্য রয়েছে, এগুলি মাত্র দুটি সাবসেট। বেশিরভাগ ডেটা (প্রায় 3/4) ভাল, আমি এখানে দেখানো ভাল ডেটার অনুরূপ।
এখন কিছু মন্তব্য, দয়া করে আমার সাথে সহ্য করুন কারণ এটি দীর্ঘ হতে পারে তবে আমি মনে করি এই সমস্ত বিবরণ প্রয়োজনীয়। আমি যথাসম্ভব সংক্ষিপ্ত হওয়ার চেষ্টা করব
আমি মূলত একটি সহজ-পাওয়ার আইন (লগ-লগ স্পেসের সরলরেখার অর্থ) প্রত্যাশা করেছি। আমি যখন লগ-লগ স্পেসে সমস্ত কিছু ষড়যন্ত্র করি তখন আমি প্রায় 4.8 মেগাহার্টজ এ অপ্রত্যাশিত bেউ দেখতে পেলাম। গাঁটটি পুঙ্খানুপুঙ্খভাবে তদন্ত করা হয়েছিল এবং অন্যের কাজগুলিতেও এটি আবিষ্কার করা হয়েছিল যাতে এটি গণ্ডগোল হয় না। এটি শারীরিকভাবে রয়েছে এবং অন্যান্য প্রকাশিত রচনাগুলিও এর উল্লেখ করে। সুতরাং আমি আমার লিনিয়ার ফর্মটিতে কেবল একটি গাওসিয়ান শব্দ যুক্ত করেছি। নোট করুন যে এই ফিটটি লগ-লগ স্পেসে করা উচিত (অতএব এটি সহ আমার দুটি প্রশ্ন)।
এখন, স্টাম্পি জো পিটের আমার অন্য একটি প্রশ্নের উত্তর পড়ার পরে (এই তথ্যগুলির সাথে মোটামুটি সম্পর্কিত নয়) এবং এটি এবং এটি এবং এটির (রেফারেন্স) ক্লোসেটের পড়ার পরে, আমি বুঝতে পারি যে আমার লগ-লগে ফিট করা উচিত নয় স্থান। তাই এখন আমি প্রাক রূপান্তরিত স্থানের সবকিছু করতে চাই।
প্রশ্ন 1: ভাল ডেটার দিকে তাকিয়ে, আমি এখনও মনে করি যে প্রাক-রূপান্তরিত স্থানের একটি লিনিয়ার প্লাস গাউসিয়ান এখনও একটি ভাল ফর্ম। আমি অন্যদের কাছ থেকে শুনতে পছন্দ করি যাঁরা কী ভাবেন তাদের আরও ডেটা-এক্সপ্রেসিঞ্জ রয়েছে। গাউসিয়ান + লিনিয়ার কি যুক্তিসঙ্গত? আমার কি কেবল গাউসই করা উচিত? নাকি সম্পূর্ণ ভিন্ন রূপ?
প্রশ্ন 2: 1 প্রশ্নের উত্তর যাই হোক না কেন, আমার এখনও প্রয়োজন (সম্ভবত) অ-রৈখিক ন্যূনতম স্কোয়ারগুলি মাপসই তাই এখনও আদিতে সাহায্যের প্রয়োজন।
আমরা যেখানে দুটি সেট দেখি সেই ডেটা, আমরা খুব ভারীভাবে প্রায় 4-5 মেগাহার্টজ প্রথম বাম্প ক্যাপচার করতে পছন্দ করি। সুতরাং আমি আরও গাউসীয় পদ যুক্ত করতে চাই না এবং আমাদের গাউসিয়ান শব্দটি প্রথম বাম্পকে কেন্দ্র করে করা উচিত যা প্রায় সবসময়ই বড় ধাক্কা। আমরা 0.8mHz এবং প্রায় 5mHz এর মধ্যে "আরও নির্ভুলতা" চাই। আমরা উচ্চতর ফ্রিকোয়েন্সিগুলির জন্য খুব বেশি যত্ন নিই না তবে সেগুলিও পুরোপুরি উপেক্ষা করতে চাই না। তাই হতে পারে একরকম ওজন? বা বি সর্বদা 4.8mHz কাছাকাছি শুরু করা যেতে পারে?
প্রশ্ন 3: আপনি বলছেন যে এই ক্ষেত্রে এক্সট্রাপোলেটিং কি? কোন উপকার / কনস? এক্সট্রাপোলেশন জন্য অন্য কোন ধারণা? আবার আমরা কেবল নিম্ন ফ্রিকোয়েন্সিগুলিকে 0 এবং 1 এমএইচজেডের মধ্যে অতিরিক্ত বাড়িয়ে তোলার বিষয়ে যত্নশীল ... কখনও কখনও খুব ছোট ফ্রিকোয়েন্সি শূন্যের কাছাকাছি। আমি জানি এই পোস্টটি ইতিমধ্যে প্যাকড। আমি এই প্রশ্নটি এখানে জিজ্ঞাসা করেছি কারণ উত্তরগুলি সম্পর্কিত হতে পারে তবে আপনি যদি পছন্দ করেন তবে আমি এই প্রশ্নটি আলাদা করতে পারি এবং পরে আরও একটি জিজ্ঞাসা করতে পারি।
শেষ অবধি, অনুরোধ অনুসারে এখানে দুটি নমুনা ডেটা সেট রয়েছে।
0.813010000000000 0.091178000000000 0.012728000000000
1.626000000000000 0.103120000000000 0.019204000000000
2.439000000000000 0.114060000000000 0.063494000000000
3.252000000000000 0.123130000000000 0.071107000000000
4.065000000000000 0.128540000000000 0.073293000000000
4.878000000000000 0.137040000000000 0.074329000000000
5.691100000000000 0.124660000000000 0.071992000000000
6.504099999999999 0.104480000000000 0.071463000000000
7.317100000000000 0.088040000000000 0.070336000000000
8.130099999999999 0.080532000000000 0.036453000000000
8.943100000000001 0.070902000000000 0.024649000000000
9.756100000000000 0.061444000000000 0.024397000000000
10.569000000000001 0.056583000000000 0.025222000000000
11.382000000000000 0.052836000000000 0.024576000000000
12.194999999999999 0.048727000000000 0.026598000000000
13.008000000000001 0.045870000000000 0.029321000000000
13.821000000000000 0.041454000000000 0.067300000000000
14.633999999999999 0.039596000000000 0.081800000000000
15.447000000000001 0.038365000000000 0.076443000000000
16.260000000000002 0.036425000000000 0.075912000000000
প্রথম কলামটি হ'ল এমএইচজেডের ফ্রিকোয়েন্সি, প্রতিটি একক ডেটা সেটে অভিন্ন। দ্বিতীয় কলামটি একটি ভাল ডেটা সেট (ভাল ডেটা ফিগার এক এবং দুই, প্যানেল 5, লাল মার্কার) এবং তৃতীয় কলামটি একটি খারাপ ডেটা সেট (খারাপ ডেটা ফিগার তিন এবং চার, প্যানেল 5, লাল মার্কার)।
আশা করি এটি আরও কিছু আলোকিত আলোচনা আলোড়িত করার পক্ষে যথেষ্ট। সবাইকে ধন্যবাদ