ননলাইনারের সর্বনিম্ন স্কোয়ারগুলির জন্য প্রাথমিক মানগুলি কীভাবে চয়ন করবেন


13

উপরের প্রশ্নটি সব বলে। মূলত আমার প্রশ্নটি জেনেরিক ফিটিং ফাংশনটির জন্য (নির্বিচারে জটিল হতে পারে) যা অনুমান করার চেষ্টা করছি সেই পরামিতিগুলিতে ননলাইন হবে, কীভাবে ফিটটি আরম্ভ করার জন্য কেউ প্রাথমিক মানগুলি বেছে নিতে পারে? আমি ননলাইনারে সর্বনিম্ন স্কোয়ার করার চেষ্টা করছি। কোন কৌশল বা পদ্ধতি আছে? এটি কি অধ্যয়ন করা হয়েছে? কোন রেফারেন্স? অ্যাডহক অনুমান করা ছাড়াও কিছু? বিশেষত, এখনই আমি যে ফিটিং ফর্মগুলির সাথে কাজ করছি তার মধ্যে একটি হ'ল একটি গাউসিয়ান প্লাস লিনিয়ার ফর্ম যার সাথে আমি পাঁচটি পরামিতি অনুমান করার চেষ্টা করছি, যেমন

y=Ae(xBC)2+Dx+E

যেখানে (অ্যাবস্কিসা ডেটা) এবং y = লগ 10 (ডেটা অর্ডিনেট) মানে লগ-লগ স্পেসে আমার ডেটা একটি সরলরেখার মতো এবং একটি গাঁয়ের মতো দেখতে লাগে যা আমি গাউসিয়ান দ্বারা সংক্ষেপণ করছি। আমার কোনও তত্ত্ব নেই, লাইনের opeালের মতো গ্রাফিং এবং আইবোলিং ছাড়া আর বাইরের কেন্দ্র / প্রস্থটি কী তা ছাড়া ননলাইনার ফিটকে কীভাবে আরম্ভ করতে হবে সে সম্পর্কে আমাকে গাইড করার কিছুই নেই। তবে আমি এর মধ্যে শতভাগেরও বেশি ফিট করে গ্রাফিকিং এবং অনুমানের পরিবর্তে এটি করতে পারি, আমি এমন কিছু পদ্ধতির পছন্দ করব যা স্বয়ংক্রিয়ভাবে করা যায়।x=log10y=log10

আমি লাইব্রেরিতে বা অনলাইনে কোনও রেফারেন্স পাই না। আমি কেবল ভাবতে পারি কেবল এলোমেলোভাবে প্রাথমিক মানগুলি বেছে নেওয়া। ম্যাটল্যাব [0,1] থেকে অভিন্নভাবে বিতরণ করা থেকে এলোমেলোভাবে মানগুলি চয়ন করতে অফার করে। সুতরাং প্রতিটি ডাটা সেট সহ, আমি এলোমেলোভাবে প্রাথমিকভাবে এক হাজারবার ফিট ফিট করে চালাব এবং তারপরে সর্বোচ্চ দিয়ে একটিটি বেছে নেব ? অন্য কোন (আরও ভাল) ধারণা?r2


পরিসংখ্যান # 1

প্রথমত, আমি কী ধরণের ডেটা নিয়ে কথা বলছি তা বলার জন্য আপনাকে এখানে ডেটা সেটগুলির কিছু ভিজ্যুয়াল উপস্থাপনা দেওয়া হয়েছে। আমি কোনও তথ্যই কোনও প্রকার রূপান্তর ছাড়াই তার মূল আকারে পোস্ট করছি এবং তারপরে লগ-লগ স্পেসে এর ভিজ্যুয়াল উপস্থাপনা যেমন এটি অন্যকে বিকৃত করার সময় ডেটার বৈশিষ্ট্যগুলির কিছু স্পষ্ট করে। আমি ভাল এবং খারাপ উভয় ডেটার একটি নমুনা পোস্ট করছি।

ভাল তথ্য লগ-লগ ভাল তথ্য খারাপ ডেটা লগ-লগ খারাপ ডেটা

প্রতিটি চিত্রের ছয়টি প্যানেলে চারটি ডেটা সেট লাল, সবুজ, নীল এবং সায়ান একসাথে প্লট করা দেখায় এবং প্রতিটি ডাটা সেটে হুবহু ২০ টি ডাটা পয়েন্ট থাকে। আমি তাদের প্রত্যেককে একটি সরলরেখার সাথে আরও একটি গাউসির সাথে ফিট করার চেষ্টা করছি কারণ ডেটাগুলিতে দেখা যায় umps

প্রথম চিত্রটি কিছু ভাল ডেটা। দ্বিতীয় চিত্র হ'ল চিত্র প্রথম থেকে একই ভাল ডেটার লগ-লগ প্লট। তৃতীয় চিত্রটি কিছু খারাপ তথ্য is চতুর্থ চিত্রটি তিন নম্বরের লগ-লগ প্লট। আরও অনেক তথ্য রয়েছে, এগুলি মাত্র দুটি সাবসেট। বেশিরভাগ ডেটা (প্রায় 3/4) ভাল, আমি এখানে দেখানো ভাল ডেটার অনুরূপ।

এখন কিছু মন্তব্য, দয়া করে আমার সাথে সহ্য করুন কারণ এটি দীর্ঘ হতে পারে তবে আমি মনে করি এই সমস্ত বিবরণ প্রয়োজনীয়। আমি যথাসম্ভব সংক্ষিপ্ত হওয়ার চেষ্টা করব

আমি মূলত একটি সহজ-পাওয়ার আইন (লগ-লগ স্পেসের সরলরেখার অর্থ) প্রত্যাশা করেছি। আমি যখন লগ-লগ স্পেসে সমস্ত কিছু ষড়যন্ত্র করি তখন আমি প্রায় 4.8 মেগাহার্টজ এ অপ্রত্যাশিত bেউ দেখতে পেলাম। গাঁটটি পুঙ্খানুপুঙ্খভাবে তদন্ত করা হয়েছিল এবং অন্যের কাজগুলিতেও এটি আবিষ্কার করা হয়েছিল যাতে এটি গণ্ডগোল হয় না। এটি শারীরিকভাবে রয়েছে এবং অন্যান্য প্রকাশিত রচনাগুলিও এর উল্লেখ করে। সুতরাং আমি আমার লিনিয়ার ফর্মটিতে কেবল একটি গাওসিয়ান শব্দ যুক্ত করেছি। নোট করুন যে এই ফিটটি লগ-লগ স্পেসে করা উচিত (অতএব এটি সহ আমার দুটি প্রশ্ন)।

এখন, স্টাম্পি জো পিটের আমার অন্য একটি প্রশ্নের উত্তর পড়ার পরে (এই তথ্যগুলির সাথে মোটামুটি সম্পর্কিত নয়) এবং এটি এবং এটি এবং এটির (রেফারেন্স) ক্লোসেটের পড়ার পরে, আমি বুঝতে পারি যে আমার লগ-লগে ফিট করা উচিত নয় স্থান। তাই এখন আমি প্রাক রূপান্তরিত স্থানের সবকিছু করতে চাই।

প্রশ্ন 1: ভাল ডেটার দিকে তাকিয়ে, আমি এখনও মনে করি যে প্রাক-রূপান্তরিত স্থানের একটি লিনিয়ার প্লাস গাউসিয়ান এখনও একটি ভাল ফর্ম। আমি অন্যদের কাছ থেকে শুনতে পছন্দ করি যাঁরা কী ভাবেন তাদের আরও ডেটা-এক্সপ্রেসিঞ্জ রয়েছে। গাউসিয়ান + লিনিয়ার কি যুক্তিসঙ্গত? আমার কি কেবল গাউসই করা উচিত? নাকি সম্পূর্ণ ভিন্ন রূপ?

প্রশ্ন 2: 1 প্রশ্নের উত্তর যাই হোক না কেন, আমার এখনও প্রয়োজন (সম্ভবত) অ-রৈখিক ন্যূনতম স্কোয়ারগুলি মাপসই তাই এখনও আদিতে সাহায্যের প্রয়োজন।

আমরা যেখানে দুটি সেট দেখি সেই ডেটা, আমরা খুব ভারীভাবে প্রায় 4-5 মেগাহার্টজ প্রথম বাম্প ক্যাপচার করতে পছন্দ করি। সুতরাং আমি আরও গাউসীয় পদ যুক্ত করতে চাই না এবং আমাদের গাউসিয়ান শব্দটি প্রথম বাম্পকে কেন্দ্র করে করা উচিত যা প্রায় সবসময়ই বড় ধাক্কা। আমরা 0.8mHz এবং প্রায় 5mHz এর মধ্যে "আরও নির্ভুলতা" চাই। আমরা উচ্চতর ফ্রিকোয়েন্সিগুলির জন্য খুব বেশি যত্ন নিই না তবে সেগুলিও পুরোপুরি উপেক্ষা করতে চাই না। তাই হতে পারে একরকম ওজন? বা বি সর্বদা 4.8mHz কাছাকাছি শুরু করা যেতে পারে?

fL

L=Ae(fBC)2+Df+E.
  • f
  • L
  • AA>0A
  • B
  • CCC
  • D
  • ELELf=0

Ae(B/C)2+E.

EEf=0

L

প্রশ্ন 3: আপনি বলছেন যে এই ক্ষেত্রে এক্সট্রাপোলেটিং কি? কোন উপকার / কনস? এক্সট্রাপোলেশন জন্য অন্য কোন ধারণা? আবার আমরা কেবল নিম্ন ফ্রিকোয়েন্সিগুলিকে 0 এবং 1 এমএইচজেডের মধ্যে অতিরিক্ত বাড়িয়ে তোলার বিষয়ে যত্নশীল ... কখনও কখনও খুব ছোট ফ্রিকোয়েন্সি শূন্যের কাছাকাছি। আমি জানি এই পোস্টটি ইতিমধ্যে প্যাকড। আমি এই প্রশ্নটি এখানে জিজ্ঞাসা করেছি কারণ উত্তরগুলি সম্পর্কিত হতে পারে তবে আপনি যদি পছন্দ করেন তবে আমি এই প্রশ্নটি আলাদা করতে পারি এবং পরে আরও একটি জিজ্ঞাসা করতে পারি।

শেষ অবধি, অনুরোধ অনুসারে এখানে দুটি নমুনা ডেটা সেট রয়েছে।

0.813010000000000   0.091178000000000   0.012728000000000
1.626000000000000   0.103120000000000   0.019204000000000
2.439000000000000   0.114060000000000   0.063494000000000
3.252000000000000   0.123130000000000   0.071107000000000
4.065000000000000   0.128540000000000   0.073293000000000
4.878000000000000   0.137040000000000   0.074329000000000
5.691100000000000   0.124660000000000   0.071992000000000
6.504099999999999   0.104480000000000   0.071463000000000
7.317100000000000   0.088040000000000   0.070336000000000
8.130099999999999   0.080532000000000   0.036453000000000
8.943100000000001   0.070902000000000   0.024649000000000
9.756100000000000   0.061444000000000   0.024397000000000
10.569000000000001   0.056583000000000   0.025222000000000
11.382000000000000   0.052836000000000   0.024576000000000
12.194999999999999   0.048727000000000   0.026598000000000
13.008000000000001   0.045870000000000   0.029321000000000
13.821000000000000   0.041454000000000   0.067300000000000
14.633999999999999   0.039596000000000   0.081800000000000
15.447000000000001   0.038365000000000   0.076443000000000
16.260000000000002   0.036425000000000   0.075912000000000

প্রথম কলামটি হ'ল এমএইচজেডের ফ্রিকোয়েন্সি, প্রতিটি একক ডেটা সেটে অভিন্ন। দ্বিতীয় কলামটি একটি ভাল ডেটা সেট (ভাল ডেটা ফিগার এক এবং দুই, প্যানেল 5, লাল মার্কার) এবং তৃতীয় কলামটি একটি খারাপ ডেটা সেট (খারাপ ডেটা ফিগার তিন এবং চার, প্যানেল 5, লাল মার্কার)।

আশা করি এটি আরও কিছু আলোকিত আলোচনা আলোড়িত করার পক্ষে যথেষ্ট। সবাইকে ধন্যবাদ


অতিরিক্ত তথ্যের জন্য +1, তবে এখন এটি একটি নতুন প্রশ্নের মতো দেখাচ্ছে। ঘটনাক্রমে, আপনি যদি এখন আগেরটি মুছতে চান তবে আমার মনে হয় যে এটি ঠিক আছে, মনে হয় আপনি এখন অতিরিক্ত অতিরিক্ত তথ্য haveেকে রেখেছেন।
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেন_বি কেন এমন হয়? এটি একটি নতুন প্রশ্নের মতো দেখাচ্ছে কেন? পুরানো প্রশ্ন হিসাবে, আমরা সবাই বিন্দুগুলির জন্য বেশ্যা করেছি ;- ডি এবং পুরাতনটির দুটি উপায়ে রয়েছে, এটির সাথে একত্রীকরণের কোনও উপায় আছে যাতে আমি এই দুটি ভোটও রাখতে পারি?
ফিক্সড পয়েন্ট

শুরু করার জন্য, আপনি এখন কী ফিট করতে হবে সে সম্পর্কে জিজ্ঞাসা করছেন , আগের মতো কী ফিট করতে হবে তা উল্লেখ করার চেয়ে। অন্যান্য বিভিন্ন পার্থক্য রয়েছে, যার মধ্যে কয়েকটি হিসাবে আমি যথেষ্ট তাত্পর্যপূর্ণ মনে করব। আমি আমার উত্তরটি পরিবর্তন করে দেখব, তবে আমি মনে করি এটির মূল প্রশ্ন এবং উত্তর হিসাবে দাঁড়াতে পারে এবং আপনি যেখানে নতুন জিনিস জিজ্ঞাসা করছেন সেখানে আপনার নতুন অংশগুলি একটি নতুন হতে পারে। আমি বর্তমান আপনার রায় এটি ছেড়ে দেব।
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেন_বি ফেয়ার যথেষ্ট, আমি অতিরিক্ত প্রশ্নগুলি প্রকাশ করেছি। সুতরাং প্রশ্নগুলি এখনও রয়েছে, লিনিয়ার + গাউসিয়ান ফর্ম ব্যবহার করে আমার ফিট করতে চাই এমন কিছু ডেটা আমার কাছে রয়েছে, আমি কি এলোমেলো সূচনা চেয়ে আরও ভাল করতে পারি?
ফিক্সড পয়েন্ট

আমি মনে করি আমার বর্তমান উত্তরটি দেখায় যে - কমপক্ষে কিছু পরিস্থিতিতে - আপনি আরও ভাল করতে পারেন এবং @ শুভ আমার প্রক্রিয়াটির চেয়ে আরও সহজ কিছু প্রস্তাব দেয়। আমি ফিরে যেতে পারি এবং আপনার ডেটাতে আমার কী কী পারফর্ম হয় তা দেখতে পেতাম, তবে এটি এখন যেমন দাঁড়িয়ে আছে তেমন কীভাবে এই জাতীয় পয়েন্টগুলি সেট আপ করবেন সে সম্পর্কে কিছু ধারণা দেয়।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


10

যদি এমন কৌশল ছিল যা ভাল এবং সাধারণ উভয়ই ছিল - যেটি সর্বদা কাজ করে - এটি ইতিমধ্যে প্রতিটি ননলাইনারের ন্যূনতম স্কোয়ার্স প্রোগ্রামে প্রয়োগ করা হবে এবং মানগুলি শুরু করা একটি সমস্যাবিহীন হবে।

অনেকগুলি নির্দিষ্ট সমস্যা বা সমস্যার পরিবারগুলির জন্য, মানগুলি শুরু করার জন্য বেশ ভাল কিছু উপায় বিদ্যমান; কিছু প্যাকেজগুলি নির্দিষ্ট অ-লাইন মডেলগুলির জন্য ভাল শুরু মূল্য গণনার সাথে আসে বা আরও সাধারণ পন্থাগুলি নিয়ে আসে যা প্রায়শই কাজ করে তবে আরও নির্দিষ্ট ফাংশন বা প্রারম্ভিক মানগুলির সরাসরি ইনপুট দিয়ে সহায়তা করতে হতে পারে।

কিছু পরিস্থিতিতে জায়গার অন্বেষণ করা জরুরি তবে আমি মনে করি আপনার পরিস্থিতি এমন হতে পারে যে আরও সুনির্দিষ্ট কৌশল সম্ভবত সার্থক হবে - তবে একটি ভাল ডিজাইনের জন্য আমাদের অনেক বেশি ডোমেন জ্ঞান প্রয়োজন যা আমরা অর্জন করতে পারি না।

x

yx

A

কিছু নমুনা ডেটা সহায়তা করবে - সাধারণ আপনি যদি সক্ষম হন তবে হার্ড কেসগুলি।


সম্পাদনা: সমস্যাটি খুব গোলমাল না হলে আপনি কীভাবে মোটামুটি ভাল করতে পারেন তার একটি উদাহরণ এখানে:

আপনার মডেল থেকে উত্পন্ন কিছু তথ্য এখানে রয়েছে (জনসংখ্যার মান হ'ল এ = 1.9947, বি = 10, সি = 2.828, ডি = 0.09, ই = 5):

এনএলএস ডেটা

আমি যে প্রাথমিক মানগুলি অনুমান করতে
পেরেছিলাম সেগুলি হ'ল (যেমন = 1.658, বিএস = 10.001, সিএস = 3.053, ডিএস = 0.0881, এসএস = 5.026)

এই স্টার্ট মডেলটির ফিটগুলি দেখতে এই রকম:

nlstart

পদক্ষেপগুলি ছিল:

  1. ডি এবং ই এর মোটামুটি অনুমান পেতে একটি থিল রিগ্রেশন ফিট করুন
  2. Theil রিগ্রেশন অফ ফিট বিয়োগ
  3. একটি মসৃণ বক্ররেখার ফিট করতে LOESS ব্যবহার করুন
  4. A এর মোটামুটি অনুমানের জন্য শিখরটি সন্ধান করুন এবং বি এর মোটামুটি অনুমানের জন্য শিখরের সাথে সম্পর্কিত x- মান
  5. LOESS ফিট করুন যার ওয়াই-মানগুলি> এ এর ​​প্রাক্কলনের 60% পর্যবেক্ষণ হিসাবে নিয়ে যান এবং চতুর্ভুজকে ফিট করুন
  6. বি এর অনুমানটি আপডেট করতে এবং সি এর অনুমান করতে চতুর্ভুজটি ব্যবহার করুন
  7. আসল তথ্য থেকে, গাউসিয়ান এর অনুমান বিয়োগ করুন
  8. ডি এবং ই এর প্রাক্কলন আপডেট করতে সেই অ্যাডজাস্ট করা ডেটাতে আরেকটি থিল রিগ্রেশন ফিট করুন

এই ক্ষেত্রে, মানগুলি ননলাইনার ফিট শুরু করার জন্য খুব উপযুক্ত।

আমি Rকোড হিসাবে এটি লিখেছি কিন্তু একই জিনিসটি ম্যাটল্যাবে করা যেতে পারে।

আমি মনে করি এর চেয়ে ভাল জিনিসগুলি সম্ভব।

যদি ডেটা খুব গোলমাল হয়, এটি মোটেও ভাল কাজ করবে না।


সম্পাদনা 2: যদি আর আগ্রহী হয় তবে এই কোডটি আমি আর-তে ব্যবহার করেছি:

gausslin.start <- function(x,y) {

  theilreg <- function(x,y){
    yy <- outer(y, y, "-")
    xx <- outer(x, x, "-")
    z  <- yy / xx
    slope     <- median(z[lower.tri(z)])
    intercept <- median(y - slope * x)
    cbind(intercept=intercept,slope=slope)
  }

  tr <- theilreg(x,y1)
  abline(tr,col=4)
  Ds = tr[2]
  Es = tr[1]
  yf  <- y1-Ds*x-Es
  yfl <- loess(yf~x,span=.5)

  # assumes there are enough points that the maximum there is 'close enough' to 
  #  the true maximum

  yflf   <- yfl$fitted    
  locmax <- yflf==max(yflf)
  Bs     <- x[locmax]
  As     <- yflf[locmax]

  qs     <- yflf>.6*As
  ys     <- yfl$fitted[qs]
  xs     <- x[qs]-Bs
  lf     <- lm(ys~xs+I(xs^2))
  bets   <- lf$coefficients
  Bso    <- Bs
  Bs     <-  Bso-bets[2]/bets[3]/2
  Cs     <- sqrt(-1/bets[3])
  ystart <- As*exp(-((x-Bs)/Cs)^2)+Ds*x+Es

  y1a <- y1-As*exp(-((x-Bs)/Cs)^2)
  tr  <- theilreg(x,y1a)
  Ds  <- tr[2]
  Es  <- tr[1]
  res <- data.frame(As=As, Bs=Bs, Cs=Cs, Ds=Ds, Es=Es)
  res
}

# population parameters: A = 1.9947 , B = 10, C = 2.828, D = 0.09, E = 5
# generate some data
set.seed(seed=3424921)
x  <- runif(50,1,30)
y  <- dnorm(x,10,2)*10+rnorm(50,0,.2)
y1 <- y+5+x*.09 # This is the data
xo <- order(x)

starts <- gausslin.start(x,y1)
ystart <- with(starts, As*exp(-((x-Bs)/Cs)^2)+Ds*x+Es)
plot(x,y1)
lines(x[xo],ystart[xo],col=2)

3
+1 টি। এক হাজারবার ফিটের পুনরাবৃত্তি করা এবং সেরাটি (যদি আমি এটি সঠিকভাবে বুঝতে পারি) চয়ন করা একটি আশ্চর্য ধারণা মনে করে: মডেলটি ডেটার জন্য যুক্তিসঙ্গত হয় এবং ভাল প্রাথমিক মান থাকে তবে ননলাইনারের সর্বনিম্ন স্কোয়ারগুলি একত্রিত হওয়া উচিত। স্বাভাবিকভাবেই, দ্বিতীয়টি যা আপনি জিজ্ঞাসা করছেন। তবে এটি বোঝাতে হতাশাব্যঞ্জক বলে মনে হচ্ছে আপনার প্রতিটি ফিটের জন্য বিভিন্ন প্রারম্ভিক মান চয়ন করতে হতে পারে।
নিক কক্স

1
@ নিককক্স এটি সমস্যার মুখোমুখি হ'ল - যদি আমি আগের পোস্টগুলি থেকে সরাসরি স্মরণ করি তবে ওপি বিপুল সংখ্যক সমস্যার মুখোমুখি হয়, তবে আমি এর আগে ভাল পরামর্শ দেওয়ার জন্য পর্যাপ্ত বিবরণ দেখে মনে করতে পারি নি, যদিও আমি কিছুটা বিনিয়োগ করেছি সম্ভাব্য পদ্ধতির সাথে ঘুরে দেখার সময় (যা পোস্টের জন্য যথেষ্ট নির্দিষ্ট কোনও ফল দেয় না)। ওপিতে সম্ভবত এমন ধরণের ডোমেন জ্ঞান রয়েছে যা তার সূচনার মানগুলি অর্জন করতে পারে যা তার সমস্যাগুলি প্রায় সবসময় সমাধান করে।
গ্লেন_বি -রিনস্টেট মনিকা

1
বেশ তাই। আমি আগের পোস্টগুলি stats.stackexchange.com/Qestions/61724/…
নিক কক্স

3
|A|BA>0CA1/4A>0A<0

2
BB

6

এই ধরণের ননলাইনার মডেলগুলিকে ফিট করার জন্য একটি সাধারণ পন্থা রয়েছে। এটির মধ্যে নির্ভরশীল ভেরিয়েবলের মানগুলির সাথে লিনিয়ার প্যারামিটারগুলির পুনঃনির্মাণ জড়িত রয়েছে প্রথম, শেষ ফ্রিকোয়েন্সি মান এবং মাঝখানে একটি ভাল পয়েন্ট say র্থ বিন্দু বলে। তারপরে আপনি এই প্যারামিটারগুলি স্থির রাখতে পারেন এবং মিনিমাইজেশনের প্রথম পর্যায়ে ননলাইনার প্যারামিটারের জন্য সমাধান করতে পারেন এবং তারপরে সামগ্রিক 5 পরামিতি হ্রাস করতে পারেন।

১৯৮২ সালের দিকে যখন মাছের জন্য বৃদ্ধির মডেলগুলির জন্য উপযুক্ত।

http://www.nrcresearchpress.com/doi/abs/10.1139/f80-172

তবে এই কাগজটি পড়ার প্রয়োজন নেই। প্যারামিটারগুলি লিনিয়ার হওয়ার কারণে, মডেলের স্থিতিশীল পরামিতি ব্যবহারের জন্য একটি সমীকরণের একটি 3x3 লিনিয়ার সিস্টেম সেটআপ এবং সমাধান করা সহজ।

আপনার মডেলের জন্য লিনিয়ার অংশটি একটি ম্যাট্রিক্স দ্বারা নির্ধারিত হয়M

M=(exp(((x(1)B)/C)2)x(1)1exp(((x(6)B)/C)2)x(6)1exp(((x(n)B)/C)2)x(n)1)
n=20
DATA_SECTION
  init_int n
  int mid
 !! mid=6;
  init_matrix data(1,n,1,3)
  vector x(1,n)
  vector y(1,n)
 !! x=column(data,1);
 !! y=column(data,3);   //use column 3
PARAMETER_SECTION
  init_number L1(3)     //(3) means estimate in phase 3
  init_number Lmid(3)
  init_number Ln(3)

  vector L(1,3)
  init_number log_B       // estimate in phase 1
  init_number log_C(2)    // estimate in phase 2 
  matrix M(1,3,1,3);
  objective_function_value f
  sdreport_vector P(1,3)
  sdreport_number B
  sdreport_number C
  vector pred(1,n);
PROCEDURE_SECTION
  L(1)=L1;
  L(2)=Lmid;
  L(3)=Ln;
  B=exp(log_B);
  C=exp(log_C);
  M(1,1)=exp(-square((x(1)-B)/C));
  M(1,2)=x(1);
  M(1,3)=1;
  M(2,1)=exp(-square((x(mid)-B)/C));
  M(2,2)=x(mid);
  M(2,3)=1;
  M(3,1)=exp(-square((x(n)-B)/C));
  M(3,2)=x(n);
  M(3,3)=1;

  P=solve(M,L);  // solve for standard parameters 
                 // P is vector corresponding to A,D,E

  pred=P(1)*exp(-square((x-B)/C))+P(2)*x+P(3);
  if (current_phase()<4)
    f+=norm2(y-pred);
  else
    f+=0.5*n*log(norm2(y-pred))  //concentrated likelihood

BCBBC

এখানে চিত্র বর্ণনা লিখুন

খারাপ ডেটা নিয়ে আপনার ক্ষেত্রে এটি বেশ সহজেই ফিট করে এবং (সাধারণ) পরামিতি অনুমানগুলি:

         estimate    std dev
A      2.0053e-01 5.8723e-02
D      1.6537e-02 4.7684e-03
E     -1.8197e-01 7.3355e-02
B      3.0609e+00 5.0197e-01
C      5.6154e+00 9.4564e-01]

ডেভ, এটি আকর্ষণীয় তবে এটি কিছু প্রশ্ন উত্থাপন করে। "এই ধরণের ননলাইনার মডেলগুলি" বলতে আপনার অর্থ কী? প্রশ্নটি "জেনেরিক ফিটিং ফাংশন" উল্লেখ করে শুরু হয় তবে আপনার বিবরণটি কেবল "সামগ্রিক 5 পরামিতি" হিসাবে বোঝায়।
whuber

আমি বলতে চাই ভোনবার্টালনফির মতো মডেলগুলি, বা উদাহরণস্বরূপ লজিস্টিক বা ডাবল এক্সপোনেনশিয়াল। সমস্ত ক্ষেত্রে মডেলটি কিছু পরামিতিগুলিতে লিনিয়ার এবং অন্যান্য ক্ষেত্রে ননলাইনার। লোকেরা সাধারণত রৈখিকহীন পরামিতিগুলিতে মনোনিবেশ করে আরও স্থিতিশীল প্যারামিটারাইজেশন পেতে তাদের রূপান্তর করার চেষ্টা করে। তবে এটি ভুল পদ্ধতির। এটি লিনিয়ার প্যারামিটারাইজেশন যা সংশোধন করা উচিত তাই উদাহরণস্বরূপ 4 পরামিতি লজিস্টিকের জন্য মডেলটি উপরের এবং নিম্ন অ্যাসিপোটোটারে রৈখিক হয়, তবে এই পরামিতিগুলি ব্যবহার না করে একজনকে সবচেয়ে ছোট এবং বৃহত্তম ইনডের জন্য পূর্বাভাসকৃত মানগুলি ব্যবহার করা উচিত should Var।
ডেভ চৌনিয়ার

@ ডেভফৌনিয়ার আপনার কাগজটি উত্তর এবং নির্দেশ করার জন্য ধন্যবাদ। আপনার কাগজটি অর্জন করা সামান্য কঠিন বলে মনে হচ্ছে তবে কৌশলটি আকর্ষণীয় বলে মনে হচ্ছে তাই এটি পড়ার জন্য অপেক্ষা করতে পারে না।
পয়েন্ট

2

যদি আপনাকে এটি বেশ কয়েকবার করতে হয় তবে আমি আপনাকে পরামর্শ দেব যে আপনি এসএসই ফাংশনটিতে একটি বিবর্তনীয় অ্যালগরিদম প্রারম্ভিক মানগুলি সরবরাহ করতে একটি ফ্রন্ট-এন্ড হিসাবে ব্যবহার করুন।

অন্যদিকে আপনি প্যারামিটারগুলির জন্য স্লাইডার ব্যবহার করে ফাংশনটি তৈরি করতে জিওজেবার ব্যবহার করতে পারেন এবং শুরু করার মানগুলি পেতে তাদের সাথে খেলতে পারেন।

অথবা ডেটা থেকে মানগুলি পর্যবেক্ষণ দ্বারা অনুমান করা যায়।

  1. ডি এবং ই তথ্যগুলির slালু এবং আটকানো থেকে আসে (গাউসিকে উপেক্ষা করে)
  2. A হ'ল Dx + E লাইন অনুমানের থেকে গাউসের সর্বাধিকের উল্লম্ব দূরত্ব।
  3. বি গৌসিদের সর্বাধিক x এর মান
  4. সি গাউসির আপাত প্রস্থের অর্ধেক

1

মান শুরু করার জন্য আপনি একটি সর্বনিম্ন স্কোয়ার ফিট করতে পারেন। এর opeাল এবং ইন্টারসেপ্টটি ডি এবং ই এর সূচনা মান হবে The সবচেয়ে বড় অবশিষ্টাংশ হ'ল এ'র জন্য আরম্ভের মান the বৃহত্তম অবশিষ্টের অবস্থান বি এর জন্য শুরুর মান Maybe হতে পারে অন্য কেউ সিগমার জন্য একটি প্রাথমিক মান প্রস্তাব করতে পারে।

তবে বিষয়বস্তু জ্ঞান থেকে যেকোন ধরণের যান্ত্রিক সমীকরণ না পেয়ে অ-লিনিয়ার সর্বনিম্ন স্কোয়ারগুলি ঝুঁকিপূর্ণ ব্যবসা, এবং অনেকগুলি পৃথক ফিট করা জিনিসগুলিকে আরও প্রশ্নবিদ্ধ করে তোলে। আপনার প্রস্তাবিত সমীকরণের পিছনে কি কোনও বিষয়ের জ্ঞান রয়েছে? 100 বা এতগুলি পৃথক ফিটগুলির মধ্যে পার্থক্যগুলির সাথে সম্পর্কিত এমন কোনও স্বতন্ত্র ভেরিয়েবল রয়েছে? যদি আপনি এই পার্থক্যগুলিকে একক সমীকরণের সাথে অন্তর্ভুক্ত করতে পারেন যা একবারে সমস্ত ডেটা ফিট করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.