কখন (এবং কেন) আপনার কোনও বিতরণের লগ নেওয়া উচিত (সংখ্যার)?


173

বলুন আমার কাছে কিছু historicalতিহাসিক ডেটা রয়েছে যেমন, অতীতের শেয়ারের দাম, বিমানের টিকিটের দামের ওঠানামা, সংস্থার অতীতের আর্থিক তথ্য ...

এখন কেউ (বা কোনও সূত্র) বরাবর এসে বলে "চলুন বিতরণটির লগটি ব্যবহার করি / ব্যবহার করি" এবং এখানে আমি কেন যাই ?

প্রশ্নাবলী:

  1. কেন প্রথমে বিতরণটির লগ নেওয়া উচিত?
  2. মূল বিতরণটি / দিতে পারে না এমন বিতরণটির লগটি কী 'দেয় / সরল করে'?
  3. লগ রূপান্তর কি 'ক্ষতিহীন'? যেমন, লগ-স্পেসে রূপান্তর করার সময় এবং ডেটা বিশ্লেষণ করার সময়, একই বিতরণটি কি মূল বিতরণের জন্য থাকে? কিভাবে?
  4. এবং শেষ পর্যন্ত কখন বিতরণ লগ নিতে হবে? কোন পরিস্থিতিতে কোনটি এটি করার সিদ্ধান্ত নেয়?

আমি সত্যিই লগ-ভিত্তিক বিতরণগুলি বুঝতে চাইছি (উদাহরণস্বরূপ লগনরমাল) তবে কখনই / কেন দিকগুলি বুঝতে পারি নি - অর্থাত্, বিতরণটির লগটি একটি সাধারণ বিতরণ, সুতরাং কী? এটি এমনকি আমাকে কী বলে এবং কেন বিরক্ত করে? তাই প্রশ্ন!

আপডেট : @ হুইবারের মন্তব্য অনুসারে আমি পোস্টগুলির দিকে নজর রেখেছি এবং কোনও কারণে লগ রুপান্তরের জন্য লগ রূপান্তরগুলি এবং তাদের প্রয়োগগুলি আমি বুঝতে পারি, যেহেতু আপনি স্বাধীন ভেরিয়েবল এবং নির্ভরশীল ভেরিয়েবলের লগের মধ্যে একটি সম্পর্ক আঁকতে পারেন। যাইহোক, আমার প্রশ্নটি বিতরণ নিজেই বিশ্লেষণের অর্থে জেনারিক - কোনও বিতরণ বিশ্লেষণ করার জন্য লগগুলি গ্রহণ করার কারণটি বুঝতে সহায়তা করতে আমি এই সিদ্ধান্ত নিয়ে আসতে পারি না per আমি আশা করি আমি বোধ করছি: - /

রিগ্রেশন বিশ্লেষণে আপনার কাছে ডেটার প্রকার / ফিট / বিতরণে বাধা রয়েছে এবং আপনি এটিকে রূপান্তর করতে পারেন এবং স্বতন্ত্র এবং (রূপান্তরিত নয়) নির্ভরশীল ভেরিয়েবলের মধ্যে একটি সম্পর্ককে সংজ্ঞায়িত করতে পারেন। তবে যখন / কেন বিচ্ছিন্নভাবে বিতরণ করার জন্য কেউ এটি করবে যেখানে টাইপ / ফিট / বিতরণের সীমাবদ্ধতাগুলি কোনও কাঠামোর ক্ষেত্রে প্রয়োজনীয়ভাবে প্রযোজ্য না (যেমন রিগ্রেশন)। আমি আশা করি ব্যাখ্যাটি বিভ্রান্তির চেয়ে বিষয়গুলিকে আরও স্পষ্ট করে তুলেছে :)

এই প্রশ্নটি "কেন এবং কখন" সম্পর্কিত একটি স্পষ্ট উত্তরের দাবিদার


3
যেহেতু এটি এখানে এবং এখানে আগের প্রশ্নের মতো প্রায় সমভূমিটিকে কভার করে, দয়া করে এই বিষয়গুলির যে কোনও বিষয়ে ইতিমধ্যে মোকাবেলা করা হয়নি তার দিকে মনোনিবেশ করতে আপনার থ্রেডটি পড়ুন এবং আপনার প্রশ্নটি আপডেট করুন। দ্রষ্টব্য, খুব, # 4 (এবং # 3 এর অংশ) লগারিদম সম্পর্কে প্রাথমিক প্রশ্ন যাগুলির উত্তরগুলি অনেক জায়গায় সহজেই পাওয়া যায় are
শুক্র

1
স্পষ্টতা সাহায্য করে। আপনি এই সত্যটি বিবেচনা করতে চাইতে পারেন, যদিও, কেবলমাত্র একটি ধ্রুবক শব্দ (এবং অন্য কোনও স্বতন্ত্র ভেরিয়েবল) সহ এই রিগ্রেশনটি তাদের গড়ের চারপাশের উপাত্তের প্রকরণের মূল্যায়নের সমান। অতএব, যদি আপনি রিগ্রেশন নির্ভরশীল ভেরিয়েবলের লগ গ্রহণের প্রভাবগুলি সত্যিই বুঝতে পারেন তবে আপনি ইতিমধ্যে (সরল) পরিস্থিতিটি এখানে বুঝতে পারছেন। সংক্ষেপে, একবার আপনার কাছে রিগ্রেশনেশনের জন্য চারটি প্রশ্নের উত্তর হয়ে গেলে, আপনাকে "বিচ্ছিন্নতার বিতরণ" সম্পর্কে আবার জিজ্ঞাসা করতে হবে না।
হোয়বার

@ ভুবার: আমি দেখছি ... সুতরাং আমি রিগ্রেশনতে লগ নেওয়ার কারণগুলি বুঝতে পারি, তবে কেবল আমাকে তাই শিখানো হয়েছিল - তাই অনুমিতি করার প্রয়োজন থেকে আমি এটি বুঝতে পেরেছি, অনুমানের মধ্যে ডেটা ফিট করে কিনা তা নিশ্চিত করার জন্য লিনিয়ার রিগ্রেশন এটাই আমার একমাত্র বোঝা। লগগুলি গ্রহণের প্রভাবের "সত্যিকারের বোঝাপড়া" হ'ল আমি যা অনুভব করছি তা হ'ল বিভ্রান্তি ... কোন সাহায্য? ;)
পিএইচডি

2
আহ, তবে আপনি এর থেকেও অনেক বেশি জানেন, কারণ রিগ্রেশন-এ লগগুলি ব্যবহার করার পরে, আপনি জানেন যে ফলাফলগুলি আলাদাভাবে ব্যাখ্যা করা হয় এবং আপনি ফিটেড ট্রান্সফর্মিং লাগানো মান এবং আত্মবিশ্বাসের ব্যবধানগুলিতে যত্ন নিতে জানেন। আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি বিভ্রান্ত না হয়ে থাকতে পারেন এবং সম্ভবত আপনি এই চারটি প্রশ্নের বেশিরভাগ উত্তর ইতিমধ্যে জানেন: যদিও আপনি প্রাথমিকভাবে এটি সম্পর্কে অবগত ছিলেন না :-)।
হোবার

উত্তর:


98

আপনি যদি এমন একটি মডেল ফর্ম ধরে থাকেন যা অ-রৈখিক তবে লিনিয়ার মডেল যেমন তে হতে পারে তবে নির্দিষ্ট মডেল ফর্মটি পূরণের জন্য গ্রহণ করা ন্যায়সঙ্গত হবে । সাধারণভাবে আপনার কার্যকারণ সিরিজ আছে বা না থাকুক, কেবলমাত্র লগ অফ নেওয়ার ক্ষেত্রে আপনি ন্যায়সঙ্গত বা সঠিক হতে পারবেন যখন এটি প্রমাণিত হতে পারে যে এর ভিন্নতা এর প্রত্যাশিত মানের সাথে সমানুপাতিক?logY=β0+β1tYYYY2। আমি নিম্নলিখিতগুলির মূল উত্সটি মনে করি না তবে এটি পাওয়ার ট্রান্সফর্মেশনের ভূমিকার সংক্ষিপ্তসার করে। এটি লক্ষ্য করা গুরুত্বপূর্ণ যে বিতরণীয় অনুমানগুলি ত্রুটি প্রক্রিয়া সম্পর্কে সর্বদা পর্যবেক্ষণ করা হয় না Y এইভাবে ধারাবাহিকটিকে একটি সাধারণ ধ্রুবক দ্বারা সংজ্ঞায়িত না করা হলে যথাযথ রূপান্তরের জন্য মূল সিরিজটি বিশ্লেষণ করা একটি নির্দিষ্ট "না-না"।

পার্থক্য সহ অনিয়ন্ত্রিত বা ভুল রূপান্তরগুলি অধ্যয়নরতভাবে এড়ানো উচিত কারণ এগুলি প্রায়শই অজ্ঞাতপরিচয় / স্তর পরিবর্তন / সময় প্রবণতা বা পরামিতিগুলির পরিবর্তন বা ত্রুটি বৈকল্পের পরিবর্তনের সাথে মোকাবিলা করার একটি অশুভ-কল্পনা / অশুভ-কল্পনা attempt এর একটি ক্লাসিক উদাহরণ এখানে 60০ স্লাইডে শুরু হয়ে আলোচনা করা হয়েছে http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting/doc_download/53-cables क्षमता- উপস্থিতি যেখানে তিনটি পালস অসাধারণতা ( চিকিত্সা না করা) প্রারম্ভিক গবেষকরা একটি অনিয়ন্ত্রিত লগ রূপান্তরিত করে। দুর্ভাগ্যক্রমে আমাদের বর্তমান গবেষকরা এখনও একই ভুল করছেন।

অনুকূল শক্তি রূপান্তর মাধ্যমে পাওয়া যায় বক্স-কক্সবাজার টেস্ট যেখানে

  • -1। একটি পারস্পরিক
  • -৫ একটি recriprocal বর্গমূল
  • 0.0 একটি লগ রূপান্তর
  • .5 একটি বর্গক্ষেত্র রূপান্তর এবং
  • 1.0 কোনও রূপান্তর নয়।

উল্লেখ্য আপনি কোন predictor / কার্যকারণ / সমর্থনকারী ইনপুট সিরিজ আছে মডেল যে এবং ডিস্ট্রিবিউশন সম্পর্কে প্রণীত কোন প্রয়োজনীয়তা আছে কিন্তু সম্পর্কে তৈরি হয় , ত্রুটি প্রক্রিয়া। এই ক্ষেত্রে বিতরণ প্রয়োজনীয়তাগুলি সরাসরি । যখন আপনি এই ধরণের একটি রিগ্রেশনে হিসাবে অথবা exogenous ইনপুট মডেল (সঙ্গে একটি Autoregressive চলমান গড়ের মডেল সিরিজের সমর্থনকারী আছে ARMAX মডেল ) distributional অনুমানের সব চলেছেন এবং সবটা কিছুই বিতরণের সঙ্গে কি আছে । সুতরাং আরিমা মডেল বা একটি এআরএমএক্স মডেলের ক্ষেত্রে কোনওরূপে কখনই কোনও রূপান্তর গ্রহণ করা হবে নাYt=u+atYatatYtatYtY সর্বোত্তম বক্স-কক্স রূপান্তরটি আবিষ্কার করার আগে যা জন্য প্রতিকার (রূপান্তর) প্রস্তাব করবে । পূর্বের যুগে কিছু বিশ্লেষক এবং মধ্যে রিগ্রেশন সহগ পরীক্ষা করে এর শতাংশ পরিবর্তনের ফলে এর শতাংশ পরিবর্তনের উপর প্রতিফলন করতে সক্ষম হওয়ার জন্য কিছু বিশ্লেষক এবং উভয়কেই রূপান্তরিত করতে পারে । সংক্ষেপে রূপান্তরগুলি ওষুধের মতো কিছু ভাল এবং কিছু আপনার পক্ষে খারাপ! এগুলি কেবল যখন প্রয়োজন তখন ব্যবহার করা উচিত এবং তারপরে সতর্কতার সাথে।YYXYXlogYlogX


2
আমি সম্মত হই যে যারাই ডাউনভোট (গুলি) রেখে গেছে তাদের কেন এটিকে বঞ্চিত করা হয়েছে সে সম্পর্কে একটি মন্তব্য দেওয়া উচিত। আইরিশস্টেটের কাছে, যদি আপনি উত্তরগুলি ছেড়ে দেওয়ার জন্য ফর্ম্যাট করার বিকল্পগুলি, বিশেষত লেটেক্সে সমীকরণ চিহ্নিতকরণের জন্য উপলভ্য হয়ে থাকেন তবে আপনার পোস্টটি পড়া খুব সহজ হবে। দেখুন markdown সম্পাদনা সাহায্যের অধ্যায় । আপনি যখন পোস্টিং বাক্সের উপরের ডান দিকের কোণায় (প্রশ্ন চিহ্ন সহ কমলা বৃত্তে) কোনও প্রতিক্রিয়া টাইপ করেন তখনই এই লিঙ্কটি উপলব্ধ।
অ্যান্ডি ডব্লিউ

4
উদ্ধৃত টেবিলটি ডগলাস সি মন্টগোমেরি, এলিজাবেথ এ পেক, জি। জেফ্রি ভাইনিং দ্বারা লিনিয়ার রিগ্রেশন অ্যানালাইসিসের পরিচিতিতে পাওয়া যায় ।
ব্যবহারকারী 1717828

@ ব্যবহারকারী 1717828 তু .. সময়সীমার সাথে লম্বা দাড়ি রাখার কারণে আমি সবসময় মন্টগোমেরির ভক্ত
হয়েছি

এটি কি সর্বদা সত্য নয় যে দ্বিতীয় মুহূর্ত এবং তারতম্যগুলি একে অপরের সাথে সমানুপাতিক? আমাদের কাছে ক্লাসিক সমীকরণ আছে: ভেরিয়েন্স দ্বিতীয় মুহুর্তের বিয়োগের প্রথম মুহুর্তের স্কোয়ারের সমান।
information_interchange

যেমনটি আপনি বলছেন বৈকল্পিকটি দ্বিতীয় মুহুর্তের একটি ক্রিয়া। আমি অন্যথায় কোথায় বোঝাচ্ছি। অতিরিক্তভাবে পরিবর্তিত সময়ে ( নির্বিচারে ) বিভিন্ন সময়ে সময়ে পরিবর্তন করতে পারেন SEE pdfs.semanticscholar.org/09c4/… যা পাওয়ার ট্রান্সফর্ম দ্বারা প্রতিকার হয় না।
আইরিশস্ট্যাট

107

লগ-স্কেল আপেক্ষিক পরিবর্তনগুলিকে (গুণিতক) অবহিত করে, যখন লিনিয়ার-স্কেল পরম পরিবর্তনগুলি (সংযোজক) সম্পর্কে অবহিত করে। আপনি কখন ব্যবহার করবেন? আপনি যখন আপেক্ষিক পরিবর্তনগুলি সম্পর্কে যত্নশীল হন, লগ-স্কেল ব্যবহার করুন; যখন আপনি নিখুঁত পরিবর্তনগুলি সম্পর্কে যত্নশীল হন, রৈখিক-স্কেল ব্যবহার করুন। এটি বিতরণের ক্ষেত্রে সত্য, তবে কোনও পরিমাণ বা পরিমাণের পরিবর্তনের জন্যও।

দ্রষ্টব্য, আমি খুব যত্নশীল এবং ইচ্ছাকৃতভাবে এখানে "যত্ন" শব্দটি ব্যবহার করি। কোনও মডেল বা লক্ষ্য ব্যতীত আপনার প্রশ্নের উত্তর দেওয়া যাবে না; মডেল বা লক্ষ্য নির্ধারণ করে কোন স্কেলটি গুরুত্বপূর্ণ। আপনি যদি কিছু মডেল করার চেষ্টা করছেন, এবং প্রক্রিয়াটি আপেক্ষিক পরিবর্তনের মাধ্যমে কাজ করে, লগ-স্কেল আপনার ডেটাতে দেখা আচরণটি ক্যাপচার করার জন্য গুরুত্বপূর্ণ is তবে অন্তর্নিহিত মডেলের প্রক্রিয়াটি যদি যুক্ত হয় তবে আপনি লিনিয়ার-স্কেলটি ব্যবহার করতে চাইবেন।

উদাহরণ। শেয়ার বাজার
স্টকের এ দিন 1: 100. দ্বিতীয় দিনে 2 101. বিশ্বের প্রতিটি স্টক ট্র্যাকিং পরিষেবা দুটি উপায়ে এই পরিবর্তনটির প্রতিবেদন করে! (1) + 1. (2) + 1%। প্রথমটি নিখুঁত, সংযোজনীয় পরিবর্তনের একটি পরিমাপ; দ্বিতীয় আপেক্ষিক পরিবর্তনের একটি পরিমাপ।$$$

আপেক্ষিক পরিবর্তনের তুলনায় পরম চিত্র: আপেক্ষিক পরিবর্তন একই, নিখুঁত পরিবর্তন ভিন্ন
স্টক এ 1 থেকে 1.10 এ যায়। স্টক বি 100 থেকে । 110 তে যায়।$$$$

শেয়ার এ, 10% অর্জন করে স্টক বি 10% অর্জন করে (আপেক্ষিক স্কেল, সমান)
... কিন্তু স্টক এ, 10 সেন্ট অর্জন যখন স্টক বি অর্জন 10 (বি আরও পরম ডলার পরিমাণ লাভ)$

আমরা যদি লগ স্পেসে রূপান্তর করি তবে আপেক্ষিক পরিবর্তনগুলি পরম পরিবর্তন হিসাবে উপস্থিত হয় appear

স্টক এ থেকে = 0 থেকে .0413 স্টক বি থেকে = 2 থেকে 2.0413log10($1)log10($1.10)
log10($100)log10($110)

এখন, লগ স্পেসে সম্পূর্ণ পার্থক্য নিয়ে আমরা দেখতে পেলাম যে উভয়ই .0413 দ্বারা পরিবর্তিত হয়েছে।

পরিবর্তনের এই দুটি পদক্ষেপই গুরুত্বপূর্ণ এবং কোনটি আপনার পক্ষে গুরুত্বপূর্ণ তা সম্পূর্ণ আপনার বিনিয়োগের মডেলটির উপর নির্ভর করে। দুটি মডেল আছে। (১) একটি নির্দিষ্ট পরিমাণ অধ্যক্ষ বিনিয়োগ করা বা (২) একটি নির্দিষ্ট সংখ্যক শেয়ারে বিনিয়োগ করা।

মডেল 1: একটি নির্দিষ্ট পরিমাণ অধ্যক্ষের সাথে বিনিয়োগ করা।

গতকাল স্টক বলুন শেয়ারের জন্য একটি মূল্য 1 এবং স্টক বিয়ের শেয়ারের দাম 100 । আজ দু'জনেই এক ডলার যথাক্রমে 2 এবং 101 ডলারে গিয়েছে । তাদের নিখুঁত পরিবর্তন অভিন্ন ( 1), তবে তাদের আপেক্ষিক পরিবর্তন নাটকীয়ভাবে আলাদা (এ এর জন্য 100%, বি এর জন্য 1%)। আপনার বিনিয়োগের জন্য একটি নির্দিষ্ট পরিমাণের প্রিন্সিপাল রয়েছে তা প্রদত্ত, say 100 বলুন , আপনি কেবল বি এর 1 ভাগ বা এ এর ​​100 ভাগ শেয়ার কিনতে পারবেন যদি আপনি গতকাল বিনিয়োগ করেন তবে আপনি এ এর সাথে 200 , বা 101 দিয়েছিলেন বি। সুতরাং এখানে আপনি আপেক্ষিক লাভ সম্পর্কে "যত্ন" রাখুন , বিশেষত কারণ আপনার কাছে সীমাবদ্ধ পরিমাণের অধ্যক্ষ।$$$$$$$$

মডেল 2: শেয়ারের নির্দিষ্ট সংখ্যা।

অন্য দৃশ্যে, ধরুন আপনার ব্যাংক আপনাকে কেবল ১০০ টি শেয়ারের ব্লক কিনতে দেয় এবং আপনি এ বা বি এর ১০০ টি শেয়ারে বিনিয়োগ করার সিদ্ধান্ত নিয়েছেন, আগের ক্ষেত্রে আপনি এ বা বি কিনে আপনার লাভ সমান হবে কি না? ( 100 - প্রতিটি ভাগের জন্য $ 1)।$

এখন ধরা যাক আমরা সময়ের সাথে সাথে একটি এলোমেলো পরিবর্তনশীল হিসাবে স্টক মানটি ভাবি এবং আমরা এমন একটি মডেল নিয়ে আসতে চাই যা সাধারণত স্টকগুলি কীভাবে আচরণ করে তা প্রতিফলিত করে। এবং ধরা যাক আমরা সর্বাধিক লাভের জন্য এই মডেলটি ব্যবহার করতে চাই। আমরা একটি সম্ভাব্যতা বিতরণ গণনা করি যার এক্স-মানগুলি 'শেয়ারের দাম' এর এককগুলিতে, এবং প্রদত্ত শেয়ারের মূল্য পর্যবেক্ষণের সম্ভাবনায় y- মানগুলি। আমরা এটি স্টক এ, এবং স্টক বিয়ের জন্য করি যদি আপনি প্রথম দৃশ্যে সাবস্ক্রাইব করেন যেখানে আপনার বিনিয়োগের একটি নির্দিষ্ট পরিমাণ প্রিন্সিপাল রয়েছে, তবে এই বিতরণগুলির লগ নেওয়া তথ্যমূলক হবে। কেন? আপনি যা যত্নশীল তা হ'ল আপেক্ষিক স্থানের বিতরণের আকার। কোনও স্টক 1 থেকে 10 পর্যন্ত যায়, বা 10 থেকে 100 আপনার কাছে গুরুত্বপূর্ণ নয়, তাই না? উভয় ক্ষেত্রে একটি 10 গুণআপেক্ষিক লাভ এটি ইউনিট লাভগুলিতে লগ-স্কেল বিতরণে স্বাভাবিকভাবে উপস্থিত হয় সরাসরি ভাঁজ লাভের সাথে মিল। দুটি স্টকের যাদের গড় মূল্য পৃথক তবে যাদের আপেক্ষিক পরিবর্তনটি একইভাবে বিতরণ করা হয় (তাদের দৈনিক শতকরা পরিবর্তনের একই বন্টন থাকে ), তাদের লগ বিতরণগুলি স্থানান্তরিত আকারে অভিন্ন হবে । বিপরীতে, তাদের লিনিয়ার বিতরণ আকারে অভিন্ন হবে না, উচ্চতর মূল্যবান বিতরণের উচ্চতর বৈকল্পিকতা থাকবে।

আপনি যদি লাইনারি বা পরম স্পেসে এই একই বিতরণগুলি লক্ষ্য করেন তবে আপনি ভাবেন যে উচ্চ-মূল্যবান শেয়ারের দামগুলি আরও বেশি ওঠানামার সাথে মিলে যায়। আপনার বিনিয়োগের উদ্দেশ্যে যদিও, যেখানে কেবল আপেক্ষিক লাভ হয়, এটি অগত্যা সত্য নয়।

উদাহরণ 2. রাসায়নিক বিক্রিয়া। ধরা যাক, আমাদের দুটি এবং এ এবং বি অণু রয়েছে যা একটি বিপরীতমুখী প্রতিক্রিয়ার মধ্য দিয়ে যায়।

AB

যা পৃথক হারের ধ্রুবক দ্বারা সংজ্ঞায়িত করা হয়

( ) ( )kabABkbaBA

তাদের ভারসাম্যটি সম্পর্কের মাধ্যমে সংজ্ঞায়িত হয়:

K=kabkba=[A][B]

এখানে দুটি পয়েন্ট। (1) এটি এবং এর ঘনত্বের মধ্যে একটি গুণগত সম্পর্ক । (২) এই সম্পর্কটি নির্বিচারে নয়, বরং সরাসরি মৌলিক শারীরিক-রাসায়নিক বৈশিষ্ট্য থেকে উদ্ভূত হয় যা পরস্পরকে ঘায়েল করে প্রতিক্রিয়ার নিয়ন্ত্রণ করে।AB

এখন ধরুন আমাদের কাছে A বা B এর ঘনত্বের কিছু বিতরণ রয়েছে। সেই বিতরণের উপযুক্ত স্কেলটি লগ-স্পেসে রয়েছে, কেননা যেভাবে কেন ঘনত্ব পরিবর্তিত হয় তার মডেলটি বহুগুণে সংজ্ঞায়িত হয় (বি এর ঘনত্বের বিপরীত সহ এ এর ​​ঘনত্বের পণ্য)। কিছু বিকল্প মহাবিশ্বে যেখানে , আমরা এই ঘনত্বের বিতরণকে পরম, লিনিয়ার স্পেসে দেখতে পারি।K=kabkba=[A][B]

এটি বলেছে, আপনার কাছে যদি একটি মডেল থাকে তবে তা শেয়ার বাজারের পূর্বাভাস বা রাসায়নিক গতিবিজ্ঞানের জন্য হয়ে থাকুন, আপনি সর্বদা লিনিয়ার এবং লগ স্পেসের মধ্যে 'ক্ষতিরবিহীনভাবে' আন্তঃ রূপান্তর করতে পারেন, যতক্ষণ না আপনার মানগুলির পরিধি । আপনি লিনিয়ারটি দেখতে চান বা লগ-স্কেল বিতরণ আপনি ডেটা থেকে প্রাপ্ত করার চেষ্টা করছেন তার উপর নির্ভর করে।(0,inf)

সম্পাদনা । একটি আকর্ষণীয় সমান্তরাল যা আমাকে স্বজ্ঞাততা গড়ে তুলতে সহায়তা করেছিল তা হ'ল পাটিগণিত অর্থ বনাম জ্যামিতিক অর্থের উদাহরণ। একটি গাণিতিক (ভ্যানিলা) বলতে সংখ্যার গড় গণনা করে এমন একটি লুকানো মডেল ধরে নিখুঁত পার্থক্য যা গুরুত্বপূর্ণ matter উদাহরণ। 1 এবং 100 এর গাণিতিক গড়টি 50.5। মনে করুন আমরা যদিও ঘনত্বের কথা বলছি, যেখানে ঘনত্বের মধ্যে রাসায়নিক সম্পর্কটি বহু গুণক। তারপরে গড় ঘনত্বটি সত্যিই লগ স্কেলে গণনা করা উচিত। একে জ্যামিতিক গড় বলে। 1 এবং 100 এর জ্যামিতিক গড় 10! আপেক্ষিক পার্থক্যের ক্ষেত্রে, এটি বোঝায়: 10/1 = 10, এবং 100/10 = 10, অর্থাৎ, গড় এবং দুটি মানের মধ্যে আপেক্ষিক পরিবর্তন একই। যুক্তভাবে আমরা একই জিনিসটি খুঁজে পাই; 50.5-1 = 49.5, এবং 100-50.5 = 49.5।


2
এটি একটি সত্যই সহায়ক উত্তর এবং আমি উদাহরণগুলি পছন্দ করি। লগ-ট্রান্সফর্ম ব্যবহার করার জন্য আপনি "কখন" সম্পর্কে আরও যুক্ত করতে পারেন? আপনি বলছেন "আপনি যখন আপেক্ষিক পরিবর্তনগুলি সম্পর্কে যত্নশীল হন, লগ-স্কেল ব্যবহার করুন; যখন আপনি নিখুঁত পরিবর্তনগুলি সম্পর্কে যত্নশীল হন, লিনিয়ার-স্কেল ব্যবহার করুন।" তবে এমন কিছু ঘটনা আছে যখন আপনি আপেক্ষিক পরিবর্তনগুলি সম্পর্কে যত্নবান হন তবে লগ-ট্রান্সফর্ম হওয়া উচিত নয় এবং যদি তাই হয় তবে কীভাবে আপনি এই মামলাগুলি সনাক্ত করতে পারেন? উদাহরণস্বরূপ, এই কাগজটি এমন একটি কেস তৈরি করে যে কোনও লগের সাধারণ বিতরণ অনুসরণ করে না এমন ডেটা লগ রূপান্তরিত করা উচিত নয়: ncbi.nlm.nih.gov/pmc/articles/PMC4120293
skeller88

@ skeller88 আমি এই কাগজটির সাথে একমত; এটি 'কেন আমরা বিতরণকে রূপান্তর করব?' এর আরও বিস্তৃত (এবং দার্শনিক!) প্রশ্নের সংকীর্ণ প্রতিক্রিয়া? আমি মনে করি এর উত্তরটি হ'ল আমাদের কাছে সাধারণ বিতরণের মধ্যে পার্থক্য করার জন্য একটি উন্নত পরিসংখ্যানযুক্ত সরঞ্জামদণ্ড রয়েছে, তবে অন্যদের জন্য কম বিকাশযুক্ত সরঞ্জামকিট এমনকি সম্ভবত নামবিহীন বিতরণগুলি (সংখ্যাগরিষ্ঠ)। চটকদার চেহারার বিতরণটি মূল্যায়নের জন্য একটি পদ্ধতি হতে পারে এটি আরও সাধারণ দেখায় কিনা তা দেখতে এটির লগইন করা; তবে উপরে যেমন আইরিশস্ট্যাট প্রযুক্তিগতভাবে বর্ণনা করেছেন, এই পথটি বিপদের সাথে পরিপূর্ণ (বর্গক্ষেত্রের খোসা, গোল গর্তের জাত)।
ভেক্টর 07

1
এই প্রভাবের একটি প্রাসঙ্গিক ব্যাখ্যা আছে এবং কেন এটি সিদ্ধান্ত গাছের জন্য কিছুটা গুরুত্বপূর্ণ ডিটাটসায়েন্স // এর দিকে
কিথ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.