সেন্সর করা ডেটা ঠিক কী?


14

আমি সেন্সর করা ডেটার বিভিন্ন বিবরণ পড়েছি:

ক) এই থ্রেডে বর্ণিত হিসাবে, নির্দিষ্ট থ্রেশহোল্ডের নীচে বা তার উপরে অপ্রমাণিত ডেটা সেন্সর করা হয়েছে। অপ্রমাণিত মানে ডেটা নির্দিষ্ট স্রোতের চেয়ে উপরে বা নীচে তবে আমরা সঠিক মানটি জানি না। এরপরে রিগ্রেশন মডেলটিতে ডেটা কম বা উচ্চ প্রান্তিক মান হিসাবে চিহ্নিত করা হয় । এটি এই উপস্থাপনার বর্ণনার সাথে মেলে যা আমি খুব পরিষ্কার পেয়েছি (প্রথম পৃষ্ঠায় ২ য় স্লাইড) অন্য কথায়, Y হ'ল ন্যূনতম, সর্বাধিক মান বা উভয়কেই আবদ্ধ করা হয়েছে কারণ আমরা এই সীমার বাইরে প্রকৃত মান জানি না।

বি) একজন বন্ধু আমাকে বলেছিল যে আমরা আংশিকভাবে করার জন্য একটি সেন্সর তথ্য মডেল আবেদন করতে পারেন অজানা Y , পর্যবেক্ষণ প্রদান করা আমরা অন্তত অজানা সম্পর্কে কিছু সীমা তথ্য আছে Yi ফলাফল। উদাহরণস্বরূপ, আমরা কিছু গুণগত মানদণ্ডের ভিত্তিতে নীরব ও খোলা নিলামের মিশ্রণের চূড়ান্ত দামটি নির্ধারণ করতে চাই (পণ্যগুলির ধরণ, দেশ, দরদাতাদের ধনী ইত্যাদি)। খোলামেলা নিলামের জন্য আমরা সমস্ত চূড়ান্ত মূল্য জানি Yi, নীরব নিলামের জন্য আমরা কেবল প্রথম বিডটি জানি (বলুন, $ 1000) তবে চূড়ান্ত দাম নয়। আমাকে বলা হয়েছিল যে এই ক্ষেত্রে ডেটা উপরে থেকে সেন্সর করা হয় এবং একটি সেন্সরযুক্ত রিগ্রেশন মডেল প্রয়োগ করা উচিত।

গ) অবশেষে উইকিপিডিয়া দ্বারা প্রদত্ত সংজ্ঞাটি রয়েছে যেখানে পুরোপুরি অনুপস্থিত তবে ভবিষ্যদ্বাণীকারীরা উপলব্ধ। আমি নিশ্চিত নই যে এই উদাহরণটি কেটে যাওয়া ডেটা থেকে আলাদা।Y

তাহলে সেন্সর করা ডেটা ঠিক কী?


6
আরও প্রাসঙ্গিক উইকিপিডিয়া নিবন্ধটি এন.ইউইকিপিডিয়া.আর.উইকি / সেন্সরিং_১৯২৮ স্ট্যাটিস্টিক্স ১০৯৯ এ রয়েছে । যদিও এটি বিস্তৃত নয়, এটি কমপক্ষে টাইপ I এবং টাইপ II সেন্সরিংয়ের বর্ণনা দেয় এবং বাম এবং ডান সেন্সর সহ অন্তর সেন্সরিং স্বীকার করে।
whuber

উত্তর:


8

ফলাফল এবং একটি কোভেরিয়েট এক্স সম্পর্কে নিম্নলিখিত ডেটা বিবেচনা করুন :yx

user y       x   
1    10      2 
2   (-∞,5]   3 
3   [4,+∞)   5   
4   [8,9]    7
5     .      .

ব্যবহারকারী 1 এর জন্য, আমাদের কাছে সম্পূর্ণ ডেটা রয়েছে have সবার জন্য, আমাদের কাছে অসম্পূর্ণ ডেটা রয়েছে। ব্যবহারকারী 2, 3 এবং 4 সমস্ত সেন্সর করা হয়েছে: কোভারিয়েটের জ্ঞাত মানগুলির সাথে সম্পর্কিত ফলাফলটি পর্যবেক্ষণ করা হয় না বা যথাযথভাবে পর্যবেক্ষণ করা হয় না (বাম-, ডান- এবং অন্তর-সেন্সরকৃত)। কখনও কখনও এটি জরিপ ডিজাইনে গোপনীয়তার বিবেচনার একটি নিদর্শন। অন্যান্য সময়ে, এটি অন্যান্য কারণে ঘটে। উদাহরণস্বরূপ, আমরা ন্যূনতম মজুরির নীচে কোনও মজুরি বা আঞ্চলিক ক্ষমতার উপরে কনসার্টের টিকিটের আসল চাহিদা পর্যবেক্ষণ করি না।

ব্যবহারকারীর 5 টি কেটে গেছে: ফলাফল এবং কোভেরিয়াট উভয়ই অনুপস্থিত। এটি সাধারণত ঘটে থাকে কারণ আমরা কেবল এমন কিছু লোকের ডেটা সংগ্রহ করি যারা কিছু করে did উদাহরণস্বরূপ, আমরা কেবলমাত্র এমন লোকদের জরিপ করি যারা কিছু কিনেছেন ( ), তাই আমরা y = 0 সহ যে কাউকে তাদের এক্স এস সহ বাদ দিই । আমাদের কাছে এই জাতীয় ব্যবহারকারীর জন্য আউট ডেটাতে সারি নাও থাকতে পারে, যদিও আমরা জানি তাদের উপস্থিতি আছে কারণ আমরা জানি যে আমাদের নিয়মটি তৈরি করতে যে নিয়মটি ব্যবহার করা হয়েছিল। আরেকটি উদাহরণ হল আনুষঙ্গিক ছাঁটাই: আমরা শুধুমাত্র যারা কাজ বহাল জন্য মজুরি অফার পালন কারণ আমরা অনুমান মজুরি যখন আপনি কাজ হয় মজুরি অফার। কাটাটি ঘটনাগত কারণ এটি y এর উপর নির্ভর করে নাy>0y=0xy, কিন্তু অন্য পরিবর্তনশীল।

সংক্ষেপে, সংক্ষিপ্তকরণ সেন্সর করার চেয়ে বৃহত্তর তথ্য হ্রাস বোঝায় (পয়েন্ট এ এবং বি)। এই উভয় প্রকারের "গায়েবি" পদ্ধতিগত।

এই ধরণের ডেটা নিয়ে কাজ করা সাধারণত ত্রুটি সম্পর্কে শক্তিশালী বিতরণ অনুমান করা এবং এটিকে বিবেচনায় নেওয়ার সম্ভাবনা সংশোধন করে। আরও নমনীয় আধা-প্যারামেট্রিক পদ্ধতিগুলিও সম্ভব। এটি আপনার পয়েন্টে অন্তর্নিহিত is


2
এই উত্তরের দুটি দিক আমাকে বিভ্রান্ত করে। প্রথমত, বিশুদ্ধরূপে নিখোঁজ হওয়া মানগুলি কাটা কাটা প্রতিফলিত করে না। দ্বিতীয়ত, সেন্সর দেওয়ার পদ্ধতি ("এলোমেলো" বনাম "তথ্যমূলক") প্রায়শই সেন্সরিংয়ের সত্য হিসাবে গুরুত্বপূর্ণ, এটি ইঙ্গিত করে যে কেবলমাত্র বিরতি-মূল্যবান ডেটা রেকর্ডিংয়ের চেয়ে সেন্সর করার মতো আরও কিছু রয়েছে।
whuber

এটি একটি খুব ভাল উদাহরণ। এর অর্থ কি এই যে প্রতি " " কে বিভিন্ন "সেন্সরিং সীমা" প্রয়োগ করা যেতে পারে ? এই ক্ষেত্রে আমরা কীভাবে মডেলটি তৈরি করব? এটি বিতে আমার বন্ধুত্বের বক্তব্যকে বৈধতা দেবে)। y
রবার্ট কুব্রিক

1
আপনি যদি হোমোসটেস্টাস্টিক, সাধারণত বিতরণ করা ত্রুটিগুলি ধরে নিতে ইচ্ছুক হন তবে সম্ভাবনাটি এভাবে লেখা যেতে পারে এবং আপনি পর্যবেক্ষণ-সুনির্দিষ্ট সেন্সরিংয়ের চৌকাঠ সহ এমএলই ব্যবহার করতে পারেন।
দিমিত্রি ভি। মাস্টারভ

3
@ পিটার এটি (ডান) সেন্সর করছে না? এই সমস্ত লোককে বাদ দেওয়া এবং নমুনায় মোটেও গণনা না করা হলে কাটা কাটা ঘটবে। En.wikedia.org/wiki/Truncation_( পরিসংখ্যান) দেখুন ।
whuber

1
@ পিটার আপনি কী বিভ্রান্ত করছেন তা লিখছেন "তারপরে আমরা জানি যে সেই ব্যক্তির বিএমআই 30 এরও বেশি": আপনি কীভাবে এমন কাউকে উল্লেখ করতে পারেন যিনি এমনকি আপনার নমুনায় নেই ("গণনা করা হয়নি")? "BMI> 30" ফর্মটির একটি পর্যবেক্ষণ সেন্সর করছে যেখানে আপনার বিশ্লেষণ থেকে এই জাতীয় পর্যবেক্ষণগুলির সম্পূর্ণ বর্জন, এমনকি জনসংখ্যার মধ্যে থাকতে পারে এমন সময়ই এটি কাটা কাটা। পরবর্তী ক্ষেত্রে আপনি যা বলতে পারেন তা হ'ল "৩০ বছরের উপরে বিএমআইওয়ালা লোকদের নমুনা থেকে বাদ দেওয়া হয়েছে।"
whuber

9

বর্ণনামূলকভাবে বলতে গেলে, আমি প্রস্তাব দেব "যদি কোনও তথ্যের নমুনা সেন্সর করা হয় তবে এতে যদি কিছু পর্যবেক্ষণ গ্রহণ করা হয় বা গঠন করা হয়, তবে নমুনার চূড়ান্ত মানগুলি কিন্তু তাদের আসল মান পর্যবেক্ষণকৃত নমুনা সীমার বাইরে"। তবে এটি প্রতারণামূলকভাবে সোজাসাপ্টা।

সুতরাং আসুন প্রথমে আলোচনা করা যাক আমরা কীভাবে উপসংহারে পৌঁছাতে পারি যে একটি ডেটা সেট সেন্সর করা হয়েছে, যা প্রাকৃতিকভাবে আমাদেরকে প্রশ্নে উপস্থাপিত মামলাগুলি নিয়ে আলোচনা করতে পরিচালিত করবে।

ধরুন আমাদের একটি পৃথক র্যান্ডম ভেরিয়েবল থেকে নিম্নলিখিত ডেটা সেট দেওয়া হয়েছে , যার জন্য আমরা কেবলমাত্র জানি এটি অ-নেতিবাচক:X

{0,1,1,2,2,2,2,2,2,2}

আমরা কি বলতে পারি যে ডেটা সেটটি সেন্সর করা হয়েছে? ঠিক আছে, আমরা এটি ভাবার অধিকারী যে এটি হতে পারে তবে এটি অগত্যা নয়:

1) এর ব্যাপ্তি { 0 , 1 , 2 } এবং সম্ভাব্যতা বিতরণ {X{0,1,2} । যদি প্রকৃতপক্ষে এটি হয় তবে এটি প্রদর্শিত হবে যে এখানে কোনও সেন্সরিং নেই, সীমাবদ্ধ সমর্থন এবং অত্যন্ত অসম্পূর্ণ বিতরণ সহ এ জাতীয় এলোমেলো পরিবর্তনীয় থেকে একটি "প্রত্যাশিত" নমুনা। {0.1,0.1,0.8}

2) কিন্তু এটা ক্ষেত্রে যে হতে পারে পরিসর আছে { 0 , 1 , , 9 } অভিন্ন সম্ভাব্যতা বিতরণের সঙ্গে { 0.1 , 0.1 , .0 .1 } , এক্ষেত্রে আমাদের ডেটা নমুনা সম্ভবত সেন্সর করা। X{0,1,...,9}{0.1,0.1,...0.1}

আমরা কীভাবে বলতে পারি? আমরা পূর্বের জ্ঞান বা তথ্য রাখি তা বাদ দিয়ে আমরা তা করতে পারি না, যা আমাদের এক বা অন্য মামলার পক্ষে তর্ক করার অনুমতি দেবে। প্রশ্নে উপস্থাপিত তিনটি মামলা কি সেন্সরিংয়ের প্রভাবের পূর্ব জ্ঞানকে উপস্থাপন করে? দেখা যাক:

কেস এ) এমন পরিস্থিতি বর্ণনা করে যেখানে কিছু পর্যবেক্ষণের জন্য আমাদের কাছে কেবল "খুব বড়", "খুব ছোট" ইত্যাদির মতো গুণগত তথ্য থাকে যা আমাদের পর্যবেক্ষণকে একটি চূড়ান্ত মান নির্ধারণ করতে পরিচালিত করে। মনে রাখবেন যে প্রকৃত উপলব্ধিমান মানটি না জেনে চরম মান নির্ধারণকে ন্যায়সঙ্গত করে না। সুতরাং আমাদের অবশ্যই এই প্রভাবের জন্য কিছু তথ্য থাকতে হবে যে এই পর্যবেক্ষণগুলির জন্য, তাদের মান সমস্ত পর্যবেক্ষণের চেয়ে বেশি বা তার চেয়ে কম। এই ক্ষেত্রে, এলোমেলো ভেরিয়েবলের আসল পরিসর অজানা, তবে আমাদের গুণগত তথ্য আমাদের সেন্সর করা নমুনা তৈরি করার অনুমতি দেয় (এটি কেন আমরা কেবল যে পর্যবেক্ষণগুলিতে সত্যিকারের উপলব্ধি মূল্য রাখি না তা কেন বাদ দেই না তা নিয়েই এটি অন্য আলোচনা is )।

কেস বি) হয় না , সেন্সর একটি মামলা যদি আমি এটি সঠিকভাবে বুঝতে, বরং দূষিত নমুনা একটি মামলা: আমাদের অবরোহমার্গী তথ্য আমাদের বলে যে এলোপাতাড়ি ভেরিয়েবলের সর্বোচ্চ মান অতিক্রম করতে পারে না (ক শারীরিক আইন বা কারণে বলে সামাজিক আইন অনুসারে এটি গ্রেডিং সিস্টেমের গ্রেড ডেটা যা কেবলমাত্র 1 , 2 , 3 এর মান ব্যবহার করে ) u তবে আমরা মান 4 এবং মান 5 ও পর্যবেক্ষণ করেছি । এটা কিভাবে হতে পারে? তথ্য রেকর্ডিংয়ে ভুল। তবে এই জাতীয় ক্ষেত্রে আমরা নিশ্চিতভাবে জানি না যে 431,2,3454 এর এবং এর সমস্ত 3 হওয়া উচিত53এর (প্রকৃতপক্ষে, কম্পিউটারের সাইড কীবোর্ডের দিকে তাকানো, সম্ভবত এটি এর 1 এর 1 এবং 5 এর 2 এর 's' বেশি সম্ভবত !)। নমুনাটিকে যেভাবেই "সংশোধন" করে, আমরা এটিকে সেন্সর করে রাখি না, কারণ র্যান্ডম ভেরিয়েবলটি প্রথম স্থানে রেকর্ডকৃত পরিসরে রেঞ্জ করার কথা নয় (সুতরাং 4 এবং 5 এর মানগুলিতে নির্ধারিত সত্যিকারের সম্ভাবনা নেই) )। 415245

কেস সি) একটি যৌথ নমুনা বোঝায়, যেখানে আমাদের নির্ভরশীল পরিবর্তনশীল এবং ভবিষ্যদ্বাণী রয়েছে। এখানে, আমাদের একটি নমুনা থাকতে পারে যেখানে নির্ভরশীল ভেরিয়েবলের মানগুলি এক বা উভয় চূড়ায় কেন্দ্রীভূত হয়, অধ্যয়নের অধীনে ঘটনার কাঠামোর কারণে: "ঘন্টা কাজ" স্বাভাবিক উদাহরণে, বেকার লোকেরা কাজ করে না তবে তাদের থাকতে হবে কাজ করেছেন (সাবধানতার সাথে চিন্তা করুন: এই উত্তরটি কি এই উত্তরটির শুরুতে বর্ণনামূলক "সংজ্ঞা" এর আওতায় পড়ে?) সুতরাং তাদের রেকর্ডিং ঘন্টা "শূন্য" বৈষম্য তৈরি সহ অন্তর্ভুক্ত করুন create অন্য চূড়ান্তভাবে, কাজ করা সর্বাধিক সংখ্যক ঘন্টা পৌঁছতে সক্ষম হতে পারে বলে যুক্তিযুক্ত হতে পারে, বলুন 16/ দিন, এবং এমন কর্মী থাকতে পারে যা প্রদত্ত বেতনের জন্য এতগুলি কাজ করতে ইচ্ছুক হবে। তবে আইনি কাঠামো এটির অনুমতি দেয় না এবং তাই আমরা এই জাতীয় "ঘন্টা কাজ" পালন করি না। এখানে, আমরা অনুমান করার চেষ্টা করছি " অভিযুক্ত শ্রম সরবরাহের ক্রিয়াকলাপ" - এবং এই পরিবর্তনশীলটির প্রতি শ্রদ্ধার সাথে এই নমুনাটি সেন্সরযুক্ত হিসাবে চিহ্নিত করা হয়েছে।
কিন্তু আমরা যদি ঘোষণা করে যে আমরা কি করতে চাই "শ্রম সরবরাহ ফাংশন অনুমান হয় দেওয়া বেকারত্ব ঘটনাটি এবং আইনি কাঠামো", নমুনা, সেন্সর হবে না যেহেতু এটি, এমন কিছু বিষয় যা আমরা চাই এই দুটি দিক প্রভাব প্রতিফলিত হবে এটা করতে।

সুতরাং আমরা দেখতে পেলাম যে সেন্সর হিসাবে একটি ডেটা নমুনা বৈশিষ্ট্যযুক্ত ক)
বিভিন্ন পরিস্থিতি থেকে আসতে পারে এবং
খ)
একা কিছু যত্নশীল-আবশ্যক প্রয়োজন যে এটি কেটে যাওয়ার ক্ষেত্রে বিভ্রান্ত হতে পারে


6
এটি এককোনোমেট্রিক দৃষ্টিকোণ বলে মনে হচ্ছে। নোট করুন যে জৈব-জৈবিক গবেষণার ক্ষেত্রে প্রতিক্রিয়া হিসাবে মেয়াদ (সম্ভবত আক্ষরিকভাবে বেঁচে থাকা) হওয়া এবং পর্যবেক্ষণের শেষের দিকে ইভেন্টটি অনুভব না করে রোগীদের সেন্সর করা সাধারণ বিষয়। তবে পর্যবেক্ষণের সময় যে রোগী বাদ পড়েছেন বা ফলোআপ হারিয়েছিলেন তাদেরও থাকতে হবে have (সম্ভবত তারা সরে গিয়েছে এবং যোগাযোগ নষ্ট হয়ে গেছে)) আমরা জানতে পারি যে বেঁচে থাকার সময়টি> শেষ পরিচিতি, তবে পর্যবেক্ষণের সময়কালের চেয়ে কম হতে পারে।
গুং - মনিকা পুনরায়

কেস বি ভুল বা দূষিত ডেটার জন্য নয়। ধরা যাক আমরা কিছু গুণগত মানদণ্ডের ভিত্তিতে নীরব ও খোলা নিলামের মিশ্রণের চূড়ান্ত মূল্য অনুমান করতে চাই (পণ্যগুলির ধরণ, দেশ, দরদাতাদের ধন, ...)। নীরব নিলামের জন্য আমরা কেবল প্রথম বিডটি জানি (বলুন, $ 1000) তবে চূড়ান্ত দাম নয়। আমাকে বলা হয়েছিল যে আমরা সেন্সর মডেলিংয়ের কিছু ফর্ম ব্যবহার করে নীরব নিলামের ডেটা ব্যবহার করতে পারি।
রবার্ট কুব্রিক

1
@ গং এটি অবশ্যই একটি অর্থনীতি সংক্রান্ত পদ্ধতির, দেওয়া উত্তরটি কে দিয়েছেন!
আলেকোস পাপাদোপল্লো

1
@ রবার্টকুন্রিক আপনার বিবরণটি বি এর সাথে মেলে না, যেমন কেস বি বর্ণিত হয়েছে, আমরা বিভিন্ন মূল্যবোধ পর্যবেক্ষণ করি এবং তারপরে আমাদের জানানো হয় যে পর্যবেক্ষণ করা কিছু মান বাস্তবে অসম্ভব। নিলাম উদাহরণের সাথে কীভাবে মেলে?
আলেকোস পাপাদোপল্লো

দয়া করে এটি একটি সমালোচনা হিসাবে গ্রহণ করবেন না, @ আলেকোসপ্যাপাডোপল্লোস। আমি মনে করি না যে এখানে কিছু ভুল আছে। আমি কেবল উল্লেখ করতে চাই যে শর্তাদি বিভিন্ন ক্ষেত্রে পৃথকভাবে ব্যবহৃত হয়, এবং এটি কনভেনশনটি স্ট্যাট / বায়োস্ট্যাট নয়।
গুং - মনিকা পুনরায়

2

আমার জন্য, সেন্সর করার অর্থ আমরা একটি পর্যবেক্ষণ সম্পর্কে আংশিক-তথ্য পর্যবেক্ষণ করি । যে আমি কি এই দ্বারা মানে, নিরীক্ষক বদলে জেড আমি = z- র আমি আমরা মান্য জেড আমিএকটি আমি যেখানে একটি আমি উপলব্ধি একজন আমি , যা নমুনা স্থান কিছু র্যান্ডম coarsening হয়। আমরা কল্পনাও হতে পারে আমরা প্রথমে একটি পার্টিশন নির্বাচন একটি আমি নমুনা স্থান জেড , তারপর জেড আমি উৎপন্ন হয়, এবং আমরা প্রতিবেদন একটি আমিএকজন আমি যেমন যেZiZi=ziZiaiaiAiAiZZiAiAiZiAi (equivalently, we report I(ZiA) for all AAi). Uninformative censoring of Zi, for example, then means that Ai is independent of Zi.

[ZiZiai]ZiZi=(Xi,Yi)Yiai={x}×YY is the sample space of Y and say Zi is missing if ai=Z. When one says "Zi is censored", if they are following my definition, what they usually mean is "Zi is censored, but is not missing".


1

It's important to distinguish censored versus truncated as well as missing data.

Censoring applies specifically to the issue of survival analysis and time-to-event outcomes wherein the event at hand is assumed to have occurred at some time past the point at which you stopped observing that individual. An example is men-who-have-sex-with-men (MSM) and the risk of incident HIV in a prospective study who move and cease contact with study coordinators.

Truncation applies to a continuous variable that evaluates to a specific point at which the actual value is known to be either greater than or less than that point. An example is the monitoring of subjects with HIV and the development of full blown AIDS, CD4 cell counts falling below 300 are evaluated to the lower-limit-of-detection 300.

Lastly, missing data are data that have actual values that are not observed in any sense. Censored data are not missing time-to-event data nor are they truncated.


1
There's another use of "truncation": to describe a data-generating process where observations above/below cut-offs are unobtainable. A classic example involves counting the no.eggs found in the nests of a particular bird species, where the species can only be identified from the egg; empty nests could be from any species so the no. zeroes is unknown. If the no. eggs follows a Poisson distribution, the egg counts from non-empty nests follow a truncated Poisson. So truncation produces missing data according to a specific well defined mechanism.
Scortchi - Reinstate Monica

1
... Your cell count data are indeed censored according to many people's understanding of the term, which is not restricted to time-to-event measurements, because you know everything about each subject except how far below 300 his cell count is; "truncation" here (alternatively "Winsorization") describes the method of analysis, viz the treatment of values below 300 as if they were equal to 300.
Scortchi - Reinstate Monica

A clear reference on the survival analysis concept of censoring: itl.nist.gov/div898/handbook/apr/section1/apr131.htm.
Eric O Lebigot

-1
  1. Censored: This is a term used to indicate that the period of observation was cut off before the event of interest occurred. So ''censored data'' indicate that the period of a particular event as not or never occurred

3
Welcome to the site. If this is copied from some source, please cite the source.
gung - Reinstate Monica

3
Censoring applies to much more than time-dependent observations. For instance, chemical concentrations measurements that are below the limit of detection are censored, too.
whuber

@whuber: May I offer a friendly amendment to that observation. The chemical concentrations that fall below the limit of detection are indeed censored, but since they cannot possibly be negative, analyses should consider them as truncated at zero. My own understanding of the truncation-censoring distinction is that truncation applies to the range of parameters that are possible for the underlying distribution.
DWin

@DWin Thank you for that thoughtful clarification. I can only agree with the first point. In the great majority of datasets I have analyzed, though, it was necessary to re-express concentrations as logarithms--and there the distinction disappears. In other datasets where background has been subtracted (such as radiological measurements), there is no definite left endpoint, either. Your second point strikes me as unusual: I have never seen "truncation" used to refer to creating a subset of a distribution family.
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.