সাধারণ শব্দ যা নির্দিষ্ট পরিসংখ্যানগত অর্থ রয়েছে


12

আমি কোনও পরিসংখ্যানবিদ নই তবে আমার গবেষণা কাজে পরিসংখ্যান (তথ্য বিশ্লেষণ, সাহিত্য পড়া ইত্যাদি) জড়িত। আমাকে এখানে পোস্ট করা আমার একটি প্রশ্নের একটি মন্তব্য থেকে আবার স্মরণ করিয়ে দেওয়া হয়েছিল যে কয়েকটি সাধারণ শব্দ রয়েছে যাঁদের বিশেষত নির্দিষ্ট অর্থ বা অর্থের ক্ষেত্রের ক্ষেত্রে ভাল অনুশীলনকারীদের অর্থ রয়েছে।

এই জাতীয় শব্দের একটি তালিকা রাখা সহায়ক হবে এবং কিছু মন্তব্য সহ বাক্যাংশও হতে পারে।


1
সম্প্রদায় উইকির প্রার্থীর মতো শোনাচ্ছে ।
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেন_ বি এটি পরিসংখ্যান বা গণিতের যে কোনও পদেই যোগ্যতা অর্জন করতে পারে তা দিয়ে এটি একটি বিশেষত বড় আকারে পরিণত হতে পারে। অর্থবহভাবে এই প্রশ্নের পরিধি সঙ্কুচিত করার কোনও উপায় আছে কি?
whuber

3
@ শুভ হ্যাঁ, এটি অত্যধিক বিস্তৃত হওয়ার আশঙ্কা রয়েছে। সুযোগটি সঙ্কীর্ণ করার জন্য "যা সাধারণত বিভ্রান্তি সৃষ্টি করে" এর মতো কিছু হবে?
গ্লেন_বি -রিনস্টেট মনিকা

আমি মনে করি উপযুক্ত পরিসংখ্যানবিদদের সাধারণত তাদের মাতৃভাষার একটি ভাল কমান্ড থাকে এবং তারা যখন জার্গনটি ব্যবহার করছেন যা সঠিকভাবে শ্রোতাদের কাছে সঠিকভাবে ব্যাখ্যা করা দরকার সে সম্পর্কে ভালভাবে সচেতন হন।
রবার্ট জোন্স

@ Glen_b আমি নিশ্চিত নই এটি এত বিস্তৃত আমি সবেমাত্র শব্দের একটি তালিকা শুরু করতে পারি যা কভার করা উচিত: যথার্থতা, পক্ষপাত, ক্যালিব্রেশন, বৈষম্য, ধারাবাহিক, বিতরণ, বিপত্তি, বেঁচে থাকা, স্প্লাইন, মডেল, প্রতিক্রিয়া, বুটস্ট্র্যাপ, সমন্বয়, গুচ্ছ, শর্তসাপেক্ষ, আত্মবিশ্বাস, ঘনত্ব , অনুমান, পরিবর্তনশীল, নৈমিত্তিক, পারস্পরিক সম্পর্ক, পূর্বাভাস, অনুমান, সেন্সরিং, ​​ঝুঁকি, একত্রীকরণ, লজিস্টিক, সীমা, কভারেজ, বিভ্রান্তিমূলক, সংঘাত, সংযোগ, চিঠিপত্র, স্বাধীনতা, বিচ্যুতি, তাত্পর্যপূর্ণ, চূড়ান্ত, পরিসীমা, স্বাভাবিক, ড্রপ-ইন, ডামি , [বৈচিত্র] ব্যাখ্যা, ফ্যাক্টর, ব্যর্থতা, পূরণ-ইন, ফিট, লাগানো, ফাংশন, ...
হুবুহু

উত্তর:


12

" উল্লেখযোগ্য " - এখানে শব্দের সাধারণ ভাষার ব্যবহারের অর্থ 'গুরুত্বপূর্ণ' বা 'অর্থবহ' এর মতো কিছু বোঝানো। পরিসংখ্যানগত অর্থ অনানুষ্ঠানিকভাবে "নাল সম্পর্কে এলোমেলো প্রকরণ থেকে চিহ্নিত করা যায়" এর নিকটবর্তী; এটি বোঝায় না যে পার্থক্যটি যথেষ্ট পরিমাণে গুরুত্বপূর্ণ।

এখানে কয়েকটি উদাহরণ রয়েছে যেখানে এই পার্থক্যটি কিছু বিভ্রান্তির কারণ হতে পারে: 1 2

" প্যারামিটার " - এটি প্রায়শই ঘটে বলে মনে হয় - বিশেষত বৈজ্ঞানিক পরীক্ষায় - যে পরিসংখ্যানবিদ 'ভেরিয়েবল' শব্দটি ব্যবহার করেছিলেন সেভাবেই 'প্যারামিটার' শব্দটি ব্যবহৃত হয়। উইকিপিডিয়া এটি এইভাবে রাখে:

একটি পরিসংখ্যানগত পরামিতি হ'ল প্যারামিটার যা সম্ভাবনা বন্টনের একটি পরিবারকে সূচক করে। এটিকে জনসংখ্যার বা মডেলের সংখ্যাসূচক বৈশিষ্ট্য হিসাবে বিবেচনা করা যেতে পারে

উদাহরণ যেখানে এটির কোনও সমস্যা হতে পারে: 1 - সম্ভবত পোস্টটি যা এই প্রশ্নে নেতৃত্ব দিয়েছে। (আমি সম্প্রতি অন্য একটি দেখেছি তবে আমি এখনই এটি সনাক্ত করতে পারি না)


11

"ত্রুটি" - পরিসংখ্যানগুলিতে এর অর্থ প্রায়শই একটি পর্যবেক্ষণকৃত এবং পূর্বাভাসিত মানের মধ্যে কোনও বিচ্যুতি। বাস্তব জীবনে এর অর্থ একটি ভুল।


11

আমি 2010 থেকে একটি রেফার্ড কাগজ পেয়েছি যা এই প্রশ্নের দিকে নজর দেয়।

অ্যান্ডারসন-কুক সিএম। লুকানো জার্গন: পরিসংখ্যান নির্দিষ্ট নির্দিষ্ট অর্থ সহ প্রতিদিনের শব্দ। আইসিটিএস 8, টিচিং স্ট্যাটিস্টিক্স সম্পর্কিত আন্তর্জাতিক সম্মেলন, লুবলজানা, স্লোভেনিয়া, 11-17 জুলাই 2010।

কাগজটি অনলাইনে বিনামূল্যে পাওয়া যায় , সুতরাং আমি কেবলমাত্র শর্তগুলির একটি আংশিক তালিকা সরবরাহ করছি যা লেখক আলোচনা করেছেন:

 confounding, control, factor, independent, random, uniform

10

আমি "মিথ্যা কল্পনা" হিসাবে "মিথ্যাবাদ" ব্যবহার করার সমস্যাটি দেখতে পেয়েছি, অন্যরা ভেবেছিল যে আমি "তথ্য তৈরির" কথা উল্লেখ করছি। এছাড়াও " পক্ষপাতদুষ্ট " বিভ্রান্তি সৃষ্টি না করে উল্লেখ করা প্রায় অসম্ভব।


6

"সাধারণ" - সাধারণ বক্তৃতায়, সাধারণ অর্থ প্রত্যাশার মতো, সাধারণের বাইরে নয়। পরিসংখ্যানগুলিতে, যদি কোনও ভেরিয়েবল সাধারণত বিতরণ করা হয় তবে এটি গাউসীয় বিতরণকে বোঝায়। আমি বিশ্বাস করি না যে এটি সাধারণ কথার অর্থ থেকে আলাদা করার জন্য "স্বাভাবিক" শব্দটি মূলধন করার মানদণ্ড standard

"নরমালাইজেশন / স্ট্যান্ডারিডাইজেশন" - পরিসংখ্যানগুলিতে, পরিবর্তনশীল উপায়কে সাধারণকরণের জন্য গড় বিয়োগ করে স্ট্যান্ডার্ড বিচ্যুতি দ্বারা ভাগ করা।

"স্ট্যান্ডার্ড বিচ্যুতি বনাম স্ট্যান্ডার্ড ত্রুটি" - স্ট্যান্ডার্ড বিচ্যুতি সাধারণত পুরো জনসংখ্যা ব্যবহার করে গণনা করা হয় যেখানে স্ট্যান্ডার্ড ত্রুটি নমুনা ব্যবহার করে গণনা করা হয়।


1
আমি সত্যিই সন্দেহ করি যে "স্ট্যান্ডার্ড ত্রুটি" একটি "সাধারণ [প্রচলিত, অ-পরিসংখ্যান]" শব্দ যা একটি বিশেষ পরিসংখ্যানগত অর্থ যা এই শব্দের অন্যান্য ব্যবহারের সাথে পৃথক (বাক্য, সত্যই)। "নরমালাইজেশন" এবং "স্ট্যান্ডার্ড বিচ্যুতি" এর জন্য ডিট্টো।
শুক্রবার

সম্ভবত "নরমালাইজেশন নয়," তবে "সাধারণ" একটি ভাল পয়েন্ট এবং তাই "মানদণ্ডীকরণ" হবে যা জাতীয় মান (যেমন, শিক্ষায় যেমন নো চাইল্ড বামের পরে মার্কিন যুক্তরাষ্ট্রে প্রতিষ্ঠিত) পরীক্ষার বিবরণ দিতেও ব্যবহৃত হয় বিহাইন্ড)। আমি সম্মত হই যে "স্ট্যান্ডার্ড বিচ্যুতি" বিভ্রান্তির কারণ হওয়ার সম্ভাবনা কম, যদিও "সাধারণভাবে বিচ্যুত হওয়া" নিজে থেকেই "বিচ্যুতি" নেতিবাচক অভিব্যক্তি বহন করার সম্ভাবনা বেশি (বিশেষত "বিবর্তন" এর প্রতিশব্দ হিসাবে)।
নিক স্টাওনার

এসডি এবং এসইএম পার্থক্য করার জন্য এখানে আরেকটি উপায় S একটি স্ট্যান্ডার্ড ত্রুটি কোনও গণিত মানের যথার্থতাকে মাপ দেয়।
হার্ভি মোটুলস্কি

@ হার্ভিমোটুলস্কি আমার মনে হয় সবচেয়ে ভাল উপায় হ'ল গ্রহাণু (অনিয়মিত আকার) সম্পর্কে চিন্তা করা। গ্রহাণু ভর এর কেন্দ্র কি? এটি সেই বিন্দু যা অন্য সমস্ত পয়েন্ট থেকে সামঞ্জস্যপূর্ণ। এটাই গড়। স্ট্যান্ডার্ড বিচ্যুতি কী? এটি কেন্দ্র থেকে প্রতিটি পয়েন্টের "গড়" দূরত্ব, আকারের একটি পরিমাপ। এসইএম কি? এটি আপনাকে জানায় যে গ্রহাণুর কেন্দ্রের অবস্থান সম্পর্কে আপনি কতটা নিশ্চিত।
ফ্লস্ক

আমি বলছি যে স্ট্যান্ডার্ড ত্রুটি হ'ল কিছুটা দুর্ভাগ্যজনকভাবে "নমুনা" ব্যবহার করে স্ট্যান্ডার্ড বিচ্যুতি গণনা করা হয়। এটি আমার জন্য নমুনা বৈকল্পিকের বর্গমূল হবে, যখন মান ত্রুটি হচ্ছে কোনও পরীক্ষার পরিসংখ্যানের স্ট্যান্ডার্ড বিচ্যুতি। এছাড়াও, উপরোক্ত পদগুলি থেকে কেবল "সাধারণ" সত্যই সাধারণ বলে মনে হয়। তবে আমি অনুমান করি যে এটি সাধারণ ...
অর্থ-

2

"প্যারামেট্রিক" বনাম "নন-প্যারাম্যাট্রিক": এমন বিভাগগুলির পরীক্ষাগুলির জন্য যা "নরমাল" বা "নরমাল নয়" ডেটা প্রয়োজন। প্যারামেট্রিক পরীক্ষাগুলি নন-প্যারাম্যাট্রিকের চেয়ে বেশি পছন্দ করা হয়।

সাধারণ পরীক্ষা: টি-পরীক্ষা (জোড়যুক্ত), মান-হুইটনি ইউ, আনোভা, অ্যান্ডারসন-ডার্লিং ইত্যাদি,

অন্যান্য পদগুলির মধ্যে "উল্লেখযোগ্য" অন্তর্ভুক্ত রয়েছে। ডেটা যদি আপনার হাইপোথিসিসটি বৈধ বা না হওয়ার নির্দেশ করে তবে এটি একটি পরিমাপ। আপনি যখন আপনার হাইপোথিসিসটিকে সম্ভাব্যতার একটি নির্দিষ্ট ডিগ্রিতে (সাধারণত 95%) পরীক্ষা করেন, তখন 0.05 এর চেয়ে কম একটি "পি-মান" ইঙ্গিত দেয় যে আপনি আপনার "নাল হাইপোথিসিস" অস্বীকার করবেন (যেমন ডেটা সেট আলাদা নয়) এবং আপনার " বিকল্প অনুমান "(যেমন তথ্য সেট পৃথক পৃথক)।


2

পরিসংখ্যানগুলিতে বিভক্ত হ'ল বিতরণকে অসম্পূর্ণ বলে।

সাধারণ ভাষায়, এমনকি বিজ্ঞানের মধ্যেও স্কিউডকে প্রায়শই ব্যবহার করা হয় (এবং ক্রমবর্ধমান?) যার অর্থ পরিসংখ্যানবিদরা সাধারণত পক্ষপাতদুষ্ট বলে অভিহিত হন, যেমন "গড়ের উচ্চতার জন্য ফলাফল এতগুলি বাস্কেটবল খেলোয়াড়কে অন্তর্ভুক্ত করে"।


2

অনুমান - পরিসংখ্যানগুলিতে এটি একটি গণনার ফলাফল। উদাহরণস্বরূপ, নমুনা গড়টি জনসংখ্যার গড়ের একটি হিসাব, ​​এবং একটি গড়ের আত্মবিশ্বাসের ব্যবধানটি জনসংখ্যার গড়ের একটি বিরতি অনুমান। এগুলি উভয়ই সঠিক গণনার ফলাফল। "অনুমান" একটি নমুনায় ডেটা থেকে জনসংখ্যা সম্পর্কে অনুমান করার চেষ্টা করার একটি সুনির্দিষ্ট সাধারণীকরণ।

সাধারণ ব্যবহারে, প্রাক্কলন শব্দের অর্থ একটি অবগত অনুমান বা হুং, বা আনুমানিক গণনার ফলাফল।


2

θXL(θ|X)=Pr(X|θ)

প্রতিনিধি - দৈনন্দিন এবং বৈজ্ঞানিক উভয় ক্ষেত্রেই অনেক সময় বিরোধী অর্থ হয়। Kruskal & Mosteller পড়ুন 1979a , 1979b , 1979c এবং 1980 । আমি জানি বেশিরভাগ পরিসংখ্যানবিদরা যদি নমুনা প্রতিনিধি হিসাবে পরিচিত সম্ভাব্যতার সাথে নমুনা তৈরি করেন তবে তা বিবেচনা করবেন; প্রান্তিক বিতরণ জনসংখ্যার অনুরূপ হলে আমি জানি বেশিরভাগ লাইপপোয়েলরা এটিকে প্রতিনিধি হিসাবে বিবেচনা করবেন।


2
  • নমুনা : যখন পরিসংখ্যানগুলিতে এটি কেসগুলির একটি সেটকে বোঝায় , অন্য অনেকগুলি শাখায় একটি নমুনা হ'ল একটি শারীরিক নমুনা । অবশ্যই, নমুনার আকারটিও অস্পষ্ট, পরিসংখ্যানের নমুনার ক্ষেত্রে বা সংখ্যার দৈহিক আকার (ভর, আয়তন, ...) কে উল্লেখ করে।

  • সংবেদনশীলতা : চিকিত্সা নির্ণয়ের জন্য রোগ দ্বারা চিহ্নিত রোগের ভগ্নাংশ যা পরীক্ষার মাধ্যমে স্বীকৃত। বিশ্লেষণাত্মক রসায়নে: ক্রমাঙ্কন কার্ভের opeাল (নীচে দেখুন)।

  • বৈশিষ্ট্য : চিকিত্সা নির্ণয়ের ক্ষেত্রে অ-রোগের ক্ষেত্রে ভগ্নাংশটি পরীক্ষা দ্বারা এটি সঠিকভাবে স্বীকৃত। বিশ্লেষণাত্মক রসায়নে কোনও ক্রস-সংবেদনশীলতা না থাকলে একটি পদ্ধতি নির্দিষ্ট।

  • ক্রমাঙ্কন : আসলে উইকি নিবন্ধে পরিসংখ্যানগুলির জন্য ইতিমধ্যে দুটি অর্থ তালিকাভুক্ত করা হয়েছে। রসায়ন এবং পদার্থবিজ্ঞানে বিপরীত প্রতিরোধের অর্থটি সাধারণ। বিভ্রান্তি দেখা দেয়, যদিও:

    • IcI=f(c)cc=f1(I)c=f(I)
      cI
    • "ক্যালিব্রেশন প্লট" (পরিসংখ্যান লোক) নামে পরিচিত সম্ভাবনার চেয়ে বেশি সম্ভাব্য সম্ভাবনার প্লট আমি দেখেছি seen বিশ্লেষণাত্মক রসায়নে, সম্পর্কিত ক্যালিব্রেশন প্লটটি পরিমাপক সংকেত (সাধারণত কিছু অন্য ইউনিট) এর সম্ভাবনা পূর্বাভাস দেওয়া হবে। সত্য নির্ভরশীল পরিবর্তনশীলের উপর পূর্বাভাসের প্লটটিকে সাধারণত পুনরুদ্ধার বাঁক বলে
  • বৈধকরণ সেট : এখানে আমি আবারও বিপরীতে থাকা সত্ত্বেও, বিভিন্ন পরিসংখ্যান-সম্পর্কিত ক্ষেত্রগুলির মধ্যে ইতিমধ্যে উত্থাপিত শর্তগুলির আমি একটি সম্ভাব্য বিভ্রান্তির ব্যবহারের দিকে দৃষ্টি আকর্ষণ করতে চাই । নেস্টেড / ডাবল বৈধতা বা অপ্টিমাইজেশন বনাম বৈধতা / পরীক্ষার প্রসঙ্গে, পরিভাষাটির একটি লাইন প্রশিক্ষণ - বৈধকরণ - পরীক্ষা বিভক্ত করে এবং হাইপারপ্যারামিটারগুলির অপ্টিমাইজেশনের জন্য "বৈধতা" সেটটি ব্যবহার করে।
    উদাহরণস্বরূপ পরিসংখ্যানগত শিক্ষার উপাদানসমূহ, পি। 222 তম এডি। :

    ... ডেটাसेटকে তিন ভাগে ভাগ করুন: একটি প্রশিক্ষণ সেট, একটি বৈধতা সেট এবং একটি পরীক্ষা সেট set প্রশিক্ষণ সেট মডেল ফিট করতে ব্যবহৃত হয়; বৈধতা সেটটি মডেল নির্বাচনের পূর্বাভাস ত্রুটির অনুমান করতে ব্যবহৃত হয়; চূড়ান্ত নির্বাচিত মডেলের সাধারণীকরণ ত্রুটির মূল্যায়নের জন্য পরীক্ষার সেটটি ব্যবহার করা হয়।

    বিপরীতে, উদাহরণস্বরূপ বিশ্লেষণী রসায়ন বৈধতা হল এমন প্রক্রিয়া যা প্রমাণ করে যে মডেল (আসলে চূড়ান্ত মডেলটির মূল্যায়ন একটি বিশ্লেষণাত্মক পদ্ধতির বৈধতার অংশ মাত্র) প্রয়োগের জন্য ভাল কাজ করে এবং এর কার্যকারিতা পরিমাপ করে, দেখুন দেখুন জন কে টেইলর: বিশ্লেষণাত্মক পদ্ধতিগুলির বৈধতা, বিশ্লেষণী রসায়ন 1983 55 (6), 600A-608A বা এফডিএর মতো প্রতিষ্ঠানের গাইডলাইন। এটি পরিভাষার অন্যান্য লাইনে "পরীক্ষা" হবে, যেখানে "বৈধতা" আসলে অপ্টিমাইজেশনের জন্য ব্যবহৃত হয়।
    গুরুত্বপূর্ণ পার্থক্যটি হ'ল, "অপ্টিমাইজেশন-বৈধতা" ফলাফলগুলি মডেলটি পরিবর্তন করতে (নির্বাচন করতে) ব্যবহার করতে হয়, অন্যদিকে বৈধ বিশ্লেষণ পদ্ধতিতে (ডেটা অ্যানালিটিক মডেল সহ) পরিবর্তিত হওয়া মানে আপনাকে পুনর্নির্মাণ করতে হবে (অর্থাৎ প্রমাণ করুন যে পদ্ধতিটি এখনও কাজ করে বলে মনে করা হয়)।


যদি আপনার রসায়নবিদদের সাথে কথা বলতে হয় তবে বিশ্লেষণাত্মক রসায়ন পরিভাষার একটি ভাল রেফারেন্স হ'ল ডানজার: বিশ্লেষণাত্মক রসায়ন - তাত্ত্বিক এবং মেট্রোলজিকাল ফান্ডামেন্টাল, ডিওআই 10.1007 / বি 103950

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.