আমরা কীভাবে 'পুনরুত্পাদনযোগ্য গবেষণা' সংজ্ঞায়িত করছি?


50

এটি এখন কয়েকটি প্রশ্নে উঠে এসেছে এবং আমি কিছু সম্পর্কে ভাবছিলাম। মূল ক্ষেত্রটি কি পুরো পুনরুত্পাদনযোগ্যতার দিকে চলে গেছে মূল ডেটা এবং প্রাসঙ্গিক কোডের প্রাপ্যতার উপর দৃষ্টি নিবদ্ধ করে?

আমাকে সর্বদা শেখানো হয়েছিল যে প্রজননযোগ্যতার মূলটি অগত্যা ছিল না, যেমনটি আমি উল্লেখ করেছি, রান ক্লিক করার ক্ষমতা এবং একই ফলাফল পাওয়ার ক্ষমতা। ডেটা-কোড-পদ্ধতির মাধ্যমে মনে হয় যে তথ্যটি সঠিক - যে তথ্য নিজেই সংগ্রহের ক্ষেত্রে কোনও ত্রুটি নেই (বৈজ্ঞানিক জালিয়াতির ক্ষেত্রে প্রায়শই মিথ্যা)। এটি একাধিক স্বতন্ত্র নমুনার সন্ধানের প্রতিরূপতার চেয়ে লক্ষ্য জনসংখ্যার একক নমুনায়ও মনোনিবেশ করে।

স্থলভাগ থেকে অধ্যয়নের সদৃশ হওয়ার পরিবর্তে বিশ্লেষণ পুনরায় চালাতে সক্ষম হওয়ার উপর কেন জোর দেওয়া হচ্ছে?

নীচের মন্তব্যে উল্লিখিত নিবন্ধটি এখানে উপলব্ধ ।


ভাল প্রশ্ন ! আমি আমার উত্তরে দোনহোর কাগজে একটি রেফারেন্স রেখেছি, কিন্তু প্রজননযোগ্য গবেষণা সম্পর্কে আপনার লিখিত উল্লেখগুলি কী?
রবিন গিরার্ড

রিটার এবং কিন্নির এপিডেমিওলজির এই মাসে ইস্যুতে একটি গবেষণাপত্র রয়েছে যা "গবেষণার উদ্দেশ্যগুলির জন্য ভাগ করে নেওয়ার গোপনীয় তথ্য: একটি প্রাইমার" রয়েছে যেখানে আপনি কেবল একটি .csv ফাইল টস করতে পারবেন না এমন পরিস্থিতিতে কোড এবং ডেটা কীভাবে উপলব্ধ করা যায়, এবং গোপনীয়তা অক্ষত থাকে তা নিশ্চিত করা দরকার।
ফমাইট

@ এপিগ্রাড, যেহেতু "এই মাস" কেটে গেছে, নিবন্ধটির লিঙ্ক থাকা সহায়ক হবে। সিভি এবং বিজ্ঞান / ডেটা বিশ্লেষণে অবদান রাখে এমন দুর্দান্ত প্রশ্ন জিজ্ঞাসার জন্য ধন্যবাদ!
গুং - মনিকা পুনরায়

@ গুং কোন নিবন্ধ এটি?
ফোমেট

@ এপিগ্রাড ঠিক উপরে, রিটার এবং কিন্নি। +1 বিটিডব্লু
গাং - মনিকা পুনরায়

উত্তর:


41

প্রজননযোগ্য বিশ্লেষণ হিসাবে "পুনরুত্পাদনযোগ্য গবেষণা"

পুনরুত্পাদনযোগ্য গবেষণা এমন একটি শব্দ যা কিছু গবেষণা ডোমেনগুলিতে এমন বিশ্লেষণ পরিচালনার জন্য বিশেষভাবে উল্লেখ করার জন্য ব্যবহৃত হয়

  • কোড কাঁচা ডেটা এবং মেটা-ডেটা প্রক্রিয়াজাত ডেটাতে রূপান্তর করে,
  • কোড ডেটা বিশ্লেষণ চালায় এবং
  • কোড একটি প্রতিবেদনে বিশ্লেষণ অন্তর্ভুক্ত করে।

যখন এই জাতীয় ডেটা এবং কোড ভাগ করা হয়, তখন এটি অন্যান্য গবেষকদের অনুমতি দেয়:

  • মূল গবেষকরা রিপোর্ট না করে বিশ্লেষণ সম্পাদন করুন
  • মূল গবেষকগণ দ্বারা সম্পাদিত বিশ্লেষণগুলির নির্ভুলতা পরীক্ষা করুন

সোয়েভের মতো প্রযুক্তিগুলির আলোচনায় এই ব্যবহারটি দেখা যায় । উদাহরণস্বরূপ, ফ্রেডরিচ লেশ সোয়েভের প্রসঙ্গে লিখেছেন যে "ডেটা বা বিশ্লেষণ পরিবর্তন হলে রিপোর্টটি স্বয়ংক্রিয়ভাবে আপডেট হতে পারে, যা সত্যিকার অর্থে প্রজননযোগ্য গবেষণার অনুমতি দেয়।" এটি প্রজননযোগ্য গবেষণা সম্পর্কিত সিআরএএন টাস্ক ভিউতেও দেখা যায় যা বলে যে "পুনরুত্পাদনযোগ্য গবেষণার লক্ষ্য হ'ল ডেটা বিশ্লেষণ এবং পরীক্ষামূলক উপাত্তগুলিতে সুনির্দিষ্ট নির্দেশনা বেঁধে রাখাই যাতে বৃত্তি পুনরায় তৈরি করা যায়, আরও ভাল বোঝা যায় এবং যাচাই করা যায়।"

"প্রজননযোগ্যতা" শব্দটির বিস্তৃত ব্যবহার

প্রজননযোগ্যতা বিজ্ঞানের একটি মৌলিক লক্ষ্য। এটা নতুন নয়। গবেষণা প্রতিবেদনে পদ্ধতি এবং ফলাফল বিভাগগুলি অন্তর্ভুক্ত করে যাতে কীভাবে ডেটা তৈরি করা হয়, প্রক্রিয়া করা হয় এবং বিশ্লেষণ করা হয় তার রূপরেখা উচিত। একটি সাধারণ নিয়মটি হ'ল প্রদত্ত বিবরণগুলি উপযুক্তভাবে উপযুক্ত গবেষককে প্রদত্ত তথ্যগুলি গ্রহণ করতে এবং অধ্যয়নের প্রতিলিপি তৈরি করতে সক্ষম হতে হবে।

পুনরুত্পাদনযোগ্যতা প্রতিলিপি এবং সাধারণীকরণের ধারণার সাথেও নিবিড়ভাবে সম্পর্কিত।

সুতরাং, "পুনরুত্পাদনযোগ্য গবেষণা" শব্দটি আক্ষরিক অর্থে গ্রহণ করা হয়েছিল, যেমন সোয়েভের মতো প্রযুক্তির ক্ষেত্রে প্রয়োগ করা হয়েছে, এটি একটি ভুলবৈজ্ঞানিক বিষয়, এটি প্রদত্ত যে এটি প্রচ্ছন্নতার চেয়ে প্রাসঙ্গিকতার প্রস্তাব দেয়। এছাড়াও, সোয়েভের মতো প্রযুক্তি যারা এমন প্রযুক্তি ব্যবহার করেননি তাদের কাছে উপস্থাপন করার সময়, যখন আমি প্রক্রিয়াটিকে "প্রজননযোগ্য গবেষণা" বলি তখন এই জাতীয় গবেষকরা প্রায়শই অবাক হন।

"পুনরুত্পাদনযোগ্য গবেষণা" এর চেয়ে ভাল শব্দ

সোভের মতো প্রসঙ্গে যেমন "পুনরুত্পাদনযোগ্য গবেষণা" কেবলমাত্র প্রজননযোগ্য গবেষণার একটি দিকের সাথে সম্পর্কিত, সম্ভবত একটি বিকল্প পদ গ্রহণ করা উচিত Give সম্ভাব্য বিকল্পগুলির মধ্যে রয়েছে:

উপরের সমস্ত শর্তাদি সোয়েভ-জাতীয় বিশ্লেষণগুলি যা প্রয়োগ করে তার আরও নিখুঁত প্রতিচ্ছবি। পুনরুত্পাদনযোগ্য বিশ্লেষণ সংক্ষিপ্ত এবং মিষ্টি। "ডেটা" বা "পরিসংখ্যান" যুক্ত করা বিষয়গুলিকে আরও স্পষ্ট করে, তবে শব্দটি দীর্ঘ এবং সংকীর্ণ উভয় করে তোলে। তদ্ব্যতীত, "পরিসংখ্যান" একটি সংকীর্ণ এবং একটি বিস্তৃত অর্থ আছে এবং অবশ্যই সংকীর্ণ অর্থের মধ্যে ডেটা প্রক্রিয়াকরণের বেশিরভাগ অংশ পরিসংখ্যানগত নয়। সুতরাং, "প্রজননযোগ্য বিশ্লেষণ" শব্দটি দ্বারা বোঝানো প্রস্থটির এর সুবিধাগুলি রয়েছে

এটি কেবল প্রজননযোগ্যতার কথা নয়

"পুনরুত্পাদনযোগ্য গবেষণা" শব্দটি সহ অন্যান্য অতিরিক্ত ইস্যুটি সোয়েভ-জাতীয় প্রযুক্তির লক্ষ্য কেবল "পুনরুত্পাদনযোগ্যতা" নয়। বেশ কয়েকটি আন্তঃসম্পর্কিত লক্ষ্য রয়েছে:

  • reproducibility
    • একই ফলাফলগুলি দিয়ে কাঁচা ডেটা চূড়ান্ত প্রতিবেদনে রূপান্তর করতে বিশ্লেষণগুলি সহজেই আবার চালানো যেতে পারে?
  • শুদ্ধি
    • ডেটা বিশ্লেষণ কী গবেষকের উদ্দেশ্যগুলির সাথে সামঞ্জস্যপূর্ণ?
    • গবেষকের উদ্দেশ্য কি সঠিক?
  • অকপটতা
    • স্বচ্ছতা, জবাবদিহিতা
      • অন্যরা সম্পাদিত বিশ্লেষণের নির্ভুলতা পরীক্ষা করতে এবং যাচাই করতে পারে?
    • এক্সটেনসিবিলিটি, পরিবর্তনশীলতা if
      • অন্যেরা নতুন গবেষণা কাজ তৈরি করতে ডেটা, বিশ্লেষণ বা উভয়ই সংশোধন, প্রসার, পুনঃব্যবহার এবং ম্যাস করতে পারে?

একটি যুক্তি রয়েছে যে প্রজননযোগ্য বিশ্লেষণটি সঠিক বিশ্লেষণগুলি উত্সাহিত করবে, কারণ বিশ্লেষণগুলির একটি লিখিত রেকর্ড রয়েছে যা পরীক্ষা করা যায়। তদ্ব্যতীত যদি ডেটা এবং কোড ভাগ করা হয় তবে এটি জবাবদিহিতা তৈরি করে যা গবেষকদের তাদের বিশ্লেষণগুলি পরীক্ষা করতে প্ররোচিত করে এবং অন্যান্য গবেষকদের সংশোধনগুলি নোট করতে সক্ষম করে।

পুনরুত্পাদনযোগ্য বিশ্লেষণ ওপেন গবেষণার আশেপাশের ধারণাগুলির সাথে ঘনিষ্ঠভাবে ফিট করে। অবশ্যই, একজন গবেষক সোয়েভ-জাতীয় প্রযুক্তি কেবল নিজের জন্য ব্যবহার করতে পারেন। উন্মুক্ত গবেষণা নীতিগুলি বৃহত্তর পুনরায় ব্যবহার এবং জবাবদিহিতা সক্ষম করতে ডেটা এবং বিশ্লেষণ কোড ভাগ করে নেওয়ার জন্য উত্সাহ দেয়।

এটি সত্যই "প্রজননযোগ্য" শব্দটির ব্যবহারের সমালোচনা নয়। বরং এটি কেবল হাইলাইট করে যে সোয়েভ-জাতীয় প্রযুক্তি ব্যবহার করা প্রয়োজনীয় তবে উন্মুক্ত বৈজ্ঞানিক গবেষণার লক্ষ্য অর্জনের পক্ষে পর্যাপ্ত নয়।


2
(+1) দুর্দান্ত উত্তর, খুব ভাল পয়েন্ট। আমি সম্মত হই যে সোয়েভ এবং বন্ধুরা প্রজননযোগ্য বিশ্লেষণ যা করে তা আমাদের কল করা উচিত ।
এনআরএইচ

1
(+1) সুন্দর ওভারভিউ। তবে আমি লক্ষ করব যে 'কাঁচা তথ্য' শব্দটি অস্পষ্ট এবং বিভ্রান্তিমূলক হতে পারে - সাধারণত মেশিনে getোকানোর জন্য যদি তথ্যটিকে 'কাঁচা' বলে মনে করা হয় তার আগে প্রক্রিয়া করা হয়।
ডেভিড লেবাউর

@ জারোমি অ্যাংলিম এটি একটি দুর্দান্ত উত্তর, এবং "পুনরুত্পাদনযোগ্য গবেষণা" এর শব্দার্থ সম্পর্কে আমাকে কীভাবে উদ্বুদ্ধ করেছে তার মূল বিষয়টি - এটি কেবলমাত্র ডেটা জেনারেশন প্রক্রিয়া সম্পূর্ণ হওয়ার পরে ঘটে যাওয়া একটি প্রক্রিয়াটির বর্ণনা দিতে ব্যবহৃত হয়। শব্দটি হিসাবে আমি "পুনঃ প্রজননযোগ্য বিশ্লেষণ" ধারণাটি পছন্দ করি।
ফমাইট

+1 @ জেরোমি অ্যাংলিম, আমি সম্প্রতি একজন লেখকের সাথে যোগাযোগ করেছিলাম সে দেখার জন্য যে সে / সে Rযে প্রকাশনাতে ব্যবহৃত কোডটি ভাগ করে নিতে পারে , লেখক তা করতে অস্বীকার করেছিলেন এবং আমাকে প্রকাশের দিকে ইঙ্গিত করেছিলেন। আপনার মতে, আপনি কি এটিকে প্রজননযোগ্য গবেষণার জন্য উন্মুক্ততার অভাব হিসাবে বিবেচনা করবেন বা জার্নালে পদ্ধতিটি সুস্পষ্ট করা এবং অন্যান্য প্রোগ্রামকে কোডটি নিজেরাই দেওয়া দেওয়া যথেষ্ট? ধন্যবাদ
পূর্বাভাসকারী

11

একটি কার্যকর-থেকে-কার্যকর করতে কার্যকর আকারে বিশ্লেষণের জন্য ডেটা এবং কোড অ্যাক্সেস থাকা পুনরুত্পাদনযোগ্য গবেষণা না করে সাইন কোয়া a একবার আপনি যাচাই করে নিলেন যে বিশ্লেষণটি কাজ করে, আপনি নিজের কোড / ডেটা এমন জায়গায় রাখতে পারেন যেখানে আপনি মূল লেখকের সন্দেহ করছেন। আমি বলব যে আমি পরিসংখ্যান-সম্বলিত বেশিরভাগ কাগজপত্র পড়েছি পদ্ধতির অন্তত একটি অংশ রয়েছে যা অস্পষ্ট। এই বিশ্লেষণগুলি পুনরুত্পাদন করার আমার প্রচেষ্টা প্রায়শই ব্যর্থ হয় (এবং সর্বদা সময় সাপেক্ষ) তবে এটি জালিয়াতি, মানুষের ত্রুটি বা (সম্ভবত আরও অনেক ক্ষেত্রে) লেখকের তুলনায় আমার এই অস্পষ্টতাগুলি সমাধান করার কারণে হয়েছে কিনা তা বলা খুব কঠিন। সুতরাং, কোনও কাগজের জন্য ডেটা + কোড থাকা কোনও গ্যারান্টি দেয় না যে এর সিদ্ধান্তগুলি সত্য are তবে এটি সমালোচনা করা বা তাদের প্রসারিত করা আরও সহজ করে তোলে।

এছাড়াও, "প্রজননযোগ্য গবেষণা" ডিগ্রির একটি বিষয়। সুতরাং প্রজননযোগ্য গবেষণা আন্দোলনকে উত্সাহজনক গবেষণা হিসাবে দেখা যেতে পারে যা আদর্শের চেয়ে "আরও প্রজননযোগ্য", গবেষণাটি কিছুটা ন্যূনতম প্রান্তিকের দাবি পূরণের চেয়ে নয়। আমি অনুমান করতে পারি যে "ডেটা এবং কোড প্রকাশ করুন" এখন প্রচলিত কারণ এটি তুলনামূলক সহজ এবং হুমকিসহ পদক্ষেপ।


9

সবকিছু পুনরায় চালাতে সক্ষম হওয়া পুনরুত্পাদনযোগ্য গবেষণার একটি সূচনা পয়েন্ট। এটি দেখানোর অনুমতি দেয় যে আপনি আসলে একই পদ্ধতি ব্যবহার করছেন। এর পরে -আর এরপরেই - আপনি আপনার পিয়ারের গবেষণা চালিয়ে যেতে পারেন। অন্য কথায়, কঠোর প্রজননযোগ্যতাটি এমন সময় হিসাবে অনুধাবন করা উচিত নয় যেখানে গবেষণা এগিয়ে চলেছে, তবে একটি যুগান্তকারী হিসাবে , একটি sensক্যমত্য , এমন একটি বিষয় যার উপরে মানুষ সম্মত হয়। আরও কি মৌলিক নয়?

এছাড়াও, ডোনহোর আলোচনা অনুসারে (বিভাগ 2 পড়ুন "কেলেঙ্কারী") প্রজননযোগ্য গবেষণার লক্ষ্য প্রদত্ত কোডের দৃ .়তা পরীক্ষা করাও to কোডটি খেলে প্রথমে স্লিগথ পরিবর্তন করে যা কাগজে করা হয়নি (কারণ আমরা ৩০ টি চিত্র সহ কাগজপত্র চাই না ...)। আমি মনে করি সাহিত্যে পুনরুত্পাদনযোগ্য গবেষণার ধারণায় দৃ rob় শক্তিশালী ল্যান্ডমার্ক থাকার ধারণা রয়েছে। এটি প্রায় আরও এগিয়ে যাওয়ার ধারণা ধারণ করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.