আপনার মালিকানাধীন লাইব্রেরিগুলির প্রয়োজন হলে পুনরুত্পাদনযোগ্য গবেষণা করার সর্বোত্তম উপায় কী?


19

গণনায় পুনরুত্পাদনযোগ্য গবেষণার লক্ষ্য হ'ল একটি গণ্য গবেষণামূলক কাগজে ফলাফল উত্পন্ন করার জন্য প্রয়োজনীয় কোডটি অন্যান্য গবেষকদের কাছে উপলভ্য করা যাতে তারা এই কাগজে ফলাফলগুলি পুনরুত্পাদন করার জন্য এই কোডটি চালাতে পারে। আমি আমার সমস্ত গবেষণা পুনরুত্পাদনযোগ্য করে তুলতে চাই, তবে আমি কিছুটা ছিনতাই করতে চলেছি: একটি স্বতন্ত্র গ্রন্থাগার ( চিএকিন- II ; লাইসেন্সের শর্তগুলি অস্পষ্ট)।

ওপেন সোর্স সংস্করণগুলির সাথে এই সফ্টওয়্যার উপাদানগুলিকে প্রতিস্থাপন করা অতিরিক্ত সময় সাশ্রয়ী হবে। CHEMKIN দ্বিতীয় জন্য একটি ওপেন সোর্স প্রতিস্থাপন নামক বিদ্যমান Cantera কিন্তু Cantera সি হল ++ যেহেতু CHEMKIN দ্বিতীয় ফোরট্রান 77 হয় এটা Cantera কোডের যথেষ্ট পরিবর্তন তাই প্রচেষ্টার অনেক করতে হবে এটি স্বয়ংক্রিয় দ্বারা প্রক্রিয়াকৃত করা যায়নি সি ++ এর জন্য পার্থক্য সরঞ্জাম tools

আমার এই মালিকানাধীন প্যাকেজগুলির প্রয়োজন রয়েছে তা বিবেচনা করে, গবেষকদের চেমকিন -২ এ অ্যাক্সেস নাও থাকতে পারে বলে ধরে নিয়ে আমার গবেষণাকে যথাসম্ভব প্রজননযোগ্য করে তোলার সবচেয়ে ভাল উপায় কী? যেহেতু DAEPACK একটি উত্স থেকে উত্স অনুবাদক, আমার অগত্যা ডিএইপ্যাক বিতরণ করার প্রয়োজন নেই; আমি এর আউটপুট অন্তর্ভুক্ত করতে সক্ষম হতে পারি, যা ফোর্ত্রান উত্স ফাইল যা ডেরিভেটিভস গণনা করে।

আরও সাধারণভাবে, যদি আপনার নিজের কাজের মালিকানাধীন সফ্টওয়্যার প্রয়োজন হয় এবং মালিকানাধীন সফ্টওয়্যারটি ব্যাপকভাবে উপলব্ধ না হয় (অর্থাত্ ম্যাটল্যাব, ম্যাথেলমেটিকা ​​ইত্যাদি নয়) তবে কীভাবে আপনি আপনার কাজকে পুনরায় উত্পাদনযোগ্য করে তুলবেন?


DAEPACK চেমকিন -২ উত্স কোডটি সংশোধন করে, বা এটি কেবল অভ্যন্তরীণভাবে চেমকিন -২ ব্যবহার করে?
ড্যান

DAEPACK CHEMKIN-II উত্স কোডটি পার্স করে এবং ফরট্রান উত্স ফাইল উত্পন্ন করে যা সাবরুটিনগুলি ধারণ করে যা জ্যাকবীয় ম্যাট্রিক্স, স্পারসিটি নিদর্শন এবং ব্যবধানের এক্সটেনশানগুলি গণনা করে। এটি উত্স কোডটি পরিবর্তন করে না; এটি সেই অর্থে সংকলকের মতো।
জিফ অক্সবেরি

যদি ডিএইপ্যাকের আউটপুটটি চেমকিন -২ উত্সটি সংশোধন করা হয়, তবে কেন আপনি এটি বিতরণ করতে পারবেন?
ড্যান

এটি কাজ থেকে প্রাপ্ত, তবে উত্সটি সংশোধন করা হয়েছে কিনা তা আমার কাছে স্পষ্ট নয়। পরিবর্তনশীল নামগুলি অনুলিপি করা হয়, তবে সেই যুক্তি অনুসারে, আমি লিখেছি এমন অনেকগুলি প্রোগ্রাম হ'ল "পরিবর্তিত চেমকিন -২ উত্স"। আমাকে সেই পয়েন্টটি পরীক্ষা করতে হবে
জিফ অক্সবেরি

চেমকিন -২ লাইসেন্স আপনাকে অশোধিত উত্সকে অবাধে বিতরণ করার অনুমতি দেয় এবং আপনি কীভাবে পরিবর্তনগুলি বন্টন করবেন তা সীমাবদ্ধ করে? আমি অনলাইনে এর লাইসেন্সের একটি অনুলিপি খুঁজে পাচ্ছি না।
ড্যান

উত্তর:


13

আমি মনে করি না যে "পুনরুত্পাদনযোগ্য গবেষণা" এর সংজ্ঞাটির প্রয়োজনীয়তা রয়েছে যে লেখক প্রাপ্ত ফলাফলগুলি পুনরুত্পাদন করার জন্য প্রয়োজনীয় সমস্ত সরঞ্জাম বিনামূল্যে প্রদান করে। যদি এর কিছু মালিকানাধীন হয় তবে প্রয়োজনীয় সফ্টওয়্যার অর্জনের ব্যবস্থা করা লেখকের জন্য নয়, ভবিষ্যতের ব্যবহারকারীর উপর নির্ভরশীল। (আপনার ফলাফল পুনরুত্পাদন করার জন্য আপনি অন্য কারও জন্য সফ্টওয়্যারটি তৈরি করার আশা করবেন না, তাই না?) আপনার মালিকানাধীন সফ্টওয়্যারটি কোনটি প্রকাশ করেছে তা নির্দিষ্ট করে দেওয়ার বিষয়ে আপনার অবশ্যই দায়বদ্ধ থাকবে তবে এটি আশা করা অযৌক্তিক আপনি যদি একটি গবেষণা কোড ওপেন সোর্স সফ্টওয়্যার সঙ্গে সামঞ্জস্যপূর্ণ করতে মাত্র কারণ এটি ওপেন সোর্স নয়।

[একদিকে যেমন, সফ্টওয়্যারটির কিছু পুনরায় প্রজননযোগ্যতা সম্পর্কে কথা বলা ছাড়াও যখন এর কিছু মালিকানাধীন হয় তবে আমি মনে করি প্রথমে আরও একটি মৌলিক প্রশ্নটি সমাধান করা দরকার: সফ্টওয়্যারটি কি বিভিন্ন ইনস্টলেশন জুড়ে প্রজননযোগ্য ফলাফল দেয় (উদাহরণস্বরূপ, বিভিন্ন স্থাপত্যের জন্য এবং সংকলক সংস্করণ? উদাহরণস্বরূপ, বিভিন্ন প্রসেসরের পৃথক সংখ্যার ফলস্বরূপ রাউন্ডঅফ ত্রুটি এবং বরাদ্দের পার্থক্যের অর্থ অনেকগুলি আণবিক সিমুলেশন গণনাগুলি বরাদ্দে অন্তর্ভুক্ত প্রসেসরের সংখ্যা পরিবর্তন করে বিভিন্ন ফলাফল দেয় ((পরিসংখ্যানগত গড়গুলি একই আকারে পৌঁছানো উচিত) রাখুন, তবে ট্র্যাজিকোলজরিগুলি সম্ভবত খুব আলাদা হবে))]


2
আমি অবশ্যই একমত যে প্রজননযোগ্য গবেষণাটি লেখককে বিনামূল্যে সমস্ত প্রয়োজনীয় সফ্টওয়্যার সরবরাহ করতে বাধ্য করে না। তবে, এমন সফ্টওয়্যার যা সর্বজনীনভাবে পাওয়া যায় না তা একটি সমস্যা তৈরি করে। প্রজননযোগ্য গবেষণা আন্দোলনের অন্যতম লক্ষ্য হ'ল সম্প্রদায়ের মধ্যে এই সমস্যা সম্পর্কে সচেতনতা তৈরি করতে সহায়তা করা, লোকেরা কেবল প্রজননযোগ্যতার স্বার্থে গবেষণা সহায়তা জনসাধারণকে উত্সাহিত করে এমনকি তারা এর জন্য কোনও সহায়তা দেওয়ার পরিকল্পনা না করে।
খিনসন

2
বাণিজ্যিকভাবে বিক্রি কোড এখনও উপলব্ধ কোড। যদি আর লাইসেন্স নেওয়া সম্ভব না হয় তবে অবশ্যই এটি আলাদা বিষয়। তবে কোনও কোডের মূল লেখককে কেবল পুনরুত্পাদনযোগ্যতার জন্য অন্য লাইব্রেরি সংযুক্ত করতে একটি কোড পুনরায় লেখার প্রয়োজন হয় না। (বৃহত্তর কোডের কার্যকারিতা এবং ব্যবহারের জন্য একটি যুক্তি রয়েছে, তবে পুনরুত্পাদনযোগ্যতা যুক্তি প্রথম দিকের প্রয়োজনীয় নয় - যদিও এটি যথেষ্ট হিসাবে যুক্তিযুক্ত হতে পারে।)
আইজমেল

4

আমি কখনই এই মতামতের মধ্যে ছিলাম না যে "পুনরুত্পাদনযোগ্য গবেষণা" এর অর্থ আপনার সহপাঠ পাঠক এবং বিজ্ঞানীদের কেবলমাত্র আপনার ফলাফলগুলি সম্পূর্ণরূপে পুনরুত্পাদন করতে "রান" (বা সংকলন বা আপনার কী আছে) ক্লিক করতে হবে। যদি অন্য কিছু না হয় তবে এটি যে কোনও ব্যক্তি মালিকানা সংক্রান্ত পরিসংখ্যান বিশ্লেষণ প্যাকেজ ব্যবহার করে বা তাদের ফ্যাশন থেকে বেরিয়ে আসা প্ল্যাটফর্ম বা ভাষার জন্য তৈরি করা হলে জিনিসগুলিকে "অপ্রতিরোধ্য" করে তুলবে তার গবেষণা নিহত করবে। বা এই বিষয়টির জন্য, কেউ কি আপনার কোডটি পুনরায় উত্পাদন করতে চায় তবে আপনি যে ভাষাটি ব্যবহার করেন তা বোঝে / ব্যবহার করে না।

ক্রসভিলেটেডের বিষয়টিতে একই আলোচনা ছিল - "পুনরুত্পাদনযোগ্য" এর অর্থ আপনি কীভাবে আমার ডেটাতে আমার বিশ্লেষণের প্রতিলিপি তৈরি করতে পারেন, বা পরীক্ষাটি নিজেই স্ক্র্যাচ থেকে পুনরায় চালু করা যেতে পারে এবং নিশ্চিতকরণমূলক ফলাফল সরবরাহ করতে পারে। লিঙ্কটি এখানে রয়েছে: /stats/14999/how-are-we-defining-reproducible-research

আমি মনে করি যে আরও গুরুত্বপূর্ণ উপাদানটি হ'ল পর্যায়ে আপনি কী করেছিলেন যেখানে এটি যথেষ্ট আগ্রহী এমন ব্যক্তির দ্বারা পুনরায় সংশোধন করা যেতে পারে , এবং যদি বাণিজ্যিক সরঞ্জামগুলি ব্যবহার করা হত তবে সেই সরঞ্জামগুলি উল্লেখ করা হয়েছে। কারণ এটি পরীক্ষার প্রতিরূপকরণ এবং কোড ত্রুটির জন্য ডাবল-চেক উভয়ের স্বার্থকে পরিবেশন করে।


2

আপনার ক্ষেত্রে, আপনার ব্যবহার করা কোডের যে কোনও একটি বিতরণ করার অধিকার এমনকি আপনার কাছে নাও থাকতে পারে, তবে অ্যালগরিদমের একটি খুব গভীরতার বিবরণ আপনার পক্ষে সবচেয়ে ভাল হতে পারে। আপনার কোডটি কতটা জটিল তার উপর নির্ভর করে যে কেউ তাদের কাছে যা কিছু সরঞ্জাম উপলব্ধ রয়েছে তা থেকে তাদের আগ্রহের বিষয়গুলি পুনরুত্পাদন করতে সক্ষম হতে পারে।

অন্যথায়, আশেপাশে জিজ্ঞাসা করুন এবং আপনার কতটা কাজ আপনাকে মুক্তি দেওয়ার অনুমতি দিয়েছে তা দেখুন এবং তারপরে এটি ছেড়ে দিন।


এই চ্যাট কথোপকথন থেকে অনেক কিছুই আসে ।
ড্যান

1

পুনরুত্পাদনযোগ্য গবেষণা করার সর্বোত্তম উপায় হ'ল নির্দিষ্ট প্ল্যাটফর্মের নির্দিষ্ট কোডগুলির মতো স্বল্পস্থায়ী কোনও কিছুর উপর নির্ভর না করা। গতকাল আমরা খোঁচা কার্ডগুলিতে কম্পিউটিং করছিলাম, আজ সিলিকনে ইলেকট্রনগুলিতে, আগামীকাল কোয়ান্টাম ডটে প্রোটিন বা এমনকি জীবন্ত কোষগুলির লেজারে থাকতে পারে এবং পরের সপ্তাহে কী হবে কে জানে।

পুনরুত্পাদনযোগ্য গবেষণার উচিত এর ধারণাগুলি এবং ধারণাগুলি পরিষ্কার করা এবং গবেষণার ফলাফলগুলি পুনরুত্পাদন করার জন্য একটি পূর্বশর্ত হিসাবে হার্ডওয়্যার বা সফ্টওয়্যারের মতো বিদ্যমান উপলব্ধ সরঞ্জামগুলির প্রচার করা উচিত নয়। ব্যবহৃত অ্যালগরিদমগুলি একটি পরিষ্কার ইউনিভার্সাল আকারে বিশদ হওয়া উচিত; সুনির্দিষ্ট হার্ডওয়্যার, সংকলক বা সফ্টওয়্যার প্যাকেজের বর্তমান সংস্করণটি কেবল গবেষণা ফলাফলগুলি প্রদর্শনের জন্য একটি সরঞ্জাম হিসাবে ব্যবহার করা যেতে পারে।


আমি মনে করি আমাদের উভয় প্রয়োজন - মানবিক বোঝার জন্য ধারণা এবং ধারণা এবং দীর্ঘমেয়াদী ব্যাখ্যাযোগ্যতা এবং স্বল্পমেয়াদী যাচাইয়ের কোড।
খিনসেন

1

উত্পন্ন ফোর্টরান কোড প্রকাশ করা আপনার ক্ষেত্রে খুব ভাল সমাধান বলে মনে হচ্ছে।

একটি সাধারণ নিয়ম হিসাবে, আমি মনে করি যে অপ্রকাশিত সফ্টওয়্যারটির ব্যবহার পুনরুত্পাদনযোগ্য গবেষণার লক্ষ্যগুলির সাথে সামঞ্জস্যপূর্ণ নয়। এটি পুনরুত্পাদনযোগ্য গবেষণাটিকে যেহেতু কাউকে তাত্ক্ষণিকভাবে প্রয়োগ করার প্রয়োজন হতে পারে তার চেয়ে দীর্ঘমেয়াদী লক্ষ্য হিসাবে দেখার কারণ of


1

আমি এলসেভিয়ারের হয়ে কাজ করি। লেখকরা তাদের নিবন্ধের সাথে এক্সিকিউটেবল কোডের খণ্ড প্রকাশ করতে সক্ষম করার জন্য আমার সংস্থা জার্নাল ইস্যুতে কোলাজ ফ্রেমওয়ার্ক (এক্সিকিউটেবল পেপার গ্র্যান্ড চ্যালেঞ্জের প্রতিক্রিয়া হিসাবে বিকশিত) ব্যবহার শুরু করেছে। এই বৈশিষ্ট্যটি পাঠকদের নিবন্ধে রিপোর্টিত ফলাফলগুলি পুনরুত্পাদন করা এবং তাদের নিজস্ব গবেষণার জন্য প্রকাশিত উপাদান পুনরায় ব্যবহার করা সহজ করে তোলে। কোলাজ ওপেন সোর্স সফ্টওয়্যার ছাড়াও বিভিন্ন ধরণের মালিকানাধীন সফ্টওয়্যার সমর্থন করে; আরও তথ্যের তথ্য ভিডিও খুঁজে পাওয়া যেতে পারে এখানে এবং কোলাজ অথারিং পরিবেশ ওয়েবসাইট

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.