একাডেমিক কাগজগুলিতে কোড


34

আমার একাডেমিক কেরিয়ারে, আমি বিভিন্ন কম্পিউটার বিজ্ঞানের বিষয়ে বেশ কয়েকটি একাডেমিক গবেষণাপত্র পড়েছি। যার মধ্যে একটি বাস্তবায়ন এবং সেই প্রয়োগের কিছু মূল্যায়ন জড়িত, তবুও আমি পেয়েছি যে তাদের মধ্যে খুব কম লোকই তাদের ব্যবহৃত কোডটি প্রকাশ করে।

আমার কাছে, বাস্তব বাস্তবায়ন সহ সুবিধাগুলি উল্লেখযোগ্য হবে, যথা:

  • বিশ্বাস বা পুনরুত্পাদনযোগ্যতার প্রসার (কেবল এটি নিজে পরীক্ষা করুন!)
  • অস্পষ্টতার স্পষ্টকরণ (বিশেষত বিদেশী ভাষাবিদদের লেখা কাগজগুলির জন্য)
  • অ্যাপ্লিকেশনগুলির জন্য কোডের পুনরায় ব্যবহার

তাহলে কেন এত কম কাগজপত্র আসলে কোনও কোড অন্তর্ভুক্ত করে?

আমি মনে করি কাগজের পিছনে সংগঠনের উদ্দেশ্য হতে পারে তাদের নিজস্ব প্রয়োগগুলিতে প্রয়োগটি কাজে লাগানো, এবং এইভাবে এটি প্রকাশ করতে চাইবে না, তবে যদি এটি হয় তবে কেন কাগজটি লিখবেন?


14
তাহলে কেন এত কম কাগজপত্র আসলে কোনও কোড অন্তর্ভুক্ত করে? কারণ বাস্তবায়নটি গোপন করার কোনও ভাল কারণ না থাকলেও পর্যালোচকরা কোনও কারণে এটি সহ্য করে। আমরা পর্যালোচক, আমরা এটি পরিবর্তন করতে পারি।
Jukka Suomela

14
আমি মনে করি এটি অবশ্যই সাবফিল্ডের দ্বারা পৃথক হতে হবে। প্রায় সমস্ত থিওরি বি স্টাফ যার সাথে আমি পরিচিত (এবং বিশেষত হাস্কেল, আগদা, এবং কখনও কখনও কোক-রিলেটেড) প্রকাশিত কোড অন্তর্ভুক্ত করে, কখনও কখনও পরিশিষ্ট হিসাবে বা আরও ভাল কাগজের মধ্যে অন্তর্ভুক্ত থাকে। শুরু করার জন্য আইসিএফপি থেকে বেশ কয়েকটি কাগজপত্র সাক্ষরতার প্রোগ্রাম হিসাবে লেখা হয় এবং পুরোপুরি তাদের উত্সটি লেখকগণ দ্বারা প্রকাশিত হয়। পরিবর্তে এগুলির একটি ন্যায্য পরিমাণ ফলাফল বিতরণের জন্য নিষ্ক্রিয় গ্রন্থাগার তৈরি করেছে। বাকি কাগজপত্রগুলির মধ্যে, একটি ন্যায্য পরিমাণের সাথে কখনই কোডটি শুরু হয় না।
sclv

8
গবেষণার ফলাফলগুলি খোলা (এবং বিনামূল্যে) হওয়া উচিত, এবং তাই কোড করা উচিত। কিছু সংজ্ঞা অনুসারে, বিজ্ঞান তখনই ঘটে যখন হাইপোথেসিগুলি মিথ্যাযোগ্য এবং পরীক্ষাগুলি পুনরুত্পাদনযোগ্য, তাই আপনি যুক্তি দিতে পারেন যে প্রকাশিত নয় এমন কোডের ভিত্তিতে প্রকাশনাগুলি বৈজ্ঞানিক কাজ নয়।
রাফেল

4
@ রাফেল একই কোড প্রকাশ করা কেবল পুনরুত্পাদনযোগ্যতা নয়, পুনরাবৃত্তিযোগ্যতা প্রতিষ্ঠায় সহায়তা করবে। ঠিক একই পরীক্ষায় হুবহু একই কোড চালানো খুব কমই স্বতন্ত্র। বিজ্ঞানের পুনরুত্পাদনযোগ্যতা প্রয়োজন, পুনরাবৃত্তিযোগ্যতা নয়।
মার্ক রিটব্ল্যাট

2
আমি এমন ফলাফলের কথা ভাবছিলাম যা কোডের ফলাফলগুলির পরিবর্তে বৈশিষ্ট্যগুলির বিষয়ে কথা বলে (যা ক্ষেত্রে আপনি অবশ্যই সঠিক)। বলুন, লেখক উপস্থাপিত অ্যালগরিদমের কিছু বাস্তবায়নের জন্য পরীক্ষা-নিরীক্ষা করেন এবং গ্রাফগুলি পরীক্ষা করে রানটাইমগুলির তুলনা করেন (তারা এটিকে "অ্যালগরিদম ইঞ্জিনিয়ারিং" বলে ডাকে)। এখানে কোড পুনরুত্পাদনযোগ্যতা সরবরাহ করে।
রাফেল

উত্তর:


17

এখানে ডেভিড ডোনহো এবং জোনাথন বুকহাইটের একটি সুস্পষ্ট যুক্তিযুক্ত নিবন্ধটি আমি গ্রেড স্কুলে পড়েছিলাম যা তরঙ্গলেখ গবেষকদের দৃষ্টিকোণ থেকে ঠিক এই বিষয়টিকে স্পর্শ করে:

"ওয়েভল্যাব এবং পুনরুত্পাদনযোগ্য গবেষণা"

তাদের ধারণাগুলি আরও উচ্চাভিলাষী ছিল, সুবিধামত মাতলাব প্যাকেজে তাদের সমস্ত কাগজপত্রের পুনরুত্পাদন করার কোড সরবরাহ করা।

আমি তাদের ধারণাটি সত্যিই পছন্দ করি তবে আমি মনে করি বিষয়গুলি সুস্পষ্ট।

(1) এটি অতিরিক্ত কাজ (কোড সাফ করা, কমপক্ষে একটি প্রাথমিক ব্যবহারকারী ইন্টারফেস তৈরি করা, কিছু ডকুমেন্টেশন লেখা, লোকেরা অনিবার্যভাবে সমস্যার মধ্যে পড়লে কিছু সহায়তা সরবরাহ করে)

(২) বেশিরভাগ সম্মেলন / পর্যালোচক দ্বারা এটি সত্যই প্রয়োজন / প্রত্যাশিত নয়

তবে আমি সাহায্য করতে পারছি না তবে অনুভব করতে পারি না যে কোনও প্রকাশনাতে ব্যবহৃত কোড এবং ডেটা ব্যবহারযোগ্য ফর্ম্যাটে সর্বজনীনভাবে উপলব্ধ করার প্রত্যাশা থাকলে সিএস গবেষণা সম্প্রদায়টি উপকৃত হবে। আমি স্বীকার করি যে জড়িত কাজের পরিমাণ ব্যবস্থাপনামূলক হলেও এমন কি আমি নিজেই এটি করি নি। আমি মনে করি যখন কোনও বাহ্যিক চাপ না থাকে তখন নিজেকে অতিরিক্ত পরিশ্রমের মধ্যে ফেলে রাখা কেবল কঠিন hard


7
আমি মনে করি কমপক্ষে ওয়েবসাইটগুলিতে (ক) সিউডোকোড বা (খ) কোডের একটি প্রত্যাশা সিএস গবেষণা সম্প্রদায়ের পক্ষে খুব কার্যকর হবে। সমস্ত গবেষণা কোডের উচ্চ ব্যবহারযোগ্যতা নেই এবং বগি কোডটি উপলব্ধ করা ভাল জিনিস হবে কিনা তা আমি নিশ্চিত নই।
পিটার শোর

1
আমি কাগজের লেখকদের সাথে কথা বলেছি যারা অনুরূপ কারণে তাদের কোড প্রকাশ করেনি - এটি যে অবস্থায় রয়েছে তাতে তারা দোষী বোধ করবে যদি কেউ এটি সহ কিছু করার চেষ্টা করে তবে তারা দোষী বোধ করবে।
sclv

6
কোড ভাল, পরিষ্কার বা পুনরায় ব্যবহারযোগ্য হতে হবে না। তবে এটি 'বিজ্ঞান' হিসাবে বিবেচনা করার জন্য পুনরুত্পাদনযোগ্য হওয়া দরকার। প্রকৃতিতে নিক বার্নসের একটি ভাল নিবন্ধ ছিল (২০১০) আপনার কম্পিউটার কোডটি প্রকাশ করুন: এই বিষয়টিতে তর্ক করার পক্ষে এটি যথেষ্ট ভাল
ডেভিড লেবাউর

16

আপনি যদি কোনও শিল্প ল্যাবটির জন্য কাজ করেন, মুক্তির জন্য কোড অনুমোদিত হওয়ার চেয়ে মুক্তির জন্য অনুমোদিত কাগজ পাওয়া অনেক বেশি সহজ হতে পারে (যদিও কাগজে কোডটি পুনরায় লেখার জন্য প্রয়োজনীয় সমস্ত তথ্য রয়েছে)। দোষ আমলাতন্ত্রীর।


1
যদিও এটি অবশ্যই সত্য, আমি অবাক হয়েছি যদি একাডেমিক গবেষকরা পরিচালিত সংস্কৃতিতে একটি উপযুক্ত পরিবর্তন শিল্প গবেষকদের কোড প্রকাশের অনুমতি দেওয়ার জন্য ম্যানেজমেন্টকে চাপ দিতে সক্ষম করে। সর্বোপরি, আমি সন্দেহ করি এমনকি কাগজ প্রকাশের জন্য নীতিমালা পাওয়া অবশ্যই কিছুটা গ্রহণ করেছে
সুরেশ ভেঙ্কট

6
কমপক্ষে এমএসআর, গবেষণা কোড প্রকাশ করা খুব সহজ। বাহিরের কোডটি ব্যবহার করা আসলেই আরও কঠিন, যেহেতু এমএস সফ্টওয়্যার লাইসেন্সগুলির বিষয়ে সম্মান জানায় super যেহেতু অনেকগুলি কাগজ-সম্পর্কিত কোড ড্রপগুলি সুস্পষ্ট লাইসেন্স ফাইল ছাড়াই আসে, এটি কিছুটা বিরক্তিকর হতে পারে। সাধারণত জিনিসপত্র পরিষ্কার করার জন্য কাগজের লেখকের কাছে কেবল এটি ইমেল লাগে তবে আপনি আপনার পাবলিক কোড রিলিজে ওএসআই-অনুমোদিত লাইসেন্স আটকে রাখার কথা মনে রেখে শিল্প গবেষকদের পক্ষে এটি আরও সহজ করে তুলতে পারেন।
নীল কৃষ্ণস্বামী

2
@ নীল: আপনি কি "ওএসআই-অনুমোদিত, তবে জিপিএল নয় "?
রাদু গ্রিগোর

3
জিপিএল সাধারণত ঠিক থাকে - আমরা প্রচুর ইমাক ব্যবহার করি! :) আমরা আফিরো জিপিএল সফ্টওয়্যার ব্যবহার করার অনুমতি পাচ্ছি না, যেহেতু এর পারস্পরিক ক্রিয়াকলাপটি সফ্টওয়্যারটির সাথে ইন্টারঅ্যাক্ট করে এমন প্রত্যেকের জন্য প্রসারিত হয় (যেমন, এটি ওয়েব সার্ভিসের লুফোলটি বন্ধ করে) এবং এমএস সম্ভাবনা ঝুঁকিপূর্ণ করতে চায় না যে কিছু অভ্যন্তরীণ সার্ভার রয়েছে চলমান এজিপিএল কোডটি দুর্ঘটনাক্রমে জনসাধারণের মুখোমুখি করা যেতে পারে। এমনকি এজিপিএল কোনও লাইসেন্স ছাড়াই মোটেও ভাল, কারণ লাইসেন্স বাছাই করা আসলে ভাগ করে নেওয়ার শর্তগুলিকে দ্ব্যর্থহীন করে তোলে।
নীল কৃষ্ণস্বামী

13

স্থানান্তরিত এবং একটি মন্তব্য থেকে প্রসারিত:

আমি মনে করি এটি অবশ্যই সাবফিল্ডের দ্বারা পৃথক হতে হবে। প্রায় সমস্ত থিওরি বি স্টাফ যার সাথে আমি পরিচিত (এবং বিশেষত হাস্কেল, আগদা, এবং কখনও কখনও কোক-রিলেটেড) প্রকাশিত কোড অন্তর্ভুক্ত করে, কখনও কখনও পরিশিষ্ট হিসাবে বা আরও ভাল কাগজের মধ্যে অন্তর্ভুক্ত থাকে। আই.সি.এফ.পি থেকে শুরু করে সাক্ষরতার প্রোগ্রাম হিসাবে ন্যায্য সংখ্যক কাগজপত্র লেখা হয় এবং পুরোপুরি তাদের উত্সটি লেখকগণ দ্বারা প্রকাশিত হয়। পরিবর্তে এগুলির একটি ন্যায্য পরিমাণ ফলাফল বিতরণের জন্য নিষ্ক্রিয় গ্রন্থাগারগুলি তৈরি করেছে।

বাকি কাগজপত্রগুলির মধ্যে, একটি ন্যায্য পরিমাণের সাথে কখনই কোডটি শুরু হয় না। এর মধ্যে সম্ভবত দুটি মূল কারণ রয়েছে। প্রথমে সেই কাগজপত্রগুলি যার মূল বিষয়বস্তু প্রুফ ট্রি, সম্পর্কিত সাউন্ডনেস প্রুফ সহ বিধি টাইপ এবং এর মতো। এর মধ্যে যান্ত্রিকীকরণের মেটাথেরিতে অগ্রগতি কমপক্ষে কিছু লেখককে তাদের পছন্দের উপপাদ্য প্রবাদে কোড সরবরাহ করতে উত্সাহিত করেছে (পপলমার্কে ওয়েরিচের স্লাইডগুলি দেখুন: http://www.seas.upenn.edu/~sweirich/talks/cambridge-09) পিডিএফ)। দ্বিতীয়টি হ'ল বার্ড-মার্টিনস স্টাফ (কলা এবং কো।) থেকে উত্পন্ন। এগুলি সাধারণত খুব বেশি কাজ ছাড়াই একটি কার্যকরী ভাষায় অনুবাদযোগ্য। তবে, আমি সন্দেহ করি যে উভয়ই সাধারনতার ক্ষতি হয় এবং সিনট্যাক্স এবং টাইপিংয়ের কংক্রিট বিষয়গুলির সাথে ডিলিং অযৌক্তিকভাবে বিষয়গুলিকে জটিল করে তোলে এবং সমীকরণীয় যুক্তি অনুসরণ করা আরও শক্ত করে তোলে।

আমি আমার পর্যবেক্ষণগুলি কিছুটা দৃ sub় করতে চেয়েছিলাম, তাই আইসিএফপি ২০১০ এর প্রথম দু'দিনের মোটামুটি সংখ্যা গণনা করেছিল standard স্ট্যান্ডার্ড পেপারগুলির (যেমন রিপোর্টের প্রতিবেদন বা আমন্ত্রিত আলোচনা নয়), 21 টির মধ্যে 12 কোনও প্রকারের কোড সরবরাহ করেছিল। তিনজন কক সরবরাহ করেছেন (চতুর্থ অংশ আংশিক প্রমাণ দাবি করেছে তবে তা প্রকাশ করেনি)। তিনটি প্রোকেড হাস্কেল তিনটি আগদা সরবরাহ করল। একটি সরবরাহিত স্কিম, একটি ক্যামেল সরবরাহ করেছিল এবং একটি বারোটি সরবরাহ করেছিল। (মনে রাখবেন যে কিছু কিছু একাধিক প্রুফ সহকারী, বা একটি আনুষ্ঠানিককরণ এবং বাস্তবায়ন উভয়ের জন্য কোড সরবরাহ করেছে)। বাকী কাগজপত্রগুলির মধ্যে কয়েক জন বিমূর্ততার উচ্চ পর্যায়ে কাজ করেছিলেন যে এটি একটি প্রুফ সহকারী হিসাবে প্রয়োগ করা হবে এটি নিজেই একটি নতুন কাগজ হবে, এবং আরও একটি সুসংখ্যক কাজ করেছেন যা আমার সন্দেহ হয় যে প্রমাণের সহকারী হিসাবে ব্যবহার করে প্রয়োগ করা যেতে পারে মানক কৌশল, তবে যা অবশ্যই এটির জন্য যথেষ্ট পরিমাণে কাজ গ্রহণ করবে।


12

আপনি বিশ্বাস করেন যে কোড প্রকাশ করা উচিত, তবে আপনি কেন জিজ্ঞাসা করেন যে কাগজগুলিতে কোড অন্তর্ভুক্ত নয়। এই দুটি ভিন্ন জিনিস।

বেশিরভাগ সময়, উল্লেখযোগ্য পরিমাণে কোড প্রকাশের জন্য কেবল পর্যাপ্ত জায়গা নেই। আমার গবেষণা ক্ষেত্রে (চিত্র প্রক্রিয়াকরণ) সিউডোকোড বা আর্কিটেকচার তথ্য প্রায়শই অনেক বেশি মূল্যবান এবং কোনও কাগজে কোডের অভাবের কারণে আমি নিজেকে কখনই আটকে দেখিনি। এটি প্রায়শই অনুশীলন হিসাবে পাঠকের কাছে পড়ে থাকে যিনি নিবন্ধটি উপলব্ধি করেছিলেন।

তবুও কাগজপত্রগুলি চিত্রিত করার জন্য প্রচুর কোড উপলব্ধ। লেখকদের সাধারণত একটি ওয়েবপৃষ্ঠ থাকে এবং পর্যালোচক কোডটি নিজেই চেষ্টা করার চেষ্টা করে দেখার চেষ্টা নাও করেন, প্রাকৃতিক নির্বাচনটি বেশ ভালভাবে কাজ করে বলে মনে হয় এবং যে লেখক কোড প্রকাশ করেন না তাদের অনেক কম উদ্ধৃত করা হয়।


8

এটি ইতিমধ্যে কিছু আগে জিজ্ঞাসা করা হয়েছিল, তবে আমি সর্বদা এটি সম্পর্কে দৃ strongly়তা অনুভব করেছি তাই আমি আমার দুটি সেন্ট দেব। আমি স্যাট সম্প্রদায়ের মধ্যে কয়েক বছর ধরে কাজ করেছি (আর নয়)। বেশিরভাগ গবেষক খুব কমই তাদের কোড প্রকাশ করেন। কাগজটি অ্যালগরিদমের সাথে প্রকাশিত হয় তবে কাগজের সাথে প্রকাশিত স্যাট সলভার (ম্যাক্স্যাট সলভার) ইত্যাদির আসল কোডটি পাওয়া খুব বিরল।

এবং বাস্তবতাটি হ'ল কাগজে প্রকাশিত ঠিক কোডটি দিয়ে আপনি লেখকের পরীক্ষাগুলি পুনরুত্পাদন করার সুযোগ পাবেন না । কেবলমাত্র প্রকাশিত কোড সম্পূর্ণ না হওয়ার কারণে নয় (অবশ্যই) তবে প্রকাশিত সিউডো কোডটি বাস্তবে বাস্তবায়িত হয় এমনটিতে খুব কমই আধা-সরাসরি অনুবাদ করে।

এর পিছনে কারণটি জানা শক্ত এবং এটি গবেষক থেকে গবেষকের উপর নির্ভর করতে পারে তবে বেশিরভাগ ক্ষেত্রে এটি দুটি ভাগে।

  • প্রথমত, গবেষক একই সলভারের কাগজপত্রগুলির পরে একক দ্রাবক প্রকাশের কাগজগুলিতে ক্রমাগতভাবে কাজ করার প্রবণতা এবং ক্রমবর্ধমানভাবে নতুন বৈশিষ্ট্য যুক্ত করে যা সলভারের নতুন সংস্করণগুলিতে অনুবাদ করে। একটি অস্বাস্থ্যকর আবেশ রয়েছে যে প্রতিযোগিতা আপনার প্রচ্ছদকে তাদের কেরিয়ারকে আরও বাড়িয়ে এবং প্রাপ্য প্রকাশের মাধ্যমে আপনাকে যথাযথ creditণ প্রদান না করে ব্যবহার করবে (অর্থাত্ সহ-লেখক)।

  • দ্বিতীয়ত, কিছু কোড সত্যই (সমস্ত সফ্টওয়্যার সহ) হুড়োহুড়ি দ্বারা লিখিত হয়। অর্ধ-বেকড স্ক্রিপ্টগুলি। অনির্ধারিত বৈশিষ্ট্য ইত্যাদি this এই কোডটি প্রকাশের দ্বারা গবেষককে মনে হবে তিনি নিজেরাই বিব্রত হবেন এবং তাদের খ্যাতি ক্ষতিগ্রস্থ করবেন।

আমি এটি সম্পর্কে আপনাকে সাম্প্রতিক একটি রেফারেন্স দিয়ে এসিএম থেকে ছেড়ে দিচ্ছি: http://cacm.acm.org/magazines/2011/5/107698-the-portort- থেকে- পর্যালোচনা- code/ fulltext


7

.তিহাসিকভাবে, বৈজ্ঞানিক নিবন্ধগুলি কাগজে ছাপতে হত এবং জার্নালগুলি আন্তর্জাতিকভাবে প্রেরণ করা হত। প্রতিটি অতিরিক্ত পৃষ্ঠা একটি উল্লেখযোগ্য ব্যয় যুক্ত করতে ব্যবহৃত হয়, সুতরাং নিবন্ধগুলি দৈর্ঘ্যের সীমাবদ্ধতার অধীনে ছিল এবং এমনকি সাধারণ কাজের কোড সাধারণত অনানুষ্ঠানিক বর্ণনার চেয়ে অনেক বেশি জায়গা নেয়।

আজ কোনও অ্যালগরিদম উল্লেখ করে যে কোনও ধরণের নিবন্ধে কোড অন্তর্ভুক্ত না করার কোনও ভাল কারণ নেই।

পিডিএফ এবং পোস্টস্ক্রিপ্টের মতো প্রিন্ট-ওরিয়েন্টেড ফর্ম্যাটগুলি আরও শব্দার্থ-সচেতন ফর্ম্যাটগুলির পক্ষে (ম্যাথএমএল সহ এইচটিএমএল বা ম্যাথমেটিকার একটি ওপেনসোর্স প্রকরণের) পক্ষে ছেড়ে দেওয়াও কার্যকর হতে পারে।


8
প্রথম দুটি অনুচ্ছেদের জন্য +1, শেষ অনুচ্ছেদের জন্য -1। আপনি যখন আমার ঠান্ডা মৃত হাত থেকে এটি পরীক্ষা করবেন তখন আপনি আমার ল্যাটেক্স কেড়ে নিতে পারেন।
জেফি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.