আর কোড এবং আউটপুট সংগঠিত করার দক্ষ উপায়গুলি কী কী? [বন্ধ]


23

অন্যরা কীভাবে তাদের আর কোড এবং আউটপুট সংগঠিত করে সে সম্পর্কে আমি ইনপুট খুঁজছি।

আমার বর্তমান অনুশীলনটি হ'ল কোনও পাঠ্য ফাইলে ব্লকগুলিতে কোড লিখতে হবে:

#=================================================
# 19 May 2011
date()
# Correlation analysis of variables in sed summary
load("/media/working/working_files/R_working/sed_OM_survey.RData")
# correlation between estimated surface and mean perc.OM in epi samples
cor.test(survey$mean.perc.OM[survey$Depth == "epi"], 
    survey$est.surf.OM[survey$Depth   == "epi"]))
#==================================================

আমি তখন আউটপুটটিকে অন্য পাঠ্য ফাইলে আটকান, সাধারণত কিছু টিকা থাকে।

এই পদ্ধতির সমস্যাগুলি হ'ল:

  1. কোড এবং আউটপুট সুস্পষ্টভাবে তারিখ ব্যতীত অন্য কোনও লিঙ্কযুক্ত নয়।
  2. কোড এবং আউটপুট কালানুক্রমিকভাবে সংগঠিত এবং সুতরাং অনুসন্ধান করা কঠিন হতে পারে।

আমি সবকিছু দিয়ে একটি সোয়েভ ডকুমেন্ট তৈরি করার বিষয়টি বিবেচনা করেছি যেহেতু আমি তখন সামগ্রীর একটি সারণী তৈরি করতে পারতাম তবে মনে হয় এটি যে সুবিধা প্রদান করবে তার চেয়ে বেশি ঝামেলা হতে পারে।

আপনার আর কোড এবং আউটপুট সংগঠিত করার জন্য আপনার কাছে থাকা কোনও কার্যকর রুটিন সম্পর্কে আমাকে জানান যা বিশ্লেষণকে দক্ষ অনুসন্ধান এবং সম্পাদনা করার অনুমতি দেয়।


2
কেবল অনুলিপি / পেস্ট এড়াতে sink()বা capture.output()আপনার বন্ধু হতে পারে। প্রতিবেদন ইউটিলিটিগুলি, মত Hmisc , Sweave , অথবা চোলাই (আপনার বিন্দু 1) বিবেচনা মূল্য আছে। সংস্করণ সিস্টেমগুলি ( আরসিএস , এসএনএন , বা গিট ) পয়েন্ট ২ এর সাথে সহায়তা করতে পারে
chl

@ সিএইচএল - পরামর্শের জন্য ধন্যবাদ। আমি sink()এবং সম্পর্কে অবগত ছিল না capture.output()। দারুণ.
DQdlM

1
আজ নাইটারও আছে!
কেজেটিল বি হালওয়ারসেন

উত্তর:


22

+1 এবং প্রথম লিঙ্কটি আপনি এখানে একটি থ্রেড রেফারেন্স সরবরাহ করেছেন :-)
chl

@ সিএল ধন্যবাদ! আমি ভাবছিলাম এই প্রশ্নটি যদি একটি সদৃশ হয় এবং এটি বন্ধ করা উচিত ...
বার্নড ওয়েইস

এটি, আইএমও তবে বন্ধ করার মত কোনও ভোট নেই বলেই আমি এটি বন্ধ করতে নারাজ। এছাড়াও, পুরানোটি আরও সাধারণ ছিল, তবে অতীতে একটি অনুরূপ প্রশ্নটি বন্ধ হয়ে গেছে। আসুন অপেক্ষা করুন এবং দেখুন এটি কীভাবে চলে।
chl

তালিকার জন্য ধন্যবাদ! এটি খুব দরকারী। আমি অনুভব করেছি যে আমি এই প্রশ্নটি প্রথম নই তবে আমার (স্পষ্টতই অযোগ্য) প্রাথমিক অনুসন্ধানের সাথে আমি খুব বেশি কিছু পাইনি বলে মনে হয়।
DQdlM

6

আমি প্রত্যেকের জন্য প্রতিটি প্রকল্প বা বিশ্লেষণের জন্য 4 টি ফাইলে সব কিছু व्यवस्थित করি। (1) 'কোড' যেখানে আমি আর ফাংশনগুলির পাঠ্য ফাইলগুলি সঞ্চয় করি। (২) 'স্কুয়েল' যেখানে আমি আমার ডেটা সংগ্রহ করার জন্য ব্যবহৃত প্রশ্নগুলি রাখি। (3) 'ডাট' যেখানে আমি আমার কাঁচা এবং প্রক্রিয়াজাত ডেটার অনুলিপি (সাধারণত সিএসভি) রাখি। (4) 'আরটিপি' যেখানে আমি বিতরণ করা রিপোর্টগুলি সঞ্চয় করি।

আমার সমস্ত ফাইলের নামকরণ করা হয়েছে 'ভার্চুয়ালিজম_নেটওয়ার্ক_ব্যাক_ফার_সেসার্ক_অন_মোডিফাইড_বুফার_9 মে ২০১১'

আমি পূর্বের দিকেও বিস্তারিত ডকুমেন্টেশন লিখি যেখানে আমি অনুমান, কোনও অনুমান, অন্তর্ভুক্তি এবং বর্জনীয় মানদণ্ড এবং আমার উদ্ধারযোগ্যদের কাছে পৌঁছানোর জন্য আমি যে পদক্ষেপ নিয়েছি তা সংগঠিত করি। এগুলি সমস্ত পুনরাবৃত্তযোগ্য গবেষণার জন্য অমূল্য এবং আমার বার্ষিক লক্ষ্য নির্ধারণের প্রক্রিয়াটিকে সহজ করে তোলে।


2

এখন যেহেতু আমি সোয়েভে স্যুইচ করেছি আমি কখনই ফিরে যেতে চাই না। বিশেষত আপনার যদি আউটপুট হিসাবে প্লট থাকে তবে প্রতিটি প্লট তৈরি করতে ব্যবহৃত কোডটির ট্র্যাক রাখা এত সহজ। শুরুতে একটি ছোটখাটো জিনিস সংশোধন করাও এটিকে আরও সহজ করে তোলে এবং ম্যানুয়ালি কোনওরকম পুনরায় ব্যয় না করে আউটপুটটিতে তা ছড়িয়ে দেওয়া।


1
সোয়েভ দুর্দান্ত। এটি কিছুটা অভ্যস্ত হয়ে উঠবে, তবে আপনি যদি ইতিমধ্যে টেক্স এবং আরকে জানেন তবে এটির স্পষ্ট পছন্দ। এটি আপনাকে আবার কখনও টেবিল কলামগুলিকে সারিবদ্ধ করার জন্য আর কখনও সময় ব্যয় করতে দেয় যা দুর্দান্ত।
richiemorrisroe

ইনপুট জন্য ধন্যবাদ. সোয়েভের সাথে আমার 2 উদ্বেগগুলি হ'ল 1) আমি আমার ডিরেক্টরিতে একটি বাজিলিয়ান ফাইলগুলি সরিয়ে দেব - বিশেষত প্রচুর পরিসংখ্যান সহ, এবং 2) প্রতিবার আমি পুরো ডকটি সংকলন করে হিচাপ প্রতিরোধ করার জন্য কোডের সাথে সত্যই যত্নবান হতে হবে (উদাঃ, আমার মনে হয় কিছু বোঝাই হয়েছে এবং এটি নয়)। আপনার কি এই সমস্যা আছে?
DQdlM

1) আপনি চাইলে মধ্যবর্তী ফাইলগুলি মুছতে পছন্দ করতে পারেন; আমি সোয়েভ.শ স্ক্রিপ্ট ব্যবহার করি ( cran.r-project.org/contrib/extra/scriptts/Sweave.sh ) যা স্বয়ংক্রিয়ভাবে তা করে; যদিও সহজেই বন্ধ করা যায়। যদি আপনি এটি করেন, নিশ্চিত দুর্যোগটি রোধ করতে এটি ব্যবহার করার আগে এটি কী মুছবে তা নিশ্চিত হয়ে নিন। সংক্ষিপ্ত সংস্করণটি হ'ল কোনও ফাইল যদি আপনার আরএনডব্লু ফাইলের বেসনামটি ভাগ না করে তবে আপনি ঠিক আছেন।
অ্যারন - মনিকা

২) আমার মতে, সেভাবে সতর্কতা অবলম্বন করা একটি ভাল জিনিস এবং কখনও কখনও আমার সোয়েভ নথিটি সেই সঠিক উদ্দেশ্যটি মনে রেখে সংকলন করে, অর্থাৎ এটি পুনরায় তৈরি করার জন্য প্রয়োজনীয় সমস্ত কিছু সঠিকভাবে ট্র্যাক করে রেখেছি তা নিশ্চিত করা বিশ্লেষণ।
অ্যারন - মনিকা

1
@ ননট ১০১১: দীর্ঘ বিশ্লেষণের জন্য, আমি সোয়েভ .RDataডকুমেন্ট দ্বারা ইনপুট দেওয়ার জন্য সাধারণত এটি একটি ফাইলের মধ্যে পৃথকভাবে চালিত করি এবং ফলাফলগুলি সংরক্ষণ করি । তবে কোড কাঙ্কের ফলাফলগুলি "ক্যাশে" করার জন্য বেশ কয়েকটি দুর্দান্ত বিকল্প রয়েছে যাতে এটি পুনরায় কাজ না করে।
অ্যারন - মনিকা

2

একক .আর কোড ফাইলগুলি গঠনের জন্য, আপনি কোড বিভাজক ( optionচ্ছিক শিরোনাম সহ) সন্নিবেশ করানোর জন্য তৈরি একটি স্ট্রোকোড , একটি আরস্টুডিওও অ্যাড-ইন ব্যবহার করতে পারেন এবং তার উপর ভিত্তি করে - কোড ফাইলগুলির সংক্ষিপ্তসারগুলি পান। আমি এই ব্লগ পোস্টে আরও বিস্তারিতভাবে এর ব্যবহার ব্যাখ্যা ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.