আপনার কেউ কেউ নিজের পরিসংখ্যান সংক্রান্ত কাজ অন্যের সাথে পরিচালনা ও ভাগ করে নেওয়ার জন্য গুগল ডক্স স্প্রেডশিট ব্যবহার করেন?


15

আমি জানি আপনার বেশিরভাগ বোধ হয় গুগল ডক্স এখনও একটি আদিম সরঞ্জাম। এটি কোনও মতলব বা আর নয় এবং এমনকি এক্সেলও নয়। তবুও, আমি এই ওয়েব ভিত্তিক সফ্টওয়্যারটির শক্তিতে বিস্মিত হয়েছি যা কেবলমাত্র একটি ব্রাউজারের অপারেটিং ক্ষমতা ব্যবহার করে (এবং অনেক ব্রাউজারের সাথে সামঞ্জস্যপূর্ণ যেগুলি খুব আলাদাভাবে কাজ করে)।

এই ফোরামে সক্রিয় মাইক লরেন্স আমাদের সাথে একটি স্প্রেডশিট ভাগ করেছে গুগল ডক্স এর সাথে কিছু সুন্দর অভিনব জিনিসগুলি ব্যবহার করে। আমি ব্যক্তিগতভাবে গুগল ডক্সে এক্সেলে মূলত সম্পন্ন একটি বেশ পুঙ্খানুপুঙ্খ হাইপোথিসিস টেস্টিং ফ্রেমওয়ার্ক (বহু প্যারামেট্রিক এবং ননপ্যারামেট্রিক টেস্ট সহ) প্রতিলিপি করেছি।

আমি আগ্রহী যদি আপনারা কেউ গুগল ডক্স চেষ্টা করে দেখে থাকেন এবং আকর্ষণীয় অ্যাপ্লিকেশনগুলিতে এর সীমাতে চলে এসেছেন। গুগল ডক্সের সাথে আপনি যে বাগগুলি বা ত্রুটিগুলির মুখোমুখি হয়েছিলেন সেগুলি সম্পর্কেও শুনতে আগ্রহী

আমি এই প্রশ্নটিকে "সম্প্রদায় উইকির জন্য" নির্ধারণ করছি যে এর জন্য সেরা উত্তর নেই। এটি যে কোনও কিছুর চেয়ে জরিপের বেশি।


আপনি যে স্প্রেডশিট মাইক লরেন্স সরবরাহ করেছেন তার সাথে লিঙ্ক করতে পারবেন?
অ্যান্ডি ডাব্লু

এখানে URL হল spreadsheets.google.com/... এটা তার প্রশ্নের সাথে সম্পর্কিত ছিল stats.stackexchange.com/questions/2956/...
Sympa

1
গুগল ডক্স, যখন আনুষ্ঠানিকভাবে পরীক্ষিত হয়, বেশিরভাগ পরিসংখ্যানের গণনার (যখন এটি কিছুতেই এটি করতে পারে) খারাপভাবে সম্পাদন করে। দেখুন Kellie বি কিলিং এবং রবার্ট জে Pavur (2011): স্প্রেডশীট সফ্টওয়্যার পরিসংখ্যান যথার্থতা, আমেরিকান পরিসংখ্যানবিদ, 65: 4, 265-273
whuber

উত্তর:


12

গুগল স্প্রেডশিটগুলির জন্য আমার প্রধান ব্যবহারটি গুগল ফর্মগুলির সাথে, ডেটা সংগ্রহ করার জন্য, এবং তারপরে সহজেই এটি আর-তে আমদানি করার জন্য ছিল half

গুগল স্প্রেডশিটগুলি + গুগল ফর্মগুলি + আর = বিশ্লেষণের জন্য সহজেই ডেটা সংগ্রহ এবং আমদানি করে

এছাড়াও, আপনি যদি সহযোগিতায় থাকেন তবে আমার পছন্দের সরঞ্জামটি হ'ল ড্রপবক্স। আমি কয়েক মাস আগে এটি সম্পর্কিত একটি পোস্ট লিখেছিলাম:

ড্রপবক্স ব্যবহার করে কম্পিউটারে ফাইল সিঙ্ক করা হচ্ছে

আমি এখন প্রায় অর্ধবছর ধরে 5 জন সহ-লেখক নিয়ে একটি প্রকল্পে এটি ব্যবহার করে আসছি এবং এটি অমূল্য হয়েছে (3 জন সরবরাহকারী থেকে ডেটা ফাইল সিঙ্ক করে, প্রত্যেকে আমার উত্পাদিত আউটপুটটির সর্বশেষ সংস্করণটি দেখতে পাবে এবং প্রত্যেকেই খুঁজছেন নিবন্ধের জন্য একই .ডোক্স ফাইলটিতে)।

উভয় পোস্ট ভিডিও টিউটোরিয়াল এবং মৌখিক নির্দেশাবলী অফার করে।


আপনার প্রতিক্রিয়ার জন্য ধন্যবাদ. এটি হ'ল সঠিক ধরণের মন্তব্যে আমি আগ্রহী ছিলাম Google গুগল ডক্সের ভাগ করে নেওয়া এবং আমদানি করার উপাদানটি আপনি সত্যিই কাজে লাগিয়েছেন। তোমার জন্য ভালো. আমি আপনার উপাদান এটি সম্পর্কে আরও জানতে পড়তে হবে।
সিম্পা

প্রিয় গায়তন, আপনার প্রতিক্রিয়া দেখে আমি আনন্দিত - দয়াবান শব্দগুলির জন্য আপনাকে ধন্যবাদ। সেরা, তাল।
তাল গ্যালি 8

19

আর, ব্যাশ, পাইথন, এসিইডোক, (লা) টেক্স, উত্স উত্স সফটওয়্যার বা কোনও অ * এক্স সরঞ্জামের উত্সাহী ব্যবহারকারী হিসাবে, আমি কোনও উদ্দেশ্য উত্তর সরবরাহ করতে পারি না। তদুপরি, আমি প্রায়শই এমএস এক্সেল বা যে কোনও প্রকারের স্প্রেডশিট ব্যবহারের বিরুদ্ধে তর্ক করি (ভাল, আপনি নিজের ডেটা, বা এর অংশটি দেখেন, তবে আর কী?), আমি বিতর্কে ইতিবাচকভাবে অংশ নেব না। আমি একমাত্র না, যেমন

আমার একজন সহকর্মী তার সমস্ত ম্যাক্রোগুলি পিছিয়ে সামঞ্জস্যের অভাবে ইত্যাদি আলগা করে রেখেছিলেন। অন্য সহকর্মী জেনেটিক্স ডেটা আমদানির চেষ্টা করেছিলেন (800,000 চিহ্নিতকারীকে জেনোটাইপযুক্ত প্রায় 700 বিষয়, 120 মো), কেবল "তাদের দিকে নজর দিন"। এক্সেল ব্যর্থ হয়েছে, নোটপ্যাড খুব হাল ছেড়ে দিয়েছে ... আমি vi এর সাথে "তাদের দিকে নজর দিতে" সক্ষম হয়েছি এবং দ্রুত কিছু সেড / অ্যাজক বা পার্ল স্ক্রিপ্টের সাহায্যে ডেটাটি পুনরায় ফর্ম্যাট করতে পারি। সুতরাং আমি মনে করি স্প্রেডশিটগুলির কার্যকারিতা সম্পর্কে আলোচনা করার সময় বিভিন্ন স্তর বিবেচনা করতে হবে। হয় আপনি ছোট ডেটা সেটগুলিতে কাজ করেন এবং কেবলমাত্র প্রাথমিক পরিসংখ্যানগুলির জিনিস প্রয়োগ করতে চান এবং সম্ভবত এটি ঠিক আছে। তারপরে, ফলাফলগুলিতে বিশ্বাস করা আপনার উপর নির্ভর করে, অথবা আপনি সর্বদা সোর্স কোডের জন্য জিজ্ঞাসা করতে পারেন, তবে এনআইএসটি বেঞ্চমার্কের সাথে সমস্ত ইনলাইন পদ্ধতির দ্রুত পরীক্ষা করা সহজ হবে would। আমি মনে করি না এটি কেবল পরিসংখ্যান করার একটি ভাল পদ্ধতির সাথে মিলেছে কারণ এটি সত্যিকারের পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার (আইএমএইচও) নয় যদিও পূর্বোক্ত তালিকার আপডেট হিসাবে এমএস এক্সেলের নতুন সংস্করণগুলি তার যথার্থতার জন্য উন্নতি দেখিয়েছে বলে মনে হচ্ছে পরিসংখ্যানগত বিশ্লেষণগুলি দেখুন, কীলিং এবং পাভুর দেখুন, নয়টি পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার প্যাকেজের নির্ভরযোগ্যতার তুলনামূলক গবেষণা ( সিএসডিএ 2007: 51: 3811)।

তবুও, 10 বা 20 এর মধ্যে প্রায় একটি কাগজ (বায়োমেডিসিন, সাইকোলজি, সাইকিয়াট্রিতে) এক্সেলের সাথে তৈরি গ্রাফিকগুলি অন্তর্ভুক্ত করে, কখনও কখনও ধূসর ব্যাকগ্রাউন্ড অপসারণ না করে, অনুভূমিক কালো রেখা বা স্বয়ংক্রিয় কিংবদন্তি (অ্যান্ড্রু গ্যালম্যান এবং হ্যাডলি উইকহাম অবশ্যই খুশি) আমাকে যখন এটি দেখুন)। তবে আরও সাধারণভাবে, এটি ফ্লোডিংডাটা সম্পর্কিত সাম্প্রতিক জরিপ অনুসারে সর্বাধিক ব্যবহৃত "সফ্টওয়্যার" হিসাবে দেখা যায় যা ব্রায়ান রিপলির (যা এমএএসএস আর প্যাকেজ সহ-রচনা করেছিল এবং প্যাটার্ন স্বীকৃতি সম্পর্কিত একটি চমৎকার বই লিখেছিল) একটি পুরানো কথা মনে করিয়ে দেয়। , অন্যদের মধ্যে):

আসুন আমরা নিজেরাই বাচ্চা নই: পরিসংখ্যানগুলির জন্য সর্বাধিক ব্যবহৃত সফ্টওয়্যারটি হ'ল এক্সেল (বি রিপ্লে জ্যান ডি লিউউয়ের মাধ্যমে), http://www.stats.ox.ac.uk/~ripley/RSS2002.pdf

এখন, আপনি যদি মনে করেন এটি আপনার পরিসংখ্যানগুলি সম্পন্ন করার জন্য একটি দ্রুত এবং সহজতর উপায় সরবরাহ করে, তবে কেন নয়? সমস্যাটি হ'ল এমন পরিবেশে এখনও এমন কিছু জিনিস রয়েছে যা করা যায় না (বা কমপক্ষে এটি বরং কৌশলযুক্ত)। আমি বুটস্ট্র্যাপ, ক্রমশক্তি, মাল্টিভিয়ারেট এক্সপ্লোরারি ডেটা বিশ্লেষণের কথা ভাবি, কয়েকটি নাম রাখার জন্য। আপনি যদি ভিবিএতে খুব দক্ষ না হন (তবে এটি কোনও স্ক্রিপ্টিং বা কোনও প্রোগ্রামিং ভাষা নয়) তবে আমি ভাবতে আগ্রহী যে ডেটাতে ছোটখাটো অপারেশনগুলিও আর (বা মতলব, বা পাইথনের) অধীনে ভালভাবে পরিচালিত হয়, আপনাকে সরবরাহের জন্য সঠিক সরঞ্জাম সরবরাহ করে যেমন তথাকথিত ডেটা.ফ্রেমে)) সর্বোপরি, আমার মনে হয় এক্সেল ডেটা বিশ্লেষকদের জন্য খুব ভাল অভ্যাসের প্রচার করে না (তবে এটি কোনও "ক্লাইকোড্রোম" এর ক্ষেত্রেও প্রযোজ্য, ডেটা প্রসেসিংয়ের রেকর্ড বজায় রাখার প্রয়োজনীয়তা সম্পর্কে মেডস্ট্যাটসে আলোচনা দেখুন,বিশ্লেষণ এবং ডেটা সম্পাদনার ডকুমেন্টিং ), এবং আমি প্র্যাকটিক্যাল স্ট্যাটাসে এই পোস্টটি কয়েকটি এক্সফলের সমস্যার তুলনামূলক চিত্রণে পেয়েছি । তবুও, এটি এক্সেলের ক্ষেত্রে প্রযোজ্য, আমি জানি না এটি কীভাবে জিডোকসে অনুবাদ করে।

আপনার কাজ ভাগ করে নেওয়ার বিষয়ে, আমি মনে করি গিথুব (বা উত্স কোডের জন্য জিস্ট ) বা ড্রপবক্স (যদিও EULA কিছু লোককে নিরুৎসাহিত করতে পারে) খুব ভাল বিকল্প (পুনর্বিবেচনার ইতিহাস, প্রয়োজনে অনুদানের ব্যবস্থাপনা ইত্যাদি) are আমি এমন কোনও সফ্টওয়্যার ব্যবহার করতে উত্সাহিত করতে পারি না যা মূলত আপনার বাইনারি ফর্ম্যাটে আপনার ডেটা সঞ্চয় করে। আমি জানি এটি আর, মাতলাব, স্টাটা, এসপিএসে আমদানি করা যায় তবে আমার মতে:

  • ডেটা অবশ্যই পাঠ্য বিন্যাসে থাকা উচিত, এটি অন্য একটি পরিসংখ্যান সফটওয়্যার দ্বারা পড়া যেতে পারে;
  • বিশ্লেষণ পুনরুত্পাদনযোগ্য হওয়া উচিত, এর অর্থ আপনার বিশ্লেষণের জন্য একটি সম্পূর্ণ স্ক্রিপ্ট সরবরাহ করা উচিত এবং এটি চলতে হবে (আমরা এখানে কাছাকাছি আদর্শ ক্ষেত্রে যেতে পারি ...) যে কোনও সময় অন্য অপারেটিং সিস্টেমে;
  • আপনার নিজস্ব পরিসংখ্যান সফ্টওয়্যার স্বীকৃত অ্যালগরিদম বাস্তবায়ন করা উচিত এবং এটি আপডেট করার একটি সহজ উপায় থাকা উচিত স্ট্যাটিস্টিকাল মডেলিংয়ের বর্তমান সেরা অনুশীলনগুলি প্রতিফলিত করার জন্য;
  • আপনি যে ভাগ করে নেওয়ার ব্যবস্থাটি চয়ন করেছেন তাতে সংস্করণ এবং সহযোগী সুবিধার অন্তর্ভুক্ত হওয়া উচিত।

এটাই.


@ গেটান আমার প্রতিক্রিয়া বাদ দিয়ে আমি আমার +1 প্রশ্নের উত্তর দিয়েছি কারণ আমি মনে করি এটি পরিসংখ্যান চর্চা এবং প্রকল্প পরিচালনার বিষয়ে বিতর্কের জন্য অত্যন্ত প্রাসঙ্গিক।
chl

ডাউনভোটের জন্য একটি মন্তব্য প্রশংসিত হবে।
chl

@ সিএইচএল: যদিও আমি এই উত্তরটিকে নিম্নচোটিত করি নি, তবে আমি মনে করি যে এটি কেন নীচে নামবে। আপনার প্রদত্ত তথ্যগুলি সঠিক, খুব গুরুত্বপূর্ণ এবং চিন্তা-চেতনামূলক। যাইহোক, এর বেশিরভাগই (শেষ দুটি অনুচ্ছেদ ব্যতীত) প্রশ্নের উত্তর দেয় না। আদর্শভাবে, কেউ এই বড় অস্বচ্ছলতা অন্য কোথাও লিখে তাতে একটি লিঙ্ক দিত।
বরিস গোরালিক

@ সিএইচএল: আমি আমার মন্তব্যে যা বলেছি তা সত্ত্বেও, আমি আপনার উত্তর পছন্দ করি এবং এটির পক্ষে ভোট দিয়েছি
বোরিস গোরালিক

@ বিজিবিজি আপনার মন্তব্যের জন্য ধন্যবাদ। হয়তো আমি সিডব্লিউ প্রশ্নের উত্তর দিলাম না। যাইহোক, আমি কখনই একটি নির্ভুল উত্তেজক উত্তর দেওয়ার ইচ্ছা করি নি। জিপিএস-তে সম্ভাব্য "বাগ এবং ত্রুটিগুলি" সম্পর্কে ওপি জিজ্ঞাসা করেছিল: আমি এক্সেল থেকে আমি কী জানি তার উদাহরণ দিয়েছি, জিডিওজে কীভাবে অনুবাদ হবে তা আমি জানি না। আমি "ডেটা বিশ্লেষণের জন্য জিডোকস ব্যবহারের কী কী সুবিধা" তা প্রশ্নের অংশটিও বুঝতে পেরেছি, এবং আমি কেবলমাত্র বৃহত আকারের প্রকল্পগুলির জন্য স্প্রেডশিট ব্যবহার, বা রক্তপাতের প্রান্তে বিশ্লেষণের বিরুদ্ধে কিছু যুক্তি দিয়েছিলাম (এখনও, আমি স্বীকার করেছি যে এই পক্ষপাতিত্ব করা হবে যে শুরু)।
chl

10

"গুগল ডক্সের সাথে আপনি যে বাগগুলি বা ত্রুটিগুলির মুখোমুখি হয়েছিলেন সেগুলি সম্পর্কেও শুনতে আগ্রহী" "

আমি কেবলমাত্র মূল প্রশ্নের সেই অংশটিই সাড়া দেব। গুগল ডক্স স্প্রেডশিট (জিশিট) এর সাথে আমার অনুসন্ধানগুলি গাণিতিক এবং পরিসংখ্যান সংক্রান্ত ফাংশনগুলির সাথে সম্পর্কিত। শেষ পর্যন্ত আমার মূল্যায়নটি হ'ল গুগল স্প্রেডশিটগুলি ১৯৯ 1997 সালের ম্যালেন্ডেড এক্সেলের তুলনায় ২০১২ সালের তুলনায় নিম্নমানের।

উত্তর: গুগল শিটগুলি স্পষ্টতই erfc (x) ব্যবহার করে erfc (x) = 1-erf (x) ব্যবহার করে যার যুক্তিগুলির জন্য erf (x) প্রায় 1 রয়েছে 1. তারা স্কোয়ারের বিয়োগ বর্গের গড়ের মাধ্যমে একটি আদর্শ বিচ্যুতি বা তারতম্যের মূল্যায়ন করে গড়ের; এটা খারাপ সংখ্যা অনুশীলন। মিশ্রণমূলক ফাংশন এবং পৃথক সম্ভাবনা যেমন পইসন (এন, এক্স) = পাও (এক্স, এন) * এক্সপ (-x) / এন! অকারণে অতিরিক্ত প্রবাহের কারণ হিসাবে গুণনীয়-দ্বারা-ফ্যাক্টর মূল্যায়ন করা হয়। স্টিরিলিংয়ের আনুমানিক ফ্যাক্টর-বাই-ফ্যাক্টর ব্যবহার করে ফ্যাক্টরিয়ালটি মূল্যায়ন করা হয়, যার ফলে আরও অকারণ ওভারফ্লো হয়। ক্রমবর্ধমান পোইসন বিতরণটি কেবল সীমাবদ্ধ সমষ্টি দ্বারা মূল্যায়ন করা হয়, সুতরাং স্বাভাবিককরণের সম্পত্তিটি বৃত্তাকার মধ্যে হারিয়ে যায়; ক্রমবর্ধমান দ্বিপদী বিতরণের ক্ষেত্রেও এটি একই। ক্রমবর্ধমান স্বাভাবিক বিতরণ সম্পূর্ণ গণ্ডগোল করে; এটি [0,1] ব্যাপ্তির বাইরে চলে যায়। অন্যান্য প্যাকেজগুলিতে একই ফাংশনগুলির প্রয়োগের সাথে সম্পর্কিত নির্ভুলতার একটি সাধারণ ক্ষতি রয়েছে। রাউন্ডিংয়ের মতো প্রাথমিক ক্রিয়াকলাপগুলির বিবরণ প্রায়শই গার্ফড এবং বোধগম্য হয়; ব্যাখ্যাটি একটি অনুমানের খেলা।

আমি গুগল ডক্স পণ্য ফোরামে পোস্টিংয়ের দুটি সেটে এই বিষয়গুলি নথিভুক্ত করেছি:

(২০১১-১১-১৩ এবং তার পরে) আদর্শবিদ এখনও negativeণাত্মক মানটি ছুঁড়ে https://productforums.google.com/d/topic/docs/XfBPtoKJ1Ws/

(২০১২-০6-০) এবং তার পরে) জিশিট https://productforums.google.com/d/topic/docs/rxFCHYeMhrU/ এ পরিসংখ্যান এবং গাণিতিক ফাংশন সহ ত্রুটিগুলি এবং অন্যান্য সমস্যা


1
(+1) অন্য কথায়, এটি স্পষ্ট বলে মনে হয় যে গুগলে ( বহু! ) পরিসংখ্যানবিদরা কোনওভাবেই এই প্রকল্পের সাথে জড়িত নেই।
কার্ডিনাল

আমি ব্যবহৃত গুগল ডক্সের একমাত্র অংশটি হ'ল সম্পাদক, এটি রিয়েলটাইমে সহযোগীভাবে সম্পাদনা করার সময় খুব দরকারী । আমি মনে করি না গিট এবং বন্ধুরা এই সমস্যার সমাধান করে!
কেজেটিল বি হালওয়ারসেন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.