সহজ-এখনও-শক্তিশালী ডেটা এক্সপ্লোরেশনের জন্য সফ্টওয়্যার


20

স্প্রেডশিট মারামারি লড়াইয়ের জন্য আমার প্রচেষ্টায় আমি প্রায়শই সত্য পরিসংখ্যান সফটওয়্যার (আর, স্টাটা এবং এর মতো) এর মতো আরও শক্তিশালী সরঞ্জামগুলির জন্য জোর করে প্রচার করার পক্ষে প্রচার করি। সম্প্রতি, আমি এই মতামতকে চ্যালেঞ্জ করেছিলাম এমন কেউ যে ফ্ল্যাট জানিয়ে দিয়েছেন যে তারা কেবল প্রোগ্রাম করা শিখবে না। আমি তাদের ডেটা বিশ্লেষণ সরঞ্জামগুলি সরবরাহ করতে চাই যাতে কোন প্রোগ্রামিং প্রয়োজন হয় না (তবে আদর্শভাবে যা প্রোগ্রামিংয়ে প্রসারিত হবে যদি তারা পরে পানিতে একটি পায়ের আঙ্গুল ডুবিয়ে ফেলার সিদ্ধান্ত নেয়)। ডেটা অন্বেষণের জন্য এমন কোন প্যাকেজ রয়েছে যা আমি সরাসরি মুখ দিয়ে সুপারিশ করতে পারি?


5
@ gsk3 - আকর্ষণীয় প্রশ্ন। আমার একটি অনুমান হবে যে এই "প্রগ্রেমাফোবে" জটিল স্প্রেডশিটগুলির সাথে মোকাবেলা করতে হবে না? সম্ভবত তিনি / তিনি তাদের মতাদর্শের সাথে বেঁচে থাকতে চান এবং নিজেরাই স্প্রেডশিটগুলির সাথে কঠোর পরিশ্রম করার জন্য স্বেচ্ছাসেবক? :)
সম্ভাব্যতা ব্লগ

@ প্রোব্যাবিলিটিস্লোগিক: "প্রোগ্র্যামাফোবি" তাদের সমস্যার সমাধান করার পরে তাদের সাথে ডিল করে তবে ফলাফলগুলি মোকাবেলার জন্য পুরো কৌশল রয়েছে। আমি ক্লাসিক এন্টি স্প্রেডশিট যুক্তিগুলি খুব অল্প উপকারে নেওয়ার চেষ্টা করেছি (ভাল, কিছু উপকার হয়, যেহেতু তারা সমাধানের এই স্টাইলটি বিবেচনা করতে ইচ্ছুক!)।
এরি বি ফ্রেডম্যান

@ gsk3 - আহ হা, সুতরাং যে প্রোগ্রামটি সে প্রতি সমস্যা তা নয়, তবে এই ব্যক্তিটি আর "বিশেষজ্ঞ" হতে পারবেন না এবং নীচ থেকে শুরু করতে হবে?
সম্ভাব্যতা ব্লগ

2
@ প্রোব্যাবিলিটিস্লগ - আমার মনে হয় ডুবে যাওয়া ব্যয়গুলি ইস্যুটির একটি বড় অংশ, হ্যাঁ। এই ব্যয়গুলির মধ্যে কিছু নিঃসন্দেহে সামাজিক এবং তাদের কিছু সময় ও দক্ষতার ক্ষতি হয় যখন তারা জিনিসগুলি করার নতুন উপায়টি শিখছে।
এরি বি ফ্রেডম্যান

3
আমি মনে করি যে এই কমিকটি পরিস্থিতিটির উপযুক্ত উপস্থাপনা হতে পারে। আপনি যে ব্যক্তিকে রেফারিং দিচ্ছেন সে যদি প্রোগ্রামিংয়ের বিরুদ্ধে নির্ধারিত থাকে তবে তার বিরুদ্ধে যাওয়ার পক্ষে এটি খুব শক্তিশালী কোনও পছন্দ হতে পারে। স্প্রেডশিট ভিত্তিক বিশ্লেষণের ঘাটতিগুলি চিহ্নিত করা একটি আরও ভাল কৌশল হতে পারে। উদাহরণস্বরূপ নতুন এক্সেল ফাইলে 1 1 মান লিখতে চেষ্টা করুন এবং11116 এবং তাদের যোগফল (এটি এক্সেল 2007-এ কাজ করে)। তারপরে ব্যাখ্যা করুন যে কোনও স্ব-সম্মানজনক পরিসংখ্যান প্যাকেজ কোনও সতর্কতা ছাড়াই অনুরূপ ভুল প্রদান করবে এবং এ থেকে কাজ করবে না। 114
এমপিক্টাস

উত্তর:


7

আমি পাইথনে আমার 95% কাজের জন্য এবং বাকিটি আর বা ম্যাট্ল্যাব বা আইডিএল / পিভি-ওয়েভ (এবং শীঘ্রই এসএএস) এর জন্য প্রোগ্রাম করি। তবে, আমি এমন একটি পরিবেশে আছি যেখানে সময়-পরে ফলাফলগুলি প্রায়শই নির্বাচিত বিশ্লেষণের বিশাল চালক হয় এবং তাই আমি প্রায়শই পয়েন্ট-ও-ক্লিক সরঞ্জামগুলিও ব্যবহার করি। আমার অভিজ্ঞতায় বিশ্লেষণগুলি করার জন্য কোনও একক, শক্তিশালী, নমনীয় জিইউআই সরঞ্জাম নেই, যেমন একটি ভাষাও নেই। আমি নিম্নলিখিত নিখরচায় এবং বাণিজ্যিক সফ্টওয়্যারটির সংকলনটি একসাথে আবদ্ধ করি

আমি জেএমপি, স্টাটা, স্ট্যাটিস্টিকা ইত্যাদি ব্যবহার করি নি তবে চাই।

এই সরঞ্জামগুলি ব্যবহার করে বিভিন্ন জিইআইআই এবং মডেলিংয়ের একাধিক বিমূর্ততা শিখতে জড়িত, যা সেই সময়ে ব্যথা হয় তবে আসুন আমি পরে দ্রুত এডহক ফলাফল পেতে পারি। আমি ওপি হিসাবে একই নৌকায় আছি কারণ আমি যাদের সাথে কাজ করি তাদের বেশিরভাগ লোকেরা সত্যই স্মার্ট, তারা কোনও ভাষা শেখার যত্ন নেয় না, একাধিক জিইআইআই এবং অ্যাপ্লিকেশন নির্দিষ্ট পরিভাষাও রাখে না। সুতরাং, আমি এক্সেল ব্যবসার বিশ্বে 90% বিশ্লেষণ চালিত তা গ্রহণ করে নিজেকে পদত্যাগ করেছি। তদনুসারে, আমি পাইনােক্সের মতো জিনিসগুলি ব্যবহার করতে চাই যা আমাকে একই এক্সেল উপস্থাপনা স্তরটিকে আরও ভাল বিশ্লেষণ সরবরাহ করতে দেয় যা আমার বেশিরভাগ সহকর্মী আশা করে।

আপডেট: প্রোগ্রামিং- ব-ম্যাক- এক্সেল-দ্য-প্রেজেন্টেশন-লেয়ার থিম সহ মডেলিং-র কাজটি অবিরত করে, আমি সবেমাত্র এই লোকটির ওয়েবসাইটে এক্সেল সেলগুলিতে এম্বেড করার জন্য টুফ্ট-স্টাইলের গ্রাফিক্স সরবরাহ করেছি। কেবল দুর্দান্ত এবং বিনামূল্যে!


1
আমি বলব যে জেএমপি বেশ ভাল। এমনকি যদি কেউ আর তে খুব দক্ষ হয় তবে এমন সময়ও আসে যখন জেএমপি ডেটা নেভিগেট এবং বিশ্লেষণের দ্রুত উপায় হয়।
ইট্রেটর

8

যতদূর অনুসন্ধানী (সম্ভবত ইন্টারেক্টিভ) ডেটা বিশ্লেষণ সম্পর্কিত, আমি এটি একবার দেখার পরামর্শ দিই:

  • ওয়েকা , মূলত ডেটা মাইনিং অ্যাপ্লিকেশনগুলিকে লক্ষ্য করে তবে ডেটা সংক্ষিপ্তসারগুলির জন্য ব্যবহার করা যেতে পারে।
  • ইন্টারেক্টিভ ডেটা ভিজ্যুয়ালাইজেশনের জন্য মন্ড্রিয়ান
  • কেএনআইএম , যা ডেটা প্রবাহ তৈরির ধারণার উপর নির্ভর করে এবং ওয়েকা এবং আর এর সাথে সামঞ্জস্যপূর্ণ

তিনটিই ডেটা গ্রহণ করে arffবা csvফর্ম্যাট করে।

আমার দৃষ্টিতে, স্টাটার এত প্রোগ্রামিং দক্ষতার প্রয়োজন নেই। এটি এমনকি এটির আকর্ষণের একটি অংশ, বাস্তবে: বেশিরভাগ মৌলিক বিশ্লেষণ পয়েন্ট-এন্ড-ক্লিক ব্যবহারকারী ক্রিয়াকলাপ দ্বারা করা যেতে পারে, নির্দিষ্ট পরামিতিগুলি কাস্টমাইজ করার জন্য ডায়ালগ বাক্স সহ, বলুন, লিনিয়ার মডেলটিতে পূর্বাভাস দেওয়ার জন্য। আপনি @ gsk3 দ্বারা যেমন বলেছিলেন RCMdr , Deducer ইত্যাদির মতো বাহ্যিক GUI ব্যবহার করেন তখন R তে কিছুটা কম পরিমাণে একই প্রয়োগ হয়।


স্টাতার জন্য +1। আপনি পয়েন্ট-এন-ক্লিকের মাধ্যমে সমস্ত বেসিক করতে পারেন, তবে এটি পয়েন্ট-এন-ক্লিকটি উত্পন্ন কমান্ডটিও ছড়িয়ে দেয় যাতে আপনি এটি শিখতে / পরিবর্তন করতে পারেন। এটি অবশ্যই স্প্রেডশিটের মতো যা আপনি এর ডেটা দিয়ে ইন্টারফেস করেন তবে আপনি অবশ্যই কোষগুলিতে সূত্র রাখেন না।
ওয়েইন

8

কিছু লোক প্রোগ্রামিংকে কেবল একটি কমান্ড লাইনের স্টেটমেন্ট প্রবেশ করানোর কথা ভাবেন। সেই মুহুর্তে তখন আপনি তাদের উত্সাহিত করতে কিছুটা হারিয়ে গেছেন। তবে তারা যদি ইতিমধ্যে স্প্রেডশিট ব্যবহার করে থাকে তবে তাদের ইতিমধ্যে সূত্রগুলি প্রবেশ করতে হবে। এগুলি লাইন স্টেটমেন্ট কমান্ড করার অনুরূপ। যদি তাদের সত্যিই বোঝানো হয় যে তারা যৌক্তিক এবং স্বয়ংক্রিয় বিশ্লেষণের অর্থে কোনও প্রোগ্রামিং করতে চান না তবে আপনি তাদের বলতে পারেন যে তারা এখনও কোনও প্রোগ্রামিং ছাড়াই আর বা স্টাটাতে বিশ্লেষণ করতে পারে।

যদি তারা স্প্রেডশীটে তাদের পরিসংখ্যানগুলি করতে পারে ... তারা যা করতে চায় তার সব ... তবে তারা যে পরিসংখ্যানগত বিশ্লেষণগুলি সম্পাদন করতে চায় তার সবগুলি আর বা স্টাটাতেও 'প্রোগ্রামিং' ছাড়াই করা যেতে পারে। তারা স্প্রেডশীটে ডেটা সাজিয়ে এবং সংগঠিত করতে পারে এবং তারপরে এটি কেবল পাঠ্য হিসাবে রফতানি করে। তারপরে বিশ্লেষণটি কোনও প্রোগ্রামিং ছাড়াই করা হয়।

এইভাবে আমি মাঝে মাঝে আর এর সাথে পরিচয় করি। কোনও স্প্রেডশিটে আপনি যে ডেটা বিশ্লেষণ করতে পারেন তা করার জন্য কোনও প্রোগ্রামিংয়ের প্রয়োজন নেই।

যদি আপনি সেভাবে এইভাবে আবদ্ধ হন তবে আস্তে আস্তে মাছটি ছড়িয়ে দিন ... :) কয়েক বছর পরে তারা কী ভাল প্রোগ্রামার হয়ে গেছে সে সম্পর্কে তাদের প্রশংসা করুন।

এছাড়াও আপনি দেখাতে চাইতে পারেন এই আপনার সহকর্মীদের দস্তাবেজের বা অন্তত এটা নিজেকে পড়তে ভাল আপনার পয়েন্ট করা।


1
ভাল পয়েন্ট, তবে এখানে কিছু সতর্কতা রয়েছে: এক্সেলের একটি সরঞ্জাম টিপস রয়েছে যা কোনও ঘরে কোনও সূত্রে প্রবেশ করার সময় পপ আপ হয় এবং তাই এটি সহজ প্রোগ্রামগুলিকে "প্রোগ্রামিং" করা আরও সহজ করে তোলে। এছাড়াও, সম্ভাবনা হ'ল আপনার পাশের ব্যক্তিটি যদি আপনি আটকে যান তবে সাহায্য করতে পারেন যেহেতু প্রচুর এক্সেল পাওয়ার ব্যবহারকারী রয়েছে। এবং, এক্সেল ইনস্টল করা আসে। আর কে চেষ্টা করার জন্য কাউকে বোঝানোয়ের মধ্যে এটি সেট আপ করতে এবং ওপেন সোর্স সফ্টওয়্যারটি কীভাবে উপার্জন করতে হবে (এবং কোন ফোরাম অনুসন্ধান করতে হবে, কোনটি উম্পস্টিন বুটস্ট্র্যাপ প্যাকেজ ব্যবহার করা উচিত, ইত্যাদি) জড়িত রয়েছে invol প্রোগ্রামিং এক অর্থে সহজ অংশ। এটি ইকোসিস্টেম যা শক্ত অংশ।
জোশ হেম্যান

এছাড়াও এক্সেলের কোনও আসল বিন্যাসের সমস্যা নেই ... আর মাঝে মাঝে একটি প্যাকেজ এক্সটিএস ব্যবহার করে, অন্য একটি ডেটা.ফ্রেমস ... এটি
কোনও নবজাতকের পক্ষে গোলযোগ

ফ্রেড, আমি সম্মত হই যে ডেটা ফর্ম্যাটেটিংয়ে সমস্যা থাকতে পারে তবে মনে রাখবেন যে আমার প্রতিক্রিয়া বিশ্লেষণ হিসাবে যোগ্য ছিল যা ইতিমধ্যে একটি স্প্রেডশিটে করা যেতে পারে। এটি প্রচুর বৈচিত্রময় বিশ্লেষণ নয় এবং সাধারণত একটি ডেটা ফর্ম্যাটের অধীনে থাকে।
জন

এক্স এর চেয়ে আর এর সাথে "প্রোগ্রামিং" তে আরও কিছু বেশি ওভারহেড রয়েছে এবং এটি হ'ল ব্যবহারকারীরা পাগল হয়ে যায়। আর, যদি পিভট টেবিলের মতো আর একটি শীর্ষ খাঁজ জিইউআই থাকে তবে হয়তো। তবে ততক্ষণ ...
রাল্ফ উইন্টারস

8

আমি জেএমপির জন্য এখানে একটি পিচ রাখব। এটি আমার পছন্দের নন-প্রোগ্রামিং ডেটা এক্সপ্লোরেশন সরঞ্জামটির কেন বেশ কয়েকটি কারণ রয়েছে:

  1. সত্যই ভাল দৃশ্য সরঞ্জাম। বেশিরভাগ বুনিয়াদি ইডিএ-ধরণের প্লট, এটি আর এর মতোই ভাল এবং কোনও প্রকাশনার জন্য প্রস্তুত প্লটের কাছে পৌঁছানোর জন্য ব্যবহার করার পক্ষে যথেষ্ট সহজ। এটি কয়েকটি অত্যন্ত নমনীয় ভিজ্যুয়ালাইজেশন সরঞ্জামও পেয়েছে, যাতে আপনি পুরো কাহিনীটি পেতে আপনার ডেটাটি ঘুরিয়ে দিতে এবং বাঁকতে পারেন।
  2. আশ্চর্যরকম শক্তিশালী। আমার ... গ্রেড স্কুলে 4 র্থ বর্ষ অবধি অবধি আমার কাছে এমন কিছু সন্ধান করতে লাগলো যে জেএমপি ঠিক বাক্সের বাইরে করতে পারে না। এটা খারাপ না.
  3. Scriptability। এটি আমার কাছে বড় বিষয়। জিইউআই-এর প্রধান দুর্বলতা হ'ল আপনি যা করেছেন তা প্রতিলিপি করা খুব কঠিন। জেএমপি আপনাকে জিইউআই স্ক্রিপ্ট করার অনুমতি দেয় - এবং সেই স্ক্রিপ্টগুলি উত্পন্ন করা বেশ পয়েন্ট এবং ক্লিক করুন।

জেএমপির জন্য +1। এটি আমি সর্বকালের সেরা বেসিক পরিসংখ্যানগুলি ব্যবহার করেছি।
Zach

1
সম্মত (পয়েন্ট # 1 সহ ভাল)। কিছু উপায়ে, এটি ইডিএ স্টাফের জন্য আর এর চেয়েও ভাল, এবং একটি পুনরাবৃত্ত ওয়ার্কফ্লোতে খুব সুন্দরভাবে beোকানো যেতে পারে। যদি কেউ ইতিমধ্যে আর ছাড়া কাজ করে থাকে, তবে জেএমপি আর যুক্ত না করেই কাজ করার যুক্তিসঙ্গত উপায় Because কারণ এটি আর এর সাথেও লিঙ্ক করতে পারে, কোনও আর প্রোগ্রামার এমন সরঞ্জাম তৈরি করতে পারে যা জেএমপিতে প্লাগ ইন করে Eloi, errr, ব্যবহারকারীকে চালিয়ে যাওয়ার অনুমতি দেয় বিশ্বাস করার জন্য যে সবকিছু হ'ল দুরন্ত।
ইট্রেটর

6

আমি টেবিলটিকে ডেটা অনুসন্ধান এবং দৃশ্যধারণের জন্য একটি ভাল সরঞ্জাম হিসাবে সুপারিশ করতে পারি, কেবলমাত্র টানুন এবং ফেলে দিয়ে, আপনি ডেটা অন্বেষণ ও দেখতে পারবেন এমন বিভিন্ন উপায়ে। গ্রাফগুলি মোটামুটি তীক্ষ্ণ এবং আপনি উপস্থাপনের উদ্দেশ্যে পিডিএফে সহজেই আউটপুট করতে পারেন। আপনি চাইলে কিছু "প্রোগ্রামিং" দিয়ে এটিকে প্রসারিত করতে পারেন। আমি নিয়মিত "আর" এবং এসএএসের পাশাপাশি এই সরঞ্জামটি ব্যবহার করি এবং তারা সকলেই ভালভাবে একসাথে কাজ করে।


3

জন যেমন বলেছিল, আর্টে ডেটা এক্সপ্লোরেশনটির জন্য খুব বেশি প্রোগ্রামিংয়ের প্রয়োজন হয় না Here এখানে আপনি ডেটা এক্সপ্লোরেশন কমান্ডের একটি তালিকা দিয়েছেন যা আপনি মানুষকে দিতে পারেন। (আমি সবেমাত্র এটি নিয়ে এসেছি; আপনি অবশ্যই এটি প্রসারিত করতে পারেন))

এটি যে প্যাকেজে রয়েছে তা থেকে ডেটা রফতানি করুন quot

ChickWeight=read.csv('chickweight.csv')

একটি টেবিল তৈরি করুন।

table(ChickWeight$Diet)

আপনাকে কী ধরণের গ্রাফিক দেবে তা অনুমান করি R এটি কখনও কখনও খুব সুন্দরভাবে কাজ করে।

plot(ChickWeight)
plot(ChickWeight$weight)
plot(ChickWeight$weight~ChickWeight$Diet)

নির্দিষ্ট প্লটিং ফাংশনগুলির একটি গোছা একক ভেরিয়েবলগুলিতে বেশ সহজভাবে কাজ করে।

hist(ChickWeight$weight)

সাবসেট নিচ্ছে

plot(subset(ChickWeight,Diet=='2'))

এসকিউএল-এর মতো সিনট্যাক্সের ক্ষেত্রে লোকেরা এর সাথে অভ্যস্ত হয় ( এখানে আরও )

library(sqldf)
plot(sqldf('select * from ChickWeight where Diet == "2"'))

পিসিএ (আপনার কাছে অবশ্যই দুটির বেশি ভেরিয়েবল রয়েছে))

princomp(~ ChickWeight$weight + ChickWeight$Time)

3

এটি উত্তরের চেয়ে শোকের চেয়ে বেশি ...

এর জন্য আমি যে সেরা সফটওয়্যারটি দেখেছি তা হ'ল আর্ক , যা এক্স্লিপ-স্ট্যাটের শীর্ষে নির্মিত। ইন্টারেক্টিভ গ্রাফিক্সে প্রচুর অন্তর্নির্মিত, পাশাপাশি প্রচুর পরিসংখ্যানগত অনুমান ক্ষমতা সহ ডেটা অনুসন্ধানের জন্য এটি দুর্দান্ত সফ্টওয়্যার। আমার মতে ডেটা অন্বেষণ এবং লিস্প প্রোগ্রামিংয়ের মাধ্যমে এটি আরও প্রসারিত করার দক্ষতার জন্য আর কিছুই তার সহজেই আসে নি। আমার মতে, আর-তে ইন্টারঅ্যাক্টিভিটি দশ বছর পরে আরকের মতো উপায়ে ব্যবহার করতে সক্ষম হতে শুরু করেছে। এবং যতদূর আমি জানি, এখনও কেউ এই ক্ষমতাগুলি ইন্টারেক্টিভ ইন্টারফেস তৈরি করতে ব্যবহার করেনি যা আর্ক হিসাবে কার্যকর হিসাবে যে কোনও জায়গায় রয়েছে।

দুর্ভাগ্যক্রমে, এটি সত্যিই কখনই ধরা পড়ে নি তাই বিকাশকারীরা প্রায় সবাই আর-তে কাজ শুরু করেছেন; এটি সর্বশেষে ২০০৪ সালের জুলাইয়ে আপডেট হয়েছিল The পিসি এবং লিনাক্স / ইউনিক্স সংস্করণগুলি এখনও কাজ করে এবং আপনার প্রয়োজনের উপর নির্ভর করে চেষ্টা করার উপযুক্ত হতে পারে; ম্যাক্সের জন্য সেরা বিকল্পটি হল এক্স 11 এর অধীনে লিনাক্স / ইউনিক্স সংস্করণটি চেষ্টা করা, আমি এটি বেশ কয়েকটি সিস্টেমে সেভাবে কাজ করতে পেরেছি। সাইটে বর্ণিত ম্যাক সংস্করণটি কেবলমাত্র "ক্লাসিক" ম্যাকগুলিতে কাজ করে।

আমি সংক্ষেপে মন্ড্রিয়ানেরও উল্লেখ করব , যা আমি কেবল সংক্ষেপে চেষ্টা করেছি, তবে ডেটা এক্সপ্লোরেশনের জন্য ভয়ঙ্কর গ্রাফিকাল ইন্টারঅ্যাক্টিভিটি রয়েছে বলে মনে হচ্ছে, যদিও (যেমন আমি স্মরণ করছি) সক্ষমতা বাড়াতে বা পরিসংখ্যানগত অনুমানের কোনও সহজ উপায় নেই।


আর্ক সম্পর্কে শুনে নি তবে এটি যাচাই করতে যাচ্ছি। ধন্যবাদ।
এরি বি ফ্রেডম্যান

1
(+1) আবার লিস্প বিশ্ব থেকে শুনতে ভাল লাগল। আমি এক্সপ্লিসটেটের খুব অনুরাগী (এবং প্রশংসা করি যে লুক প্রকল্পটি আর প্রকল্পে এতটা সক্রিয় রয়েছে)।
chl

3

একটি নতুন সফ্টওয়্যার সিস্টেম যা এই লক্ষ্যে আশাব্যঞ্জক বলে মনে হচ্ছে এটি হ'ল ডিডুসার , এটি আর এর উপরে নির্মিত Unfortunately সত্যিকারের প্যাকেজের দিকে নিয়ে যাওয়া লোকদের পানির মাপদণ্ড তাদের উচিত পরে সিদ্ধান্ত নেওয়া উচিত।

আমি অতীতে জেএমপিও ব্যবহার করেছি, এটির সাথে খুব সুন্দর ইন্টারেক্টিভিটি ছিল। আমি উদ্বেগ প্রকাশ করছি যে কোনও কিছু ইন্টারফেস এই উদ্দেশ্যে খুব জটিল হতে পারে। এবং এটি নিখরচায়, যা সম্ভাব্য স্প্রেডশিট শরণার্থীদের পক্ষে ঝকঝকে চেষ্টা করা আরও শক্ত করে তোলে।


এর রয়েছে ঘর্ঘর যা কিছুটা প্রতিশ্রুতি দেখায়।


জেএমপি সম্পর্কে - যদি আমার ভুল না হয় তবে পরীক্ষামূলক সংস্করণ এবং একাডেমিক লাইসেন্স রয়েছে যা যুক্তিসঙ্গত।
ইলেটর

3

প্রাক্তন গুগল শোধনাগার, এখন ওপেন রিফাইন , কী কী ডেটা রয়েছে এবং এটি পরিষ্কার করার জন্য এটি বেশ ভাল জিইউআই। এটি প্রস্তুতির জন্য এবং এক্সেলের মতো কিছু পরিষ্কার করার জন্য অনেক বেশি শক্তিশালী। তারপরে আপনার বিশ্লেষণগুলির জন্য আর-কমান্ডারের মতো কিছুতে স্যুইচ করুন।


2

আর কে উত্তর দেয় বা এর "জিইউআই" এর যে কেউ প্রশ্নটি পড়েনি didn't

এটির জন্য বিশেষত একটি প্রোগ্রাম ডিজাইন করা হয়েছে এবং এটিকে জেএমপি বলা হয়। হ্যাঁ, এটি ব্যয়বহুল, যদিও এটি একটি নিখরচায় পরীক্ষা রয়েছে এবং এটি শিক্ষার্থী বা কলেজের কর্মীদের জন্য (যেমন $ 50 সস্তা) খুব অবিশ্বাস্য is

এছাড়াও রয়েছে র‌্যাপিডমিনার, যা ডেটা মাইনিং এবং পরিসংখ্যান বিশ্লেষণের জন্য একটি ওয়ার্কফ্লো-ভিত্তিক জিইউআই। এটি বিনামূল্যে এবং মুক্ত উত্স।


1
@ নিল কেন এমন হয়? ওপি নির্দিষ্ট করেছে "তবে আদর্শভাবে যা প্রোগ্রামিং পর্যন্ত প্রসারিত হবে ..."। আর-কে প্রায় সমস্ত বাণিজ্যিক (যেমন, এসপিএস, জেএমপি, স্ট্যাটিস্টিকা) বা ফ্রি (নাইম, র্যাপিডমিনিয়ার) পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার এবং রিজার্ভকে আর এর সাথে যোগাযোগের জন্য ব্যাকএন্ড হিসাবে ব্যবহার করা যেতে পারে (যেমন, জিনগত গবেষণার জন্য প্লিংক সফ্টওয়্যার সহ), এবং এটি এই উদ্দেশ্যে ব্যবহৃত হয়। জেএমপির ফ্রি ট্রায়াল সংস্করণ আপনাকে বাহ্যিক ডেটাসেটগুলির সাথে কাজ করতে দেয় না, আমি কি ভুল করছি? (মজার বিষয় হল, আমরা যারা আর এর উত্তর
দিয়েছি

আমি আর পছন্দ করি এবং এর পক্ষে আছি, তবে যে লোকেরা পরিসংখ্যান / ডাটামিনিং শিখতে চায় এবং কীভাবে প্রোগ্রাম করতে হয় তা কীভাবে তা ব্যবহার করতে পারে না তা তারা জানে না। এবং আমি এর সমস্ত গিসের সাথে খেলেছি এবং জ্যাম্পের তুলনায় এগুলি কেবল ভয়াবহ। আমি কেবল সেই দিনের জন্য অপেক্ষা করছি যখন আর এম জেএমপির মতো গুই পায়, তখন সমস্ত মহাবিশ্ব ভাল থাকবে।
নীল ম্যাকগুইগান

-1 পরামর্শ দেওয়ার জন্য যে লোকেরা জবাব দেওয়ার আগে প্রশ্নগুলি না পড়ে এবং কেন জেএমপি বা র‌্যাপিডমিনারের চেয়ে খারাপ কেন কোনও সত্য যুক্তি সরবরাহ না করে। নোট করুন যে সাধারণভাবে আমি সম্মত হই যে আর সবকিছুর উত্তর নয়, তবে এই বিষয়টি সত্যই বাজে হওয়ার সম্ভাবনার সাথে কিছুটা বিপরীত। সুতরাং ডাউনভোট।
এমপিক্টাস

আর দুর্দান্ত, তবে এটি সহজ নয়। তিনি শিরোনামে এটি চেয়েছিলেন।
নিল ম্যাকগুইগান

@ নীল, হ্যাঁ, তবে আপনি যুক্তি দিতে পারেন যে সহজে-এখনও-মজবুত ডেটা এক্সপ্লোরেশনের মতো কোনও জিনিস নেই।
এমপিটকাস

1

ঠিক আছে, এই বিশেষ সরঞ্জামটি আমার শিল্পে জনপ্রিয় (যদিও এটি নকশার দ্বারা শিল্প-নির্দিষ্ট নয়): http://www.umetrics.com/simca

এটি আপনাকে সুপ্ত পরিবর্তনশীল ধরণের মাল্টিভারিয়েট বিশ্লেষণ (পিসিএ এবং পিএলএস) করার অনুমতি দেয় এবং এতে সমস্ত উপস্থিতি ব্যাখ্যামূলক প্লট / গণনা এবং অবদানের প্লট, পরিবর্তনশীল গুরুত্ব প্লট, কিউ 2 গণনা ইত্যাদির মতো জিজ্ঞাসাবাদের সরঞ্জাম অন্তর্ভুক্ত রয়েছে

এটি প্রায়শই হাই-ডাইমেনশনাল (এবং প্রায়শই উচ্চতর সংযুক্ত / কলিনারি) শিল্পকেন্দ্রিক ডেটাসেটগুলিতে ব্যবহৃত হয় যেখানে ওএলএস / এমএলআর টাইপ পদ্ধতি অনুপযুক্ত (যেমন সেন্সরগুলির একটি নৌকা বোঝা, লগ সম্পর্কিত তথ্য ইত্যাদি))

এটি পুরোপুরি জিইউআই পরিবেশে কাজ করে এবং ব্যবহারকারীকে কোডের একটি একক লাইন লিখতে হয় না। দুর্ভাগ্যক্রমে এটি নিখরচায় নয়, এবং প্রোগ্রামিংয়ের মাধ্যমে প্রসারিত করা যায় না।


1

আমার মতে, আপনি যদি নিজেকে পরীক্ষার কোড না করে থাকেন তবে ফলাফলের ভুল এবং ভুল বোঝাবুঝির প্রবণতা রয়েছে।

আমি মনে করি যে তাদের কম্পিউটারের দক্ষতা রয়েছে এমন একটি পরিসংখ্যানবিদ নিয়োগের পরামর্শ দেওয়া উচিত।

যদি সর্বদা একই জিনিসটি করা হয় তবে আপনি অবশ্যই একটি ছোট সরঞ্জাম (ব্ল্যাকবক্স) ব্যবহার করতে পারেন যা স্টাফটি করবে। তবে আমি নিশ্চিত নই যে এটিকে এখনও ডেটা এক্সপ্লোরেশন বলা হয়।


1
আমি কমবেশি অনুভূতির সাথে একমত, তবে আমার মনে হয় না যে অনেকগুলি সেটিংসে এই উচ্চ-মনের দৃষ্টিভঙ্গি সত্যিই সম্ভব।
এরি বি ফ্রেডম্যান

1

আমি জন ফক্সের আর প্যাকেজটি সুপারিশ করব আর কমান্ডার নামে ডাকা:

http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/

এটি এসপিএসএস (বা এর মতো) এর মতো একটি ইউজার ইন্টারফেস তৈরি করে যা নতুনদের জন্য দুর্দান্ত এবং কোনও কোডই ইনপুট করার প্রয়োজন হয় না। এটি সমস্ত ড্রপ-ডাউন বাক্সের মাধ্যমে সম্পন্ন হয় (আপনি কাজ করার সময় আর কনসোলটিও ছোট করতে পারেন)।

আমার কাছে, এই প্যাকেজের সুবিধাটি হ'ল আপনি আর-এর সমস্ত দুর্দান্ত কম্পিউটেশনাল সক্ষমতার সুবিধা নিতে পারবেন যখন একটি ইউজার ইন্টারফেস রয়েছে যা পুরোপুরি নতুনদের জন্য কার্যকর হয়।


1

আরেকটি দরকারী সরঞ্জাম, যদিও কেবল উইন্ডোজের জন্য, স্পটফায়ার - এটি একক এবং জোড়া ভেরিয়েবলগুলির জন্য বিভিন্ন হিস্টোগ্রাম এবং স্ক্রেটার প্লটগুলি দ্রুত দেখার জন্য আমি বেশ দরকারী বলে মনে করি। একটি গবেষণা সরঞ্জাম যা আপনাকে একক ভেরিয়েবলের পাশাপাশি একইসাথে সহজ পরিসংখ্যানের ভিত্তিতে জোড়গুলি রেখায় সহায়তা করে - এইচসিআইএল থেকে হায়ারার্কিকাল ক্লাস্টার এক্সপ্লোরার । এটি সবচেয়ে আকর্ষণীয় ভেরিয়েবল / ভেরিয়েবলের জোড়া সন্ধানের জন্য দুর্দান্ত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.