মতলব এবং পাইথনের মধ্যে কোন ভাষাটি পরিসংখ্যান বিশ্লেষণের পক্ষে ভাল?


17

মতলব এবং পাইথনের মধ্যে কোন পরিসংখ্যান সাধারণ পরিসংখ্যানের ডেটা বিশ্লেষণের জন্য ভাল? প্রতিটি জন্য অ্যাক্সেসযোগ্যতা ব্যতীত বিভিন্ন উপকারিতা এবং কনস কী কী?


2
এটি সম্প্রদায়ের উইকি, আইএমও হওয়া উচিত।
শেন

আপনি কেন আর এর দিকে তাকাতে পারেননি তা বোঝানোর যত্ন নেবেন?
ডার্ক এডেলবুয়েটেল

@ ডির্ক: আমি আর এর কথা খুব কমই শুনেছি। তাছাড়া আমি পাইথনের মতো কিছু প্রোগ্রামিং ল্যাঙ্গুয়েজ শিখতে চেয়েছিলাম এবং তারপরে আবারও আমি মনে করি না আর আর পাইথনের কাছাকাছি, আইএমও। আমি আশা করি এটি আপনার প্রশ্নের উত্তর দিয়েছে।

2
পরিসংখ্যানগত বিশ্লেষণ এবং প্রোগ্রামিংয়ের জন্য লোকেরা কী প্রস্তাব দেয় সে অনুসারে এখানে এবং স্ট্যাকওভারফ্লোতে একটু ঘুরে দেখুন । আমাদের মধ্যে অনেকে মনে করেন যে আর এর কোনও আসল বিকল্প নেই। তবে সৌন্দর্যের মতো এটি দর্শকের চোখে পড়ে, তাই শুভকামনা।
ডিস্ক এডেলবুয়েটেল

জিওস্ট্যাটাস্টিক্সের ক্ষেত্রে (যার মধ্যে আমি আমার পিএইচডি করেছি), আমি মনে করি যে আর খুব ভাল সজ্জিত (জিস্ট্যাট, জিওআর ইত্যাদি দেখুন)। অজগরটিতে ভূ-তাত্ত্বিক কৌশলগুলির সম্পূর্ণ কভারেজ সম্পর্কে আমি কমপক্ষে জানি না। আর কেন "পাইথনের কাছাকাছি কোথাও নেই"? আমি উভয়ই ব্যবহার করেছি এবং জিওস্ট্যাটগুলির জন্য আমি বোধ করি আর স্পষ্টভাবে উচ্চতর is
পল হিমস্ট্র্রা

উত্তর:


29

গত 10+ বছর ধরে একটি ডেইহার্ড মতলব ব্যবহারকারী হিসাবে, আমি আপনাকে পাইথন শিখার প্রস্তাব দিই। আপনি যখন কোনও ভাষাতে যথেষ্ট দক্ষ হয়ে উঠেন, আপনি যখন যে ভাষা শিখছেন সেই ভাষাতে কাজ করার পরে মনে হবে আপনি যথেষ্ট উত্পাদনশীল হচ্ছেন না এবং আপনি আপনার ডিফল্ট সেরা ভাষা ব্যবহারে ফিরে যাবেন। খুব কমপক্ষে, আমি আপনাকে বেশ কয়েকটি ভাষায় সমান দক্ষ হয়ে ওঠার চেষ্টা করার পরামর্শ দিচ্ছি (আমি R এরও পরামর্শ দেব)।

মতলব সম্পর্কে আমি যা পছন্দ করি:

  • আমি এতে দক্ষ।
  • এটি সংখ্যা বিশ্লেষকদের মধ্যে লিঙ্গুয়া ফ্র্যাঙ্কা
  • প্রোফাইলিং সরঞ্জামটি খুব ভাল। এই একমাত্র কারণেই আমি অষ্টভের পরিবর্তে মতলব ব্যবহার করি।
  • এখানে একটি ফ্রিওয়্যার ক্লোন, অক্টাভ রয়েছে, যার রেফারেন্স প্রয়োগের সাথে ভাল সম্মতি রয়েছে।

মতলব সম্পর্কে আমি যা পছন্দ করি না:

  • তৃতীয় পক্ষের (ফ্রি বা অন্যথায়) প্যাকেজ এবং স্ক্রিপ্টগুলি পরিচালনা করার মতো ভাল সিস্টেম নেই। ম্যাথওয়ার্কস 'সেন্ট্রাল ফাইল এক্সচেঞ্জ' নিয়ন্ত্রণ করে এবং অ্যাড-অন প্যাকেজগুলি ইনস্টল করা খুব জটিল বলে মনে হয়, আর যে দুর্দান্ত সিস্টেম রয়েছে তার মতো কিছুই নেই। তদুপরি, ম্যাথওয়ার্কসের এই পরিস্থিতির উন্নতি করার কোনও উত্সাহ নেই, কারণ তারা সরঞ্জাম বাক্সগুলি বিক্রয় করে অর্থোপার্জন করে, যা ফ্রিওয়্যার প্যাকেজগুলির সাথে প্রতিযোগিতা করে;
  • মতলব সমান্তরাল গণনার জন্য লাইসেন্স অত্যন্ত ব্যয়বহুল;
  • দক্ষতা এবং / বা ব্যবহারযোগ্যতার ব্যয়ে অনেকগুলি টুলবক্স ফাংশন এবং কিছু বিল্টইন সহ বেশিরভাগ এম-কোড স্পষ্টতই সঠিক হওয়ার জন্য ডিজাইন করা হয়েছিল। এর সর্বাধিক সুস্পষ্ট উদাহরণ মাতলাবের medianফাংশন, যা এক ধরণের ডেটা সম্পাদন করে, তারপরে মাঝারি মানটি গ্রহণ করে । 70 এর দশক থেকে এটিই ভুল অ্যালগরিদম।
  • ফাইলগুলিতে গ্রাফ সংরক্ষণ করা মাতালাবের মধ্যে সেরা od
  • ম্যাথওয়ার্কস বেল ​​এবং হুইসেল যুক্ত করতে থাকা সত্ত্বেও, আমি গত 5 বছরে আমার ব্যবহারকারীর অভিজ্ঞতা উন্নত করতে পাইনি (যখন আমি অকটভের পরিবর্তে মতলব ব্যবহার শুরু করি)। এটি ইঙ্গিত দেয় যে আমি তাদের টার্গেট গ্রাহক নই, তারা বিদ্যুৎ ব্যবহারকারীর জন্য জিনিসকে আরও খারাপ করে মার্কেট শেয়ার প্রসারিত করতে চাইছেন।
  • মতলবতে এখন অবজেক্ট-ওরিয়েন্টেড প্রোগ্রামিং করার 2 টি উপায় রয়েছে যা সর্বোপরি বিভ্রান্তিকর। পুরানো স্টাইল ব্যবহার করে লিগ্যাসি কোডটি কিছু সময়ের জন্য স্থির থাকবে।
  • মতলব ইউআই জাভাতে লেখা হয়েছে, যা মেমরি পরিচালনা সম্পর্কে অপ্রীতিকর ধারণা রাখে।

+1, ভাল পয়েন্ট। এর উপর: "মেমরি পরিচালনা সম্পর্কে অপ্রীতিকর ধারণা" .. আকর্ষণীয়, আপনি কী ব্যাখ্যা করতে পারেন?
Ars

1
আমার স্মৃতি কোথাও চলেছে ; মতলব ব্যবহারের বাইরে জাভা নিয়ে আমার অভিজ্ঞতা ইঙ্গিত দেয় যে এটি সম্ভবত অপরাধী, এবং -nojvm
ছুটে চলা

আমার ম্যাটল্যাব অদ্ভুত অন্তর্নির্মিত কোডগুলির প্রিয় উদাহরণটি হ'ল শিফেল যা নতুনভাবে তৈরি হওয়া এলোমেলো ভেক্টরকে বাছাই করে অর্ডার দিয়ে ফিরে আসা ডেটাটিকে পুনরায় সাজায়।

1
@ এমবিকিউ: shuffleকোনও সরঞ্জামবক্সে থাকতে পারে, ম্যাটল্যাব স্টক নয়। বিল্টিনের চেয়ে কমই খারাপ হতে পারে randpermযা এলোমেলো ভেক্টরের সারণি সূচীটি দেয়। আবার এটি সম্ভবত ভুল অ্যালগরিদম (আমি কেবলমাত্র পরিসংখ্যান সম্পর্কিত এসএমএস-এ নথ-ফিশার-ইয়েটস রদবদলের সম্পর্কে শিখেছি) ..
শাব্বিচেফ

1
@ এমবিকিউ: অন্যান্য ভাল অংশটি randpermএটির বীজ দ্বারা প্রভাবিত হয়েছে randn, তবে নথ-ফিশার-ইয়েটসের একটি ম্যাক্স-সংস্করণ সম্ভবত অভ্যন্তরীণভাবে র্যান্ডেল বীজ অ্যাক্সেস করতে পারে না এবং সম্ভবত একটি শুদ্ধ। মি। সংস্করণ পরিবর্তিত হবে খুব ধীর হতে হবে।
shabbychef

11

এটিকে তিনটি ক্ষেত্রে (আমার মাথার উপরের অংশে) ভাঙতে দিন যেখানে প্রোগ্রামিং পরিসংখ্যানগুলি পূরণ করে: ডেটা ক্রাঞ্চিং, সংখ্যাসমূহের রুটিন (অপ্টিমাইজেশন এবং এ জাতীয়) এবং স্ট্যাটিস্টিকাল লাইব্রেরি (মডেলিং ইত্যাদি)।

প্রথমত, সবচেয়ে বড় পার্থক্যটি হল পাইথন একটি সাধারণ উদ্দেশ্য প্রোগ্রামিং ভাষা। যতক্ষণ না আপনার পৃথিবী মোটামুটি একটি কৌতুকসংখ্যার অ্যারে থেকে বিচ্ছিন্ন হয় ততক্ষণ মতলব দুর্দান্ত। একবার আপনি ডেটা মংগিং এবং সম্পর্কিত সমস্যাগুলি মোকাবেলা শুরু করার পরে পাইথন মাতলাবকে ছাড়িয়ে যায়। উদাহরণস্বরূপ, গ্রেগ উইলসনের বইটি দেখুন: ডেটা ক্রাঞ্চিং: জাভা, পাইথন এবং আরও অনেক কিছু ব্যবহার করে প্রতিদিনের সমস্যাগুলি সমাধান করুন

দ্বিতীয়ত, মতলব সত্যিই সংখ্যাসূচক কাজ নিয়ে জ্বলজ্বল করে। অনেক গবেষণা সম্প্রদায় এটি ব্যবহার করে এবং আপনি যদি সন্ধানী সংবেদনের সাথে সম্পর্কিত কোনও কাগজের সাথে সম্পর্কিত কিছু অ্যালগরিদমটি খুঁজছেন তবে আপনার মতলব প্রয়োগের সম্ভাবনা অনেক বেশি। অন্যদিকে, মতলব বৈজ্ঞানিক কম্পিউটিংয়ের পিএইচপি জাতীয় - এটি সূর্যের নীচে সমস্ত কিছুর জন্য একটি ফাংশন রাখার চেষ্টা করে। আপনি যদি কোনও প্রোগ্রামিং ল্যাঙ্গুয়েজ গীক হন তবে ফলস্বরূপ নান্দনিকতা এবং আর্কিটেকচার ম্যাডিং করছে but নম্পি / স্কিপির উত্থানের সাথে এর অনেকগুলিই কম স্বতন্ত্র হয়ে উঠেছে, আপনি পাইথনের জন্য অপ্টিমাইজেশন এবং মেশিন লার্নিং গ্রন্থাগারগুলি খুঁজে পাওয়ার সম্ভাবনা সম্ভবত। সি এর সাথে ইন্টারফেসিং উভয় ভাষায়ই সহজ।

মডেলিংয়ের জন্য পরিসংখ্যানের গ্রন্থাগারগুলির উপলভ্যতা এবং আর এর মতো কিছু তুলনায় উভয়েরই কিছুটা ঘাটতি রয়েছে (যদিও আমি সন্দেহ করি যে উভয়ই পরিসংখ্যানমূলক কাজ করে 80% লোকের চাহিদা পূরণ করবে।) পাইথনের দিকের বিষয়গুলির জন্য এই প্রশ্নটি দেখুন : একটি পরিসংখ্যান ওয়ার্কবেঞ্চ হিসাবে পাইথন । মতলব পক্ষের জন্য, আমি জানি যে একটি পরিসংখ্যানের সরঞ্জাম বাক্স রয়েছে, তবে আমি আরও জ্ঞানবান কাউকে শূন্যস্থান পূরণ করতে দেব (মতলবের সাথে আমার অভিজ্ঞতা পরিসংখ্যানের সাথে সম্পর্কিত নয় এমন সংখ্যা সংক্রান্ত কাজেই সীমাবদ্ধ)।


মতলব-এ পরিসংখ্যানের সরঞ্জামবাক্সগুলি বেশ মজাদার। আর এর মতো কিছু আছে কি, উদাহরণস্বরূপ আপনি দ্রুত বিভিন্ন ফাংশন ফিট (রিগ্রেশনস) এর গুচ্ছটি চেষ্টা করে দেখতে পারেন?
অ্যালেক্স আর

6

আমি 10 বছর ধরে আগ্রহী মতলব ব্যবহারকারীও হয়েছি। সেই বছরগুলিতে বেশিরভাগ ক্ষেত্রে আমার নিজের কাজের জন্য তৈরি করা টুলবক্সের বাইরে কাজ করার কোনও কারণ ছিল না। যদিও একটি সরঞ্জামবক্সের জন্য অনেকগুলি ক্রিয়াকলাপ তৈরি করা হয়েছিল, তবুও আমার প্রায়শই দ্রুত টার্নআরাউন্ড বিশ্লেষণের জন্য অ্যালগরিদম তৈরি করা প্রয়োজন। যেহেতু এই অ্যালগরিদমগুলি প্রায়শই ম্যাট্রিক্স গণিতকে ব্যবহার করে, মাতলাব আমার কাজের জন্য একজন আদর্শ প্রার্থী ছিলেন। কোডের মতলব টুলবাক্সের পাশাপাশি, আমার গ্রুপের অন্যরা জাভাতে ব্যাপকভাবে কাজ করেছিল যেহেতু ভাষার মধ্যে স্পষ্ট আন্তঃআবন্ধকতা ছিল। কয়েক বছর ধরে আমি মতলবকে নিয়ে পুরোপুরি খুশি ছিলাম, তবে প্রায় 3 বছর আগে আমি মতলব থেকে দূরে স্লো ট্রানজিশন শুরু করার সিদ্ধান্ত নিয়েছিলাম এবং এই বলে খুশি হয়েছি যে আমি এখন প্রায় এক বছরে এটি খুলিনি। এখানে আমার পদক্ষেপের কারণ:

  • আমি অনলাইন এবং অফলাইন কম্পিউটিং সিস্টেমের সাথে কাজ করি, লাইসেন্সিং সিস্টেমটি সর্বদা মাথা ব্যথার কারণ ছিল। এটি সর্বদা মনে হয়েছিল যে আমাদের যখন মাতলাবকে সবচেয়ে বেশি প্রয়োজন তখন লাইসেন্সটির মেয়াদ শেষ হয়ে যায় বা হঠাৎ করেই সমস্যা হয় issues এটি সর্বদা মাথা ব্যথা ছিল। এছাড়াও, যদি আমাদের কখনও কোড ভাগ করে নেওয়া দরকার হয় এবং অন্য পক্ষের একই সরঞ্জামবক্সগুলির জন্য লাইসেন্স না রয়েছে, এটি মাথা ব্যথার সৃষ্টি করে। এটি নিখরচায় নয়
  • আমার প্রায়শই উপস্থাপনা তৈরি করা দরকার। যদিও মতলব পরিসংখ্যান তৈরির জন্য বিস্তৃত সরঞ্জাম সরবরাহ করে যা এটি অ্যালগোরিদম ডিজাইনের জন্য খুব শক্তিশালী করে তোলে, তবে চিত্রটি এমনভাবে সংরক্ষণ করে যাতে এটি উপস্থাপনের মধ্যে প্রবেশ করা যায় could এবং দেখতে সুন্দর দেখাচ্ছে কোনও সহজ কাজ নয়। সমস্ত আবর্জনা অপসারণ করতে, ফন্টগুলি ঠিক করতে এবং লাইনগুলি পরিষ্কার করতে আমাকে প্রায়শই অ্যাডোব চিত্রকের মধ্যে একটি ইপিএস ফাইল toোকাতে হত। (এক্সপোর্ট_ফিগ.এম) হলেও ফাইল এক্সচেঞ্জে এটির সহায়তার জন্য কয়েকটি সরঞ্জাম রয়েছে।
  • আমি প্রায়শই অন্যের কাছ থেকে মতলব কোড পাই। যখন এটি ঘটে, আমি প্রায়শই এটি আবার লিখি কারণ: তাদের এপিআই আমার ডেটার সাথে সামঞ্জস্যপূর্ণ নয়, তাদের কোডটি কোনও অর্থবোধ করে না, এটি ধীর গতিযুক্ত, আমার যা প্রয়োজন তা আউটপুট দেয় না ... মূলত মতলবতে যারা বিকাশ করেন তারা হ'ল সফ্টওয়্যার প্রকৌশলী নয় এবং মতলব কোনও ধরণের ডিজাইনের নীতিকে উত্সাহ দেয় না।
  • আমি শক্তি ব্যবহারকারী আমি টার্মিনাল পছন্দ করি আমি জিইউআইকে ঘৃণা করি - এটি ঘৃণা করি। এবং যখন তারা "উইন্ডোজ" স্টাইলের ফিতা যুক্ত করেছিল, তখন আমি এটিকে আরও ঘৃণা করি। মূলত জিইউআইয়ের কাছে তাদের টুইটগুলি এবং ভয়ানক মেমরি পরিচালনা আমার শেষ বোতামটি ঠেলা দিয়েছিল এবং আমি চলে যাওয়ার সিদ্ধান্ত নিয়েছিলাম। ব্যবহার করে-nodesktopবিকল্পটি বেশিরভাগ সময় ভাল তবে এতে সমস্যা রয়েছে।
  • ফাংশনগুলির নকশা করার অনেকগুলি সম্ভাবনা (ওও ব্যবহার করে বা কার্যকরী নকশা) তবে কিছুই অনুভব করেনা কোনওটিই সঠিক না, বেশিরভাগই অ্যাডহক বোধ করে। মতলবতে ভাল ফাংশন ডিজাইন করে সন্তুষ্টি পাই না
  • সম্প্রদায়টি বড়, তবে ভাল কোড ভাগ করে নেওয়া এবং এটি সন্ধান করা সহজ নয়। ফাইল এক্সচেঞ্জটি দুর্দান্ত নয়।

এটি মাতলাবকে নিয়ে আমার বেশ কয়েকটি গ্রিপ মাত্র। এটি একটি জ্বলজ্বল বৈশিষ্ট্য: এটি সহজেই কোড দ্রুত লিখতে সহজ (যদি কুশ্রী না হয়)। যদিও আমি এটি ছেড়ে দিয়েছি, এবং আমার সন্ধান আমাকে ক্লোজার-> জাভাস্ক্রিপ্ট-> পাইথন <-> জুলিয়া; হ্যাঁ, আমি পুরো জায়গা জুড়ে ছিলাম।

  • ক্লোজার: সুন্দর কার্যকরী ভাষা। ক্লোজার ব্যবহার করার জন্য আমার কারণটি ছিল জাভা স্ক্রিপ্ট করার ক্ষমতা। আমাদের প্রচুর "বিগ" কোড বেসটি জাভাতে রয়েছে, তাই এটি প্রচুর অর্থবোধ করে। সেই সময়ে প্রচুর বৈজ্ঞানিক প্রক্রিয়াকরণ সহজেই পাওয়া যায় নি, এবং ভিজ্যুয়ালাইজেশনের মাধ্যমেও খুব একটা ছিল না। তবে আমি মনে করি এটি পরিবর্তন হচ্ছে।
  • জাভাস্ক্রিপ্ট: http://julialang.org/ এ মাপদণ্ড দেখার পরে এবং যেহেতু আমি অবশ্যই D3 এর দর্শন ক্ষমতাতে আগ্রহী ছিলাম জাভাস্ক্রিপ্ট চেষ্টা করার সিদ্ধান্ত নিয়েছি। জাভাস্ক্রিপ্ট আশ্চর্যজনকভাবে খুব দ্রুত। তবে আপনি যদি সত্যিই নিজেকে ঘৃণা করতে চান তবে জাভাস্ক্রিপ্ট শিখুন।
  • পাইথন: পাইথনের একটি চমত্কার সম্প্রদায় রয়েছে এবং প্রচুর দুর্দান্ত প্রকল্প চলছে। আইপিথন নোটবুক অনেক কারণেই আশ্চর্যজনক (তাদের মধ্যে একটি সাধারণ অনুলিপি / পাওয়ারপয়েন্টে পরিসংখ্যানগুলির অতীত)। নম্পপি / সাইপাই / সায়কিট-লার্ন / পান্ডাসের মতো প্রকল্পগুলি পাইথনটিকে সত্যই মজাদার এবং ব্যবহার সহজ করে তুলেছে। একাধিক কোর বা ক্লাস্টারে এটি ব্যবহার করা এত সহজ। আমি স্যুইচ জন্য সত্যিই খুশি হয়েছে।
  • জুলিয়া: জুলিয়া আশ্চর্যজনক। বিশেষত মতলব ব্যবহারকারীদের জন্য। এটি যদিও এটি শৈশবকালীন, তাই প্রচুর পরিবর্তন চলছে। পাইথনের অন্যতম বড় অসুবিধা হ'ল এটিতে মাতলাবের যে সমস্ত বিল্ট-ইন কার্যকারিতা নেই। শিওর নুমপি / সায়পিওয়াই সেই কার্যকারিতাটি নিয়ে আসে তবে এটি অন্তর্নির্মিত নয় এবং খাঁটি পাইথন অবজেক্ট বা ন্যালি অবজেক্ট হতে হবে সে সম্পর্কে আপনাকে সিদ্ধান্ত নিতে হবে। জুলিয়া মুলত মাতলাব থেকে পাইথন এসেছিল এমন সমস্ত কিছু আছে। আমি অপেক্ষা করেছি, তবে এটি ভবিষ্যতে মতলব ব্যবহারকারীদের জন্য সেরা বিকল্প।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.