মতলব এবং পাইথনের মধ্যে কোন পরিসংখ্যান সাধারণ পরিসংখ্যানের ডেটা বিশ্লেষণের জন্য ভাল? প্রতিটি জন্য অ্যাক্সেসযোগ্যতা ব্যতীত বিভিন্ন উপকারিতা এবং কনস কী কী?
মতলব এবং পাইথনের মধ্যে কোন পরিসংখ্যান সাধারণ পরিসংখ্যানের ডেটা বিশ্লেষণের জন্য ভাল? প্রতিটি জন্য অ্যাক্সেসযোগ্যতা ব্যতীত বিভিন্ন উপকারিতা এবং কনস কী কী?
উত্তর:
গত 10+ বছর ধরে একটি ডেইহার্ড মতলব ব্যবহারকারী হিসাবে, আমি আপনাকে পাইথন শিখার প্রস্তাব দিই। আপনি যখন কোনও ভাষাতে যথেষ্ট দক্ষ হয়ে উঠেন, আপনি যখন যে ভাষা শিখছেন সেই ভাষাতে কাজ করার পরে মনে হবে আপনি যথেষ্ট উত্পাদনশীল হচ্ছেন না এবং আপনি আপনার ডিফল্ট সেরা ভাষা ব্যবহারে ফিরে যাবেন। খুব কমপক্ষে, আমি আপনাকে বেশ কয়েকটি ভাষায় সমান দক্ষ হয়ে ওঠার চেষ্টা করার পরামর্শ দিচ্ছি (আমি R এরও পরামর্শ দেব)।
মতলব সম্পর্কে আমি যা পছন্দ করি:
মতলব সম্পর্কে আমি যা পছন্দ করি না:
median
ফাংশন, যা এক ধরণের ডেটা সম্পাদন করে, তারপরে মাঝারি মানটি গ্রহণ করে । 70 এর দশক থেকে এটিই ভুল অ্যালগরিদম।-nojvm
shuffle
কোনও সরঞ্জামবক্সে থাকতে পারে, ম্যাটল্যাব স্টক নয়। বিল্টিনের চেয়ে কমই খারাপ হতে পারে randperm
যা এলোমেলো ভেক্টরের সারণি সূচীটি দেয়। আবার এটি সম্ভবত ভুল অ্যালগরিদম (আমি কেবলমাত্র পরিসংখ্যান সম্পর্কিত এসএমএস-এ নথ-ফিশার-ইয়েটস রদবদলের সম্পর্কে শিখেছি) ..
randperm
এটির বীজ দ্বারা প্রভাবিত হয়েছে randn
, তবে নথ-ফিশার-ইয়েটসের একটি ম্যাক্স-সংস্করণ সম্ভবত অভ্যন্তরীণভাবে র্যান্ডেল বীজ অ্যাক্সেস করতে পারে না এবং সম্ভবত একটি শুদ্ধ। মি। সংস্করণ পরিবর্তিত হবে খুব ধীর হতে হবে।
এটিকে তিনটি ক্ষেত্রে (আমার মাথার উপরের অংশে) ভাঙতে দিন যেখানে প্রোগ্রামিং পরিসংখ্যানগুলি পূরণ করে: ডেটা ক্রাঞ্চিং, সংখ্যাসমূহের রুটিন (অপ্টিমাইজেশন এবং এ জাতীয়) এবং স্ট্যাটিস্টিকাল লাইব্রেরি (মডেলিং ইত্যাদি)।
প্রথমত, সবচেয়ে বড় পার্থক্যটি হল পাইথন একটি সাধারণ উদ্দেশ্য প্রোগ্রামিং ভাষা। যতক্ষণ না আপনার পৃথিবী মোটামুটি একটি কৌতুকসংখ্যার অ্যারে থেকে বিচ্ছিন্ন হয় ততক্ষণ মতলব দুর্দান্ত। একবার আপনি ডেটা মংগিং এবং সম্পর্কিত সমস্যাগুলি মোকাবেলা শুরু করার পরে পাইথন মাতলাবকে ছাড়িয়ে যায়। উদাহরণস্বরূপ, গ্রেগ উইলসনের বইটি দেখুন: ডেটা ক্রাঞ্চিং: জাভা, পাইথন এবং আরও অনেক কিছু ব্যবহার করে প্রতিদিনের সমস্যাগুলি সমাধান করুন ।
দ্বিতীয়ত, মতলব সত্যিই সংখ্যাসূচক কাজ নিয়ে জ্বলজ্বল করে। অনেক গবেষণা সম্প্রদায় এটি ব্যবহার করে এবং আপনি যদি সন্ধানী সংবেদনের সাথে সম্পর্কিত কোনও কাগজের সাথে সম্পর্কিত কিছু অ্যালগরিদমটি খুঁজছেন তবে আপনার মতলব প্রয়োগের সম্ভাবনা অনেক বেশি। অন্যদিকে, মতলব বৈজ্ঞানিক কম্পিউটিংয়ের পিএইচপি জাতীয় - এটি সূর্যের নীচে সমস্ত কিছুর জন্য একটি ফাংশন রাখার চেষ্টা করে। আপনি যদি কোনও প্রোগ্রামিং ল্যাঙ্গুয়েজ গীক হন তবে ফলস্বরূপ নান্দনিকতা এবং আর্কিটেকচার ম্যাডিং করছে but নম্পি / স্কিপির উত্থানের সাথে এর অনেকগুলিই কম স্বতন্ত্র হয়ে উঠেছে, আপনি পাইথনের জন্য অপ্টিমাইজেশন এবং মেশিন লার্নিং গ্রন্থাগারগুলি খুঁজে পাওয়ার সম্ভাবনা সম্ভবত। সি এর সাথে ইন্টারফেসিং উভয় ভাষায়ই সহজ।
মডেলিংয়ের জন্য পরিসংখ্যানের গ্রন্থাগারগুলির উপলভ্যতা এবং আর এর মতো কিছু তুলনায় উভয়েরই কিছুটা ঘাটতি রয়েছে (যদিও আমি সন্দেহ করি যে উভয়ই পরিসংখ্যানমূলক কাজ করে 80% লোকের চাহিদা পূরণ করবে।) পাইথনের দিকের বিষয়গুলির জন্য এই প্রশ্নটি দেখুন : একটি পরিসংখ্যান ওয়ার্কবেঞ্চ হিসাবে পাইথন । মতলব পক্ষের জন্য, আমি জানি যে একটি পরিসংখ্যানের সরঞ্জাম বাক্স রয়েছে, তবে আমি আরও জ্ঞানবান কাউকে শূন্যস্থান পূরণ করতে দেব (মতলবের সাথে আমার অভিজ্ঞতা পরিসংখ্যানের সাথে সম্পর্কিত নয় এমন সংখ্যা সংক্রান্ত কাজেই সীমাবদ্ধ)।
আমি 10 বছর ধরে আগ্রহী মতলব ব্যবহারকারীও হয়েছি। সেই বছরগুলিতে বেশিরভাগ ক্ষেত্রে আমার নিজের কাজের জন্য তৈরি করা টুলবক্সের বাইরে কাজ করার কোনও কারণ ছিল না। যদিও একটি সরঞ্জামবক্সের জন্য অনেকগুলি ক্রিয়াকলাপ তৈরি করা হয়েছিল, তবুও আমার প্রায়শই দ্রুত টার্নআরাউন্ড বিশ্লেষণের জন্য অ্যালগরিদম তৈরি করা প্রয়োজন। যেহেতু এই অ্যালগরিদমগুলি প্রায়শই ম্যাট্রিক্স গণিতকে ব্যবহার করে, মাতলাব আমার কাজের জন্য একজন আদর্শ প্রার্থী ছিলেন। কোডের মতলব টুলবাক্সের পাশাপাশি, আমার গ্রুপের অন্যরা জাভাতে ব্যাপকভাবে কাজ করেছিল যেহেতু ভাষার মধ্যে স্পষ্ট আন্তঃআবন্ধকতা ছিল। কয়েক বছর ধরে আমি মতলবকে নিয়ে পুরোপুরি খুশি ছিলাম, তবে প্রায় 3 বছর আগে আমি মতলব থেকে দূরে স্লো ট্রানজিশন শুরু করার সিদ্ধান্ত নিয়েছিলাম এবং এই বলে খুশি হয়েছি যে আমি এখন প্রায় এক বছরে এটি খুলিনি। এখানে আমার পদক্ষেপের কারণ:
-nodesktop
বিকল্পটি বেশিরভাগ সময় ভাল তবে এতে সমস্যা রয়েছে।এটি মাতলাবকে নিয়ে আমার বেশ কয়েকটি গ্রিপ মাত্র। এটি একটি জ্বলজ্বল বৈশিষ্ট্য: এটি সহজেই কোড দ্রুত লিখতে সহজ (যদি কুশ্রী না হয়)। যদিও আমি এটি ছেড়ে দিয়েছি, এবং আমার সন্ধান আমাকে ক্লোজার-> জাভাস্ক্রিপ্ট-> পাইথন <-> জুলিয়া; হ্যাঁ, আমি পুরো জায়গা জুড়ে ছিলাম।