ড্রু কনওয়ে ডেটা সায়েন্স ভেন ডায়াগ্রাম প্রকাশ করেছে , যার সাথে আমি আন্তরিকভাবে একমত:
একদিকে আপনার সত্যিকারের পোস্টটি পড়া উচিত। অন্যদিকে, আমি আমার নিজের অভিজ্ঞতার প্রস্তাব দিতে পারি: আমার বিষয়াদির দক্ষতা (যা আমি "সাবস্টেটিভ এক্সপার্টাইজ" এর চেয়ে একটি শব্দ হিসাবে বেশি পছন্দ করি, কারণ আপনারও গণিত / পরিসংখ্যান এবং হ্যাকিংয়ের ক্ষেত্রে "সাবস্টেটিভ এক্সপার্টাইজ" থাকা উচিত) খুচরা ব্যবসা, আমার গণিত / পরিসংখ্যান পূর্বাভাস এবং অনুমানমূলক পরিসংখ্যান, এবং আমার হ্যাকিং দক্ষতা আর।
এই ভ্যানটেজ পয়েন্ট থেকে, আমি খুচরা বিক্রেতাদের সাথে কথা বলতে এবং বুঝতে পারি, এবং যার কাছে এই ক্ষেত্রের কমপক্ষে একটি উত্তীর্ণ জ্ঞান নেই তাকে খুচরা বিক্রেতাদের সাথে একটি প্রকল্পে খাড়া শেখার বক্ররেখার মুখোমুখি হতে হবে । সাইড গিগ হিসাবে, আমি মনোবিজ্ঞানে পরিসংখ্যান করি এবং এটি সেখানে ঠিক একই রকম। এমনকি ডায়াগ্রামের হ্যাকিং / গণিত / পরিসংখ্যান অংশ সম্পর্কে বেশ কিছুটা জ্ঞান থাকা সত্ত্বেও, ক্রেডিট স্কোরিং বা অন্য কোনও নতুন বিষয় ক্ষেত্রের গতি বাড়াতে আমার খুব অসুবিধা হবে।
একবার আপনি গণিত / পরিসংখ্যান এবং হ্যাকিং দক্ষতা একটি নির্দিষ্ট পরিমাণ আছে, এটা অনেক ভাল যুক্ত করতে চেয়ে এক বা একাধিক বিষয়ে একটি ভিত্তি অর্জন এখনো আপনার হ্যাকিং দক্ষতা আরেকটি প্রোগ্রামিং ভাষা, বা এখনোআপনার গণিত / পরিসংখ্যানের পোর্টফোলিওটিতে অন্য একটি মেশিন লার্নিং অ্যালগরিদম। সর্বোপরি, আপনার যদি একবার শক্ত গণিত / পরিসংখ্যান / হ্যাকিং গ্রাউন্ডিং হয়ে যায় তবে প্রয়োজন হয় আপেক্ষিক স্বল্প সময়ের মধ্যে ওয়েবে বা পাঠ্যপুস্তক থেকে এই জাতীয় সরঞ্জামগুলি শিখতে। তবে বিষয়টির দক্ষতা, অন্যদিকে, আপনি শূন্য থেকে শুরু করলে সম্ভবত আপনি স্ক্র্যাচ থেকে শিখতে পারবেন না। এবং ক্লায়েন্টরা বরং আরও কিছু ডেটা বিজ্ঞানী এ এর সাথে কাজ করবে যারা তাদের নির্দিষ্ট ক্ষেত্রটি অন্য কোনও ডেটা বিজ্ঞানী বিয়ের চেয়ে ভালভাবে বুঝতে পারে যাদের প্রথমে বেসিকগুলি শেখার প্রয়োজন - এমনকি বি গণিত / পরিসংখ্যান / হ্যাকিংয়ের ক্ষেত্রেও ভাল is
অবশ্যই, এই সব এ অর্থও আপনি কখনই একজন বিশেষজ্ঞ হয়ে যাবে যে হবে পারেন তিন ক্ষেত্র। তবে এটি দুর্দান্ত, কারণ আপনি একজন ডেটা বিজ্ঞানী, কোনও প্রোগ্রামার বা পরিসংখ্যানবিদ বা বিষয় বিশেষজ্ঞ নয়। তিনটি পৃথক চেনাশোনাতে সর্বদা এমন লোক থাকবে যাদের কাছ থেকে আপনি শিখতে পারেন। যা আমি ডেটা সায়েন্স সম্পর্কে পছন্দ করি তার একটি অংশ।
সম্পাদনা: কিছুক্ষণ পরে এবং কিছু চিন্তাভাবনা পরে, আমি এই পোস্টটি ডায়াগ্রামের নতুন সংস্করণ সহ আপডেট করতে চাই। আমি এখনও মনে করি যে হ্যাকিং দক্ষতা, গণিত ও পরিসংখ্যান জ্ঞান এবং সাবস্টিটিভ এক্সপার্টিস ("প্রোগ্রামিং", "পরিসংখ্যান" এবং "ব্যবসায়ের জন্য স্বচ্ছলতার জন্য সংক্ষিপ্ত) গুরুত্বপূর্ণ ... তবে আমি মনে করি যে যোগাযোগের ভূমিকাটিও গুরুত্বপূর্ণ"। আপনার হ্যাকিং, পরিসংখ্যান এবং ব্যবসায়িক দক্ষতার উপকারের মাধ্যমে আপনি যে সমস্ত অন্তর্দৃষ্টি অর্জন করেছেন সেগুলি যদি না এমন লোকের সাথে যোগাযোগ করতে না পারে তবে যাদের জ্ঞানের সেই অনন্য মিশ্রণ নাও থাকতে পারে unless আপনার ব্যবসায়ের ব্যবস্থাপকের কাছে আপনার পরিসংখ্যান অন্তর্দৃষ্টি ব্যাখ্যা করার প্রয়োজন হতে পারে যার অর্থ ব্যয় করা বা প্রক্রিয়া পরিবর্তন করার জন্য দৃ be় বিশ্বাসের প্রয়োজন। অথবা এমন কোনও প্রোগ্রামারকে যারা স্ট্যাটিস্টিকালি ভাবেন না।
সুতরাং এখানে নতুন ডেটা সায়েন্স ভেন ডায়াগ্রাম রয়েছে, যার মধ্যে যোগাযোগকে একটি অপরিহার্য উপাদান হিসাবে অন্তর্ভুক্ত করা হয়েছে। মনে রাখতে সহজ হওয়ার সাথে সাথে আমি অঞ্চলগুলিকে এমনভাবে লেবেল দিয়েছি যাতে সর্বাধিক জ্বলন্ত গ্যারান্টি দেওয়া উচিত।
মন্তব্য দূরে।
আর কোড:
draw.ellipse <- function(center,angle,semimajor,semiminor,radius,h,s,v,...) {
shape <- rbind(c(cos(angle),-sin(angle)),c(sin(angle),cos(angle))) %*% diag(c(semimajor,semiminor))
tt <- seq(0,2*pi,length.out=1000)
foo <- matrix(center,nrow=2,ncol=length(tt),byrow=FALSE) + shape%*%(radius*rbind(cos(tt),sin(tt)))
polygon(foo[1,],foo[2,],col=hsv(h,s,v,alpha=0.5),border="black",...)
}
name <- function(x,y,label,cex=1.2,...) text(x,y,label,cex=cex,...)
png("Venn.png",width=600,height=600)
opar <- par(mai=c(0,0,0,0),lwd=3,font=2)
plot(c(0,100),c(0,90),type="n",bty="n",xaxt="n",yaxt="n",xlab="",ylab="")
draw.ellipse(center=c(30,30),angle=0.75*pi,semimajor=2,semiminor=1,radius=20,h=60/360,s=.068,v=.976)
draw.ellipse(center=c(70,30),angle=0.25*pi,semimajor=2,semiminor=1,radius=20,h=83/360,s=.482,v=.894)
draw.ellipse(center=c(48,40),angle=0.7*pi,semimajor=2,semiminor=1,radius=20,h=174/360,s=.397,v=.8)
draw.ellipse(center=c(52,40),angle=0.3*pi,semimajor=2,semiminor=1,radius=20,h=200/360,s=.774,v=.745)
name(50,90,"The Data Scientist Venn Diagram",pos=1,cex=2)
name(8,62,"Communi-\ncation",cex=1.5,pos=3)
name(30,78,"Statistics",cex=1.5)
name(70,78,"Programming",cex=1.5)
name(92,62,"Business",cex=1.5,pos=3)
name(10,45,"Hot\nAir")
name(90,45,"The\nAccountant")
name(33,65,"The\nData\nNerd")
name(67,65,"The\nHacker")
name(27,50,"The\nStats\nProf")
name(73,50,"The\nIT\nGuy")
name(50,55,"R\nCore\nTeam")
name(38,38,"The\nGood\nConsultant")
name(62,38,"Drew\nConway's\nData\nScientist")
name(50,24,"The\nperfect\nData\nScientist!")
name(31,18,"Comp\nSci\nProf")
name(69,18,"The\nNumber\nCruncher")
name(42,11,"Head\nof IT")
name(58,11,"Ana-\nlyst")
name(50,5,"The\nSalesperson")
par(opar)
dev.off()