তথ্য বিজ্ঞান

ডেটা সায়েন্স পেশাদার, মেশিন লার্নিং বিশেষজ্ঞ এবং ক্ষেত্র সম্পর্কে আরও শিখতে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর


4
ক্লাস্টারিংয়ের আগে কি আপনার ডেটা মানক করা দরকার?
গুচ্ছের আগে কি আপনার ডেটা মানক করা দরকার? scikit learnডিবিএসসিএন সম্পর্কে উদাহরণস্বরূপ , তারা এখানে লাইনে এটি করে: X = StandardScaler().fit_transform(X) তবে কেন এটি প্রয়োজনীয় তা আমি বুঝতে পারি না। সর্বোপরি, ক্লাস্টারিং ডেটাগুলির কোনও নির্দিষ্ট বিতরণ অনুমান করে না - এটি একটি নিরীক্ষণযোগ্য শেখার পদ্ধতি তাই এর উদ্দেশ্যটি ডেটা অন্বেষণ …

3
কে-অর্থ হ'ল কনো পদ্ধতি, বিআইসিসি, রূপান্তরিত ব্যাখ্যা এবং সিলুয়েট সহ কে কে নির্বাচন করা বেমানান আচরণ
আমি কে-মানে দিয়ে 90 টি বৈশিষ্ট্য সহ কিছু ভেক্টরকে গুচ্ছ করার চেষ্টা করছি। যেহেতু এই অ্যালগরিদম আমাকে ক্লাস্টারের সংখ্যা জিজ্ঞাসা করেছে, তাই আমি আমার পছন্দটিকে কিছু চমৎকার গণিত দিয়ে বৈধ করতে চাই। আমি 8 থেকে 10 টি ক্লাস্টার আশা করি expect বৈশিষ্ট্যগুলি জেড স্কোরকে মাপানো। কনুই পদ্ধতি এবং বৈকল্পিক ব্যাখ্যা …

7
উচ্চ মাত্রিক ডেটা ভিজ্যুয়ালাইজ করার উদ্দেশ্য?
টি-এসএনই, আইসোম্যাপ, পিসিএ, তদারকি করা পিসিএ ইত্যাদির মতো হাই ডাইমেনশন ডেটাসেটগুলি ভিজ্যুয়ালাইজ করার জন্য অনেক কৌশল রয়েছে এবং আমরা ডেটা 2 ডি বা 3 ডি স্পেসে প্রজেক্ট করার গতিতে চলে যাই, সুতরাং আমাদের কাছে "সুন্দর ছবিগুলি" রয়েছে "। এই এম্বেডিং (নানাবিধ লার্নিং) পদ্ধতির কিছু বর্ণনা করা হয় এখানে । কিন্তু …

5
আমি কীভাবে বিভিন্ন ডেটা ফ্রেমে কলামগুলি তুলনা করব?
আমি একটি ডিএফের একটি কলাম অন্য ডিএফ এর সাথে তুলনা করতে চাই। কলামগুলি নাম এবং শেষ নাম। আমি যাচাই করতে চাই যে একটি ডেটা ফ্রেমের কোনও ব্যক্তি অন্য একটিতে আছে কিনা।
23 pandas  dataframe 

6
বিভাগ এবং সংখ্যা হিসাবে মাস এবং ঘন্টা এর মতো এনকোডিং বৈশিষ্ট্য?
মেশিন লার্নিং মডেলটিতে ফ্যাক্টর বা সংখ্যা হিসাবে মাস এবং ঘন্টাের মতো বৈশিষ্ট্যগুলি এনকোড করা ভাল? একদিকে আমি অনুভব করেছি যে সংখ্যার এনকোডিংটি যুক্তিসঙ্গত হতে পারে, কারণ সময়টি একটি অগ্রগতির অগ্রগতি প্রক্রিয়া (পঞ্চম মাসের পরে ষষ্ঠ মাস অনুসরণ করা হয়) তবে অন্যদিকে আমি মনে করি চক্রীয় প্রকৃতির কারণে শ্রেণিবদ্ধ এনকোডিং আরও …

4
এক্সজিবিস্ট নিজে থেকেই বহুবিধ লাইন পরিচালনা করে?
আমি বর্তমানে 21 টি বৈশিষ্ট্য (প্রায় 150 টি বৈশিষ্ট্যের তালিকা থেকে নির্বাচিত) সহ ডেটা-সেটে এক্সজিবিস্ট ব্যবহার করছি, তারপরে এক-হট তাদের কোডড করে ~ 98 বৈশিষ্ট্যগুলি প্রাপ্ত করতে। এই 98 বৈশিষ্ট্য কয়েক উদাহরণস্বরূপ, কিছুটা অপ্রয়োজনীয় আছেন: একটি পরিবর্তনশীল (বৈশিষ্ট) এছাড়াও হিসাবে প্রদর্শিত হবে এবং ।একজনএকজনAবিএকজনবিএকজন\frac{B}{A}সিএকজনসিএকজন\frac{C}{A} আমার প্রশ্নগুলি হ'ল: কীভাবে ( যদি? …

2
গ্রিড অনুসন্ধানের আউটপুট কীভাবে ব্যবহার করবেন?
আমি বর্তমানে পাইথন এবং সাইকিটকে শ্রেণিবদ্ধকরণের উদ্দেশ্যে শিখার সাথে কাজ করছি এবং গ্রিড অনুসন্ধানের আশেপাশে কিছু পড়া করছি আমি ভেবেছিলাম সেরা ফলাফল পাওয়ার জন্য আমার অনুমানের পরামিতিগুলি অনুকূল করে তোলার জন্য এটি দুর্দান্ত উপায়। আমার পদ্ধতিটি হ'ল: প্রশিক্ষণ / পরীক্ষায় আমার ডেটা বিভক্ত করুন। হাইপার প্যারামিটারগুলির সর্বোত্তম সংমিশ্রণের সাথে সেরা …

2
শক্তিবৃদ্ধি শেখার বুটস্ট্র্যাপিং ঠিক কী?
স্পষ্টতই, শক্তিবৃদ্ধি শেখার ক্ষেত্রে, টেম্পোরাল-ডিফারেন্স (টিডি) পদ্ধতিটি একটি বুটস্ট্র্যাপিং পদ্ধতি ra অন্যদিকে, মন্টি কার্লো পদ্ধতিগুলি বুটস্ট্র্যাপিং পদ্ধতি নয়। আরএল-এ বুটস্ট্র্যাপিং ঠিক কী? আরএল-তে বুটস্ট্র্যাপিং পদ্ধতি কী?

3
ট্রান্সফর্মার মডেলটিতে অবস্থানগত এনকোডিং কী?
আমি এমএল এ নতুন এবং এটি আমার এখানে প্রথম প্রশ্ন, তাই দুঃখিত যদি আমার প্রশ্নটি মূর্খ হয়। আমি কাগজটি পড়ার এবং বোঝার চেষ্টা করছি আপনার দৃষ্টি আকর্ষণ করা দরকার এবং এটিতে একটি চিত্র রয়েছে: অবস্থানগত এনকোডিং কী তা আমি জানি না । কিছু ইউটিউব ভিডিও শুনে আমি জানতে পেরেছি যে …

6
একটি দলের মধ্যে জুপিটার নোটবুকগুলি ভাগ করা
আমি একটি সার্ভার সেট আপ করতে চাই যা নিম্নলিখিত উপায়ে একটি ডেটা সায়েন্স টিমকে সমর্থন করতে পারে: স্ট্যান্ডিং, ভার্শনিং, ভাগ করে নেওয়া এবং জপিটার নোটবুকগুলি কার্যকর করার জন্য একটি কেন্দ্রীয় পয়েন্ট হয়ে উঠুন। কিছু কাঙ্ক্ষিত বৈশিষ্ট্য: বিভিন্ন ব্যবহারকারী সার্ভার অ্যাক্সেস করতে পারে এবং নোটবুকগুলি তাদের দ্বারা বা দলের সদস্যদের দ্বারা …

3
ইনপুট ডেটাতে বৈশিষ্ট্যটির রূপান্তর
আমি এই ওটিটিও কেগল চ্যালেঞ্জের সমাধান সম্পর্কে পড়ছিলাম এবং প্রথম স্থানের সমাধানটি ইনপুট ডেটা এক্সের জন্য বেশ কয়েকটি রূপান্তর ব্যবহার করেছে বলে মনে হচ্ছে, উদাহরণস্বরূপ লগ (এক্স + 1), স্কয়ার্ট (এক্স + 3/8), ইত্যাদি কি আছে? বিভিন্ন শ্রেণিবদ্ধে কোন ধরণের রূপান্তরগুলি প্রয়োগ করতে হবে সে সম্পর্কে সাধারণ নির্দেশিকা? আমি গড়-ভেরি …

3
ওয়ার্ড 2ভেকের জন্য আরও ভাল ইনপুট কী?
এটি আরও একটি সাধারণ এনএলপি প্রশ্নের মতো। ওয়ার্ড 2 ভেক এমবেডিং শব্দের প্রশিক্ষণের জন্য উপযুক্ত ইনপুট কী? কোনও নিবন্ধের সাথে সম্পর্কিত সমস্ত বাক্যগুলি কর্পাসের আলাদা দলিল হওয়া উচিত? বা প্রতিটি নিবন্ধটি কর্পাসের ডকুমেন্ট হওয়া উচিত? এটি পাইথন এবং জিনসিম ব্যবহারের উদাহরণ মাত্র। কার্পাস বাক্য দ্বারা বিভক্ত: SentenceCorpus = [["first", "sentence", …

3
সম্ভাবনা অনুমানটি ব্যবহার করে শ্রেণীবদ্ধ ভেরিয়েবলগুলি এনকোডিং
আমি সম্ভাবনার অনুমানটি ব্যবহার করে কীভাবে শ্রেণিবদ্ধ ভেরিয়েবলগুলি এনকোড করতে পারি তা বোঝার চেষ্টা করছি তবে এখন পর্যন্ত খুব কম সাফল্য পেয়েছি। কোন পরামর্শ ব্যাপকভাবে প্রশংসা হবে।

5
পাইথনে কেএল ডাইভারজেন গণনা করা হচ্ছে
আমি এটির পরিবর্তে নতুন এবং এটির পিছনে তাত্ত্বিক ধারণা সম্পর্কে আমার সম্পূর্ণ ধারণা আছে তা বলতে পারি না। আমি পাইথনের কয়েকটি পয়েন্টের তালিকার মধ্যে কেএল ডাইভারজেন গণনা করার চেষ্টা করছি। আমি এটি ব্যবহার করার জন্য http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html ব্যবহার করছি । যে সমস্যাটির মধ্যে আমি চালিয়ে যাচ্ছি তা হ'ল মানটি যে কোনও …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.