প্রথমে জেনে রাখুন যে আপনি ভাষাগুলি ওভাররাইড ব্যবহার করে আপনার সংগ্রহস্থলের ফাইলগুলির জন্য সনাক্ত করা ভাষাটিকে ওভাররাইড করতে পারেন ।
এখন, সংক্ষেপে,
- প্রতিটি সংগ্রহস্থল ভাষার পরিসংখ্যান থেকে প্রথম ভাষার সাথে ট্যাগ করা হয় ।
- ভাষার পরিসংখ্যান প্রতিটি সনাক্ত করা প্রোগ্রামিং বা মার্কআপ ভাষার জন্য ফাইলগুলির মোট আকার গণনা করে । বিক্রেিত, ডকুমেন্টেশন এবং উত্পন্ন ফাইলগুলি গণনা করা হয় না।
- ওপেন সোর্স প্রকল্প ভাষাতত্ত্ববিদ দ্বারা প্রতিটি ফাইলের ভাষা সনাক্ত করা হয় ।
ভাষাবিদ কীভাবে ভাষাগুলি সনাক্ত করতে পারে?
ভাষাতত্ত্ববিদ নিম্নলিখিত কৌশলগুলি উপর নির্ভর করে , ক্রম করে এবং একটি নিখুঁত ম্যাচটি পাওয়ার সাথে সাথেই ভাষাটি ফিরিয়ে দেয় (একক ভাষার সাথে ফিরে আসা কৌশল)।
- দেখুন টিপে, Emacs এবং তেজ modelines ।
- পরিচিত নাম। কিছু ফাইলের নাম নির্দিষ্ট ভাষার সাথে সম্পর্কিত (ভাবেন
Makefile
) think
- একটি শেবাং দেখুন। একটি
#!/bin/bash
শেবাং সহ একটি ফাইল শেল হিসাবে শ্রেণিবদ্ধ করা হবে।
- পরিচিত ফাইল এক্সটেনশন। ভাষাগুলিতে তাদের সাথে সম্পর্কিত এক্সটেনশনের একটি সেট রয়েছে। তবে এই কৌশলটির সাথে প্রচুর দ্বন্দ্ব রয়েছে। পরস্পরবিরোধী ফলাফলগুলি (মনে করুন সি ++, সি এবং উদ্দেশ্যমূলক-সি
.h
) পরবর্তী কৌশলগুলি দ্বারা পরিমার্জন করা হয়েছে।
- একতাত্ত্বিক নিয়মের সেট । ভাষাটি সনাক্ত করতে এবং সনাক্ত করতে তারা সাধারণত ফাইলের সামগ্রীর উপর নিয়মিত মত প্রকাশের উপর নির্ভর করে (যেমন,
^[^#]+:-
প্রোলোগের জন্য )।
- একটি সাদাসিধা Bayesian ক্লাসিফায়ার তালিম নমুনা ফাইল । সর্বশেষ কৌশল, সর্বনিম্ন নির্ভুলতা। বায়েশিয়ান শ্রেণিবদ্ধকারী সর্বদা ইনপুট হিসাবে ভাষার একটি উপসেট গ্রহণ করে; এটি সমস্ত ভাষার মধ্যে শ্রেণিবদ্ধকরণ বোঝানো হয় না। ক্লাসিফায়ারের সন্ধান পাওয়া সেরা ম্যাচটি ফিরে এসেছে।
অন্বেষণ এবং ডকুমেন্টেশন ফাইল কি?
ভাষাবিদ কিছু ফাইল বিক্রেতাদের হিসাবে বিবেচনা করে , এর অর্থ তারা ভাষার পরিসংখ্যানের অন্তর্ভুক্ত নয়। এর মধ্যে রয়েছে তৃতীয় পক্ষের লাইব্রেরি যেমন jQuery এবং vendor.yml
কনফিগারেশন ফাইলে সংজ্ঞায়িত করা হয় । আপনি ভাষাগুলি ওভাররাইড ব্যবহার করে আপনার ভাণ্ডারে ফাইল বিক্রেত বা আনভেন্ডর করতে পারেন ।
একইভাবে ডকুমেন্টেশন ফাইলগুলি সংজ্ঞায়িত করা হয়েছে documentation.yml
এবং ভাষাবিদ ওভাররাইড ব্যবহার করে পরিবর্তন করা যেতে পারে ।
উত্পন্ন ফাইলগুলি কীভাবে সনাক্ত করা যায়?
ভাষাতত্ত্ববিদ উত্পন্ন ফাইলগুলি সনাক্ত করার জন্য সরল নিয়মের উপর নির্ভর করে , উভয় পথ এবং ফাইলের সামগ্রী ব্যবহার করে। উত্পন্ন ফাইলগুলি ভাষা পরিসংখ্যানগুলিতে গণনা করা হয় না এবং গিথুব ডট কম-এ আলাদা হয় না।
প্রোগ্রামিং এবং মার্কআপ ভাষা সম্পর্কে কি?
ভাষাতত্ত্ববিদ, প্রতিটি ভাষা এক ধরণের দেওয়া হয়। এই ধরনেরগুলি মূল কনফিগারেশন ফাইলে পাওয়া যাবে languages.yml
,। শুধুমাত্র প্রোগ্রামিং এবং মার্কআপ ভাষাগুলিতে পরিসংখ্যান গণনা করা হয়।