වර්ගිකරණය යනු ආදාන දත්ත වල නිවරදි ලේබලය පුරෝකථනය කිරිමට උත්සහ කරන යන්ත්ර ඉගෙනුම් ක්රමයකි.වර්ගීකරණයේදී පුහුණු කිරිම සඳහා එක් කර ගන්නා දත්ත භාවිතයෙන් ආකෘතිය සම්පුර්ණයෙන් පුහුණු කරයි.නව පුරෝකතනයන් ලබා ගනු ලබන්නේ model එක පුහුණු කිරිමේදී ලබා දුන්න දත්ත මත පදනම්වයි.
යන්ත්ර ඉගනීමේ වර්ගීකරණය යනු ස්වයංක්රියව දත්ත “කාණ්ඩ” එකකට හෝ වැඩි ගණනකට සකසන හෝ වර්ග කරන ඇල්ගෝරිතමයකි.Emails ස්කෑන් කරන විද්යුත් තෑපෑල ශ්රේණිගත කිරිමේ මෙවලමකි. මෙය ප්රධාන නිදසුන් වලින් එකකි.
වර්ගීකරණ ඇල්ගොරිතමක් යනු පුහුණු දත්ත මත පදනම්ව නව නිරීක්ෂණ කාණ්ඩයක් තෝරා ගැනීමට භාවිතා කරන අධීක්ෂණ ඉගෙනුම් තාක්ෂණයකි.වර්ගීකරණයේදී මෘදුකාංගය ලබා දී ඇති දත්ත හෝ නිරීක්ෂණ සමුහයෙන් ඉගනගන්නා අතර පසුව නව නිරීක්ෂණ කාණ්ඩ හෝ කණ්ඩායම් ගණනාවකට වර්ග කරයි.
Classification ප්රධාන කාණ්ඩ දෙකකි. ඒවා නම්,
- Binary classification
- Multi-class classification
- Binary classification යනු වර්ගීකරණ ගැටළුව සඳහා ප්රතිඵල දෙකක් පමණක් පවතින වර්ගීකරණයන්ය. මේවා ද්වීමය වර්ගීකරණය ලෙසද හඳුන්වයි.ද්වීමය වර්ගීකරණය සඳහා උ ඔව්/නැත, ඉහළ,පහළ සහ හොඳ/ නරක ආදි ප්රතිඵල දෙකක් පමණක් ඇති වර්ගීකරණයන්ය. Binary classification සඳහා නිදසුන් ලෙස
- Prediction of conversion (buy or not).
- Churn forecast (churn or not).
- Detection of spam email (spam or not).
- Multi-class classification ලෙස හඳුන්වනු ලැබුවේ වර්ගීකරණ ගැටළුව සඳහා ප්රතිඵල දෙකකට වඩා වැඩියෙන් දැක්වෙන වර්ගීකරණ කාණ්ඩයන් ය. Multi-class classification ලෙස නිදසුන් ලෙස
- Categorization of faces.
- Classifying plant species.
- Character recognition using optical.
- Binary classification යනු වර්ගීකරණ ගැටළුව සඳහා ප්රතිඵල දෙකක් පමණක් පවතින වර්ගීකරණයන්ය. මේවා ද්වීමය වර්ගීකරණය ලෙසද හඳුන්වයි.ද්වීමය වර්ගීකරණය සඳහා උ ඔව්/නැත, ඉහළ,පහළ සහ හොඳ/ නරක ආදි ප්රතිඵල දෙකක් පමණක් ඇති වර්ගීකරණයන්ය. Binary classification සඳහා නිදසුන් ලෙස
ඇල්ගෝරිතම මෙම දත්ත සමුදායේ තොරතුරු අධ්යනය කරයි.යන්ත්ර ඉගනුම් හි වර්ගීකරණයේ ප්රධාන වර්ගීකරණ ආකාර පහකි.ඒවා නම්,
- Logistic Regression.
- Naive Bayes.
- K-Nearest Neighbors.
- Decision Tree.
- Support Vector Machines.
මම ව්යාපෘතිය අවසන් කරා
ඊළඟ පාඩම