Skip to content

kamalkraj/Malayalam-News-Classifier

Repository files navigation

Malayalam-News-Classifier

Data Format

  • CSV

    header as "target,text" target means numerical label target and header should be seperated by "," like sample shown below

  • data folder must contain 2 files 1) train.csv 2) test.csv .

  • same format for both files

target,text
5,ഇളകി മറിഞ്ഞ കാണികളെ സാക്ഷിയാക്കി കാല്‍പന്തുകളിയുടെ ഇന്ത്യന്‍ വിസ്മയം സുനില്‍ ഛേത്രിയുടെ കളി മികവിലായിരുന്നു ഇന്ത്യയുടെ ത്രസിപ്പിക്കുന്ന വിജയം. കെനിയക്കെതിരായ മത്സരത്തില്‍ ഇരട്ട ഗോളുമായി നായകന്‍ സുനില്‍ ഛേത്രി മറ്റൊരു തലത്തിലേക്ക് കൂടിയാണ് പന്തു പായിക്കുകയാണ്.  ഇന്നലത്തെ  രണ്ട് ഗോളുകള്‍ കൂടിയായതോട ലോകഫുട്ബോളില്‍ ദേശീയ ടീമിനായി ഗോള്‍ നേടിയവരുടെ പട്ടികയില്‍ ഛേത്രി കുതിപ്പ് തുടരുകയാണ്.ഗോള്‍വേട്ടയുടെ കാര്യത്തില്‍ ഇനിയും വിരമിച്ചിട്ടില്ലാത്ത കളിക്കാരുടെ പട്ടികയില്‍ ലോകഫുട്ബോളില്‍ മെസിയും ക്രിസ്റ്റ്യാനോയും മാത്രമാണ് ഛേത്രിക്ക് മുന്നിലുള്ളത്. കൂടുതല്‍ ഗോള്‍ നേടിയവരുടെ പട്ടികയില്‍ മെസിയെ പിന്നിലാക്കി രണ്ടാം സ്ഥാനത്തെത്താന്‍ ഛേത്രിക്ക് ഇനി  മൂന്ന് ഗോളുകളുടെ ദൂരം മാത്രം.  ദേശീയ ടീമിനായി കൂടുതല്‍ ഗോള്‍ നേടിയവരുടെ പട്ടികയില്‍ 25-ാം സ്ഥാനത്താണ് ഛേത്രി. ഇന്നലത്തെ  ഇരട്ടഗോളുകള്‍ കൂടിയായതോടെ സുനില്‍ ഛേത്രിയുടെ  നേട്ടം 61 ഗോളായി. . ക്രിസ്റ്റ്യാനോ 81 ഉം മെസി 64 ഉം ഗോളുകളാണ് ദേശീയ ടീമിനായി നേടിയിട്ടുള്ളത്. കൂടുതല്‍ ഗോള്‍നേടിയവരുടെ കാര്യത്തില്‍ ക്രിസ്റ്റ്യാനോ മൂന്നാം സ്ഥാനത്തും മെസി ഇരുപത്തിയൊന്നാം സ്ഥാനത്തുമാണ്. ഇറാന്‍റെ ഇതിഹാസ താരം അലി ദേയിയാണ് ലോകത്തെ മികച്ച ഗോള്‍വേട്ടക്കാരനെന്ന റെക്കോര്‍ഡ് സ്വന്തമാക്കിയിട്ടുള്ളത്. 109 തവണയാണ് അലി  ഗോളടിച്ചത്. ഹംഗറിയ്ക്കും സ്പെയിനിനും വേണ്ടി കളിച്ചിട്ടുള്ള പുഷ്കാസാണ് 84 ഗോളുകളുമായി രണ്ടാം സ്ഥാനത്ത്. 77 ഗോള്‍ നേടിയിട്ടുള്ള പെലെ ഏഴാം സ്ഥാനത്താണ്.
4,ക്രിമിനല്‍ കേസില്‍ പ്രതികളായ പൊലീസുകാര്‍ക്കെതിരായ നടപടി വൈകിച്ച് സംസ്ഥാന സര്‍ക്കാര്‍. ക്രിമിനല്‍ കേസില്‍ പ്രതികളായവരും കോടതി കുറ്റക്കാരെന്ന് കണ്ടെത്തിയവരുമായ പൊലീസുകാരുടെ പട്ടിക കയ്യിലിരിക്കെ, വിഷയം പഠിക്കാന്‍ പുതിയ സമിതിക്ക് സര്‍ക്കാര്‍ രൂപം നല്‍കി. ക്രിമിനല്‍ കേസ് പ്രതികളായ പൊലീസുകാരെ സംരക്ഷിക്കാനാണ് ഈ നടപടിയെന്ന ആക്ഷേപം ശക്തമായി. ക്രിമിനല്‍ കേസില്‍ പ്രതികളായ പൊലീസുകാര്‍ക്കെതിരെ ഉടനെയൊന്നും സര്‍ക്കാര്‍ നടപടിയെടുക്കാന്‍ ഉദ്ദേശിക്കുന്നില്ലെന്നാണ് വിവരാവകാശ രേഖകള്‍ വ്യക്തമാക്കുന്നത്. വിവിധ റാങ്കുകളിലുള്ള 387 ഉദ്യോഗസ്ഥര്‍ ക്രിമിനല്‍ കേസുകളില്‍ പ്രതികളാണെന്ന് പൊലീസ് തന്നെ സമ്മതിക്കുന്നു. ഇവരില്‍ പലരേയും കോടതി കുറ്റക്കാരെന്നു കണ്ടെത്തി ശിക്ഷിച്ചതുമാണ്.  ക്രിമിനലുകളായ പൊലീസുകാര്‍ക്കെതിരെ നടപടിയെടുക്കണമെന്ന് മനുഷ്യാവകാശ കമ്മിഷന്‍ ഉത്തരവ് ഉള്‍പ്പെടെ ഉണ്ടായിട്ടും വിഷയം വിശദമായി പഠിക്കാന്‍ പുതിയ സമിതിക്ക് രൂപം നല്‍കിയിരിക്കുകയാണ് സര്‍ക്കാര്‍.  ഫലത്തില്‍ നടപടി വീണ്ടും വൈകുമെന്ന് ചുരുക്കം.ക്രൈംബ്രാഞ്ച് മേധാവി അധ്യക്ഷനായ അഞ്ചംഗ സമിതിയായിരിക്കും ക്രിമിനല്‍ കേസുകളിലെ പ്രതികളായ പൊലീസുകാരെക്കുറിച്ച് അന്വേഷിച്ച് ഡിജിപിക്ക് റിപ്പോര്‍ട്ട് നല്‍കുക. 

Train

python3 main.py

Inference

Must modify label2idx.npy as your label mapping

label2idx.npy contains Numerical label to text mapping as python dict

Sample

{0:"News",1:"Sports",2:"Gulf"}

Deploy model as rest service

python3 api.py

use cURL for testing or postman

curl -X POST http://0.0.0.0:5000/classify -H 'Content-Type: application/json' -d '{"text":"ആറാം കിരീടം ലക്ഷ്യംവയ്ക്കുന്ന ബ്രസീലാണ് ഗ്രൂപ്പ് ഇയിലെ ഫേവറേറ്റുകള്‍. കോസ്റ്ററിക്കയും സെര്‍ബിയയും സ്വിറ്റ്സര്‍ലന്‍ഡും മറികടന്നുവേണം ബ്രസീലിന് മുന്നേറാന്‍ ."}'

Output format

{
    "intent": {
        "confidence": 0.390345,
        "name": "Sports"
    },
    "intent_ranking": [
        {
            "confidence": 0.30737,
            "name": "Entertainment"
        },
        {
            "confidence": 0.151037,
            "name": "Business"
        },
        {
            "confidence": 0.083977,
            "name": "Kerala"
        },
        {
            "confidence": 0.037919,
            "name": "Gulf"
        },
        {
            "confidence": 0.029352,
            "name": "India"
        }
    ],
    "processed_text": "ആറാം കിരീടം ലക്ഷ്യംവയ്ക്കുന്ന ബ്രസീലാണ് ഗ്രൂപ്പ് ഇയിലെ ഫേവറേറ്റുകള് . കോസ്റ്ററിക്കയും സെര്ബിയയും സ്വിറ്റ്സര്ലന്ഡും മറികടന്നുവേണം ബ്രസീലിന് മുന്നേറാന് ."
}

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages