SANGKAK CHALLENGE AI - NTeALan

Blog

SANGKAK CHALLENGE AI

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn
Share on whatsapp
WhatsApp

SANGKAK-CHALLENGE-IA est un challenge inter-datascientist et de chercheurs / ingénieurs en Traitement Automatique des Langues (TAL) visant à créer des solutions d’intélligence artificielle concrètes sur un jeu de données open-source en langues africaines.

Il ne s’agit pas d’une compétition de type Kaggle ou Zindi ouvert à un public international, mais d’une compétition ciblée ouvert à des participants sélectionnés ayant peu ou prou des compétences/affinités avec le Traitement Automatique des Langues (TAL)  nationales africaines.

SANGKAK peut se traduire « Calculer en jouant » en yémba (langue parlée dans le département de la Menoua à l’Ouest du Cameroun).

POURQUOI CRÉER CE CHALLENGE ?


L’Afrique dispose d’un patrimoine culturel et linguistique sans précèdent. Ses 3000 langues sont encore parmi les langues les plus sous-dotées du monde et ce malgré toutes les initiatives créées ces dernières années sur le continent. Le défis est très grand et nous avons un avantage de taille aujourd’hui pour radicalement changer les choses : les technologies et applications de la data science.


Des groupes de travail se sont constitués sur le continent ces dernières années et ils ont produit des quantités importantes de ressources structurées et non structurées pour les langues africaines. En plus des ressources lexicographiques de l’association NTeALan Social Network, on peut aussi citer celles du collectif Masahkane, de Google Research, de Meta et bien d’autres organismes et universités à travers le monde.


Quelques ressources existent et bien même qu’une bonne partie de ces ressources soient privées, il faudrait maintenant les exploiter pour créer de la valeur au sein des sociétés linguistiques concernées. Tout ceci implique aussi d’identifier les problématiques locales, de trouver un lien possible entre ces problématiques et les ressources disponibles. C’est l’une des raisons principales de ce projet.

OBJECTIFS DU PROJET


Nous voulons connecter les experts de la data science du continent aux ressources disponibles en langues africaines afin que ceux-ci puissent mettre en place collectivement et suivant une problématique sociale précise, des outils d’IA qui apporteront un plus à la langue étudiée.


Sangkak challenge se donne plusieurs objectifs :

  • donner du sens aux ressources actuellement produites en langues africaines
  • regrouper des participants (data scientist, chercheurs en IA et professionnels de
    la DATA) qui s’intéressent aux langues africaines et qui aimeraient contribuer à
    leur développement/insertion dans la société urbaine.
  • challenger ces participants sur des thématiques précises avec un point d’entrée
    commun : une ressource open-source en langue africaine
  • créer un point d’échange entre les participants et le public pour leur permettre
    d’échanger/confronter leurs idées sur les solutions proposées
  • rédiger des articles scientifiques collectives avec les solutions des participants qui
    auront été les plus innovants et les soumettre à des conférences.
  • collaborer avec des entreprises et/ou laboratoires qui souhaitent challenger les
    participants sur de nouvelles problématiques ou sur de nouvelles données

    En résumé, nous voulons créer, partager et faire grandir des centres d’intérêt technologiques dans chaque langue africaine du continent disposant de ressources disponibles.

    RÉCOMPENSES


    Comme dans tous les challenges, un gagnant sera désigné par un comité restreint de spécialiste et par le public. Il recevra une récompense des partenaires et des sponsors de l’événement.


    La récompense du ou des vainqueurs sera définie à chaque challenge et annoncé aux participants à l’annonce de la compétition.

    PARTENAIRES


    Les partenaires ont vocation à soutenir les activités du projet dans toutes leurs phases. Ils pourront aussi accompagner les participants dans leurs travaux. Ceci dit, il n’ait pas exclut qu’un participant soit aussi sponsorisé à titre personnel (avec validation du comité d’organisation).


    Ce projet est soutenu par le Département de Langues et Cultures Africaines (LLCA) de l’université de Douala. Il convient aux organisateurs de trouver d’autres partenaires académiques, institutionnels et du secteur privé pour soutenir cet événement.

    INFOS UTILES

    • Site web officiel: https://sangkak-challenge-ia.ntealan.net/
    • Thème session février 2023: Name Entities Recognition (NER)
    • Données sources session février 2023MasakhaNER 2.0
    • Langue de travail session février 2023: FR, EN
    • Langues africaines sources de la session février 2023: bbj, bam, ewe, fon, hau, ibo, kin, lug, mos, nya, pcm , sna, swa, tsn, twi, wol, xho, yor, zul
    • Workshop prévu pour la session février 2023: Février 2023
    • Comment participer à la session février 2023 ?: Lien vers Github
    • Communauté Slack: communauté sur Slack 

    Share on facebook
    Facebook
    Share on twitter
    Twitter
    Share on linkedin
    LinkedIn
    Share on whatsapp
    WhatsApp

    Contribuer à l’évolution de NTeALan

    8 of 1,000,000 donors
    Sélectionnez un moyen de paiement
    Informations personnelles

    Information de carte bancaire
    Paiement sécurisé par SSL.

    Total du don : 50.00€

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *