Datathon III Results

A
Автор: Altynai Mambetova · 2023-07-28

👋🎉 Привет, друзья!

Завершён наш двухдневный Datathon III по кыргызскому языку! 📚🌐

🚩Стояла задача создать модель, которая будет извлекать (выделять) именованные сущности из текста на кыргызском языке. Задача извлечения именованных сущностей (Named Entity Recognition, NER) состоит в выделении в тексте именованных сущностей (которыми являются отдельные слова и последовательности слов) и их классификации по предопределенным категориям, например, личности (PERSON), организации (ORGANIZATION), географические объекты (LOCATION) и другие.

Было загружено 46 сабмишнов! 📈👏 Все результаты оценивались автоматически с помощью метрики F1 score. 📊🏅

Победители дататона:

🥇 "Adis Davletov" - 66.5% F1.

🥈 "Ya Mashina" - 65.2% F1.

🥉 "Team 121" - 62.9% F1.

Над датасетом работали команда из опытных AI-исследователей и 100 волонтеры, которые помогали с разметкой в течение 3-х месяцев. Все детали можно найти по ссылке.

Но это не все!

На хакатоне презентовали первый корпус кыргызского языка со 100 млн слов - tilcorpusu.org.

Спасибо всем участникам за активное участие и вклад в развитие ИИ! 🙏💡

🔥Особая благодарность нашим партнёрам:  Compass College - за все предоставленные условия для проведения  дататона и Парк Высоких Технологий @htp__kg - наш незаменимый партнёр, поддерживающий нас с самого начала! 🤝🏢

Спасибо вам за поддержку в развитии ИИ в Кыргызстане! 💖🌐