Jak zrobić etykietowanie danych za darmo?
Alphamoon — kim jesteśmy?
ML in PL to jedno z bardziej rozpoznawalnych stowarzyszeń w Polsce działających na rzecz propagowania uczenia maszynowego i metod jego zrozumienia. To właśnie oni organizują najbardziej rozpoznawalną konferencję dla studentów w zakresie uczenia maszynowego. To dzięki ML in PL zespół DataLabeling.EU miał okazję poznać i wspólnie przeprowadzić projekt z Alphamoon.
Wszystko zaczęło się od konkursu zorganizowanego przez ML in PL 2019. Ekipa z Alphamoon wygrała 70 godzin bezpłatnego etykietowania danych tekstowych, gdzie WEimpact.AI i marka DataLabeling.EU były sponsorem.
Alphamoon to polska firma zajmująca się rozwiązaniami AI dla biznesu. Specjalizuje się w obszarach związanych z Natural Language Processing oraz Computer Vision, oferując swoje rozwiązania na międzynarodowym rynku.
Co zrobiliśmy?
Pierwszy etap obejmował omówienie zakresu zadań, ilości danych i czas realizacji oraz szczegółową instrukcję odnośnie do etykietowania. Następnie nasi koordynatorzy wykonali testy, aby zweryfikować czasochłonność powierzonych zadań i wstępną jakość ich wykonania. Czterech anotatorów oznaczało ok. 1000 stron tekstu w kilka dni, dokładnie etykietując poszczególne elementy w kolejnych etapach. (obraz z oznaczeniami)
Efekty:
Dzięki temu zespół Alphamoon zyskał oznaczone dane w krótszym czasie dla swojego modelu, którego zadaniem jest rozpoznawanie wyróżniających się wizualnie elementów na stronie.
Opinia o współpracy:
Współpracę z firmą DataLabeling.EU oceniamy jako bardzo dobrą. Firmę cechuje profesjonalne podejście zarówno od strony kontaktu z klientem oraz sprawne, jak i terminowe wykonanie zadań. Wszelkie uwagi, które mieliśmy, zostały błyskawicznie uwzględniane. Cenimy szczególnie ich profesjonalizm i zaangażowanie w zlecony projekt.
Karolina Cwojdzińska — Junior Machine Learning Engineer at Alphamoon |
Posiada bogate doświadczenie w zarządzaniu projektami etykietowania danych i koordynacji zespołów. Specjalizuje się w nadzorze nad projektami anotacji danych głosowych, językowych i obrazowych, co jest kluczowe dla rozwoju technologii AI. Jej ekspertyza obejmuje optymalizację procesów, zarządzanie zasobami oraz zapewnienie wysokiej jakości danych treningowych dla modeli uczenia maszynowego.