Zespół specjalizuje się w eksploracji dużych zbiorów danych oraz budowie modeli służących analityce danych. Opracowuje i wykorzystuje metody uczenia maszynowego do wielkoskalowej analizy tekstów oraz przeprowadzania data miningu. Duża część projektów realizowanych jest na zlecenie firm zainteresowanych wydobywaniem informacji z posiadanych zbiorów danych oraz monetyzacją tych zasobów.

W realizacji projektów opartych o dane wykorzystywana jest typowo metodyka CRISP-DM (Cross-Industry Standard Process for Data Mining). Oprócz współpracy z sektorem prywatnym ADA Lab uczestniczył w szeregu krajowych oraz międzynarodowych projektów badawczo-rozwojowych. Dzięki dostępowi do zasobów obliczeniowych ICM oraz najnowszych technologii Big Data, zespół jest w stanie realizować projekty analityczne o skali petabajtów. W połączeniu z kompetencjami programistów i administratorów pracujących w środowisku Apache Spark oraz multidyscyplinarnych zespołów badawczych daje to możliwość rozwiązywania najbardziej wymagających problemów.

Zobacz więcej informacji na temat ADALab.

Główne atuty ADALab

  1. Doświadczony zespół złożony z inżynierów dużych danych oraz specjalistów z zakresu analityki danych.
  2. Jeden z największych w Europie klastrów do analityki danych (technologia Apache Spark).
  3. Doświadczenie w prowadzeniu projektów w oparciu o metodykę CRISP-DM (Cross-Industry Standard Process for Data Mining).
  4. Współpraca z wiodącymi europejskimi ośrodkami z zakresu analityki danych.
  5. Oprogramowanie i usługi sieciowe do wielkoskalowej analizy dokumentów CERMINE (http://cermine.ceon.pl/)

Główne obszary kompetencji ADALab

  1. Przetwarzanie języka naturalnego
  2. Analiza dokumentów
  3. Przetwarzanie dużych zbiorów danych
  4. Przetwarzanie strumieni danych
  5. Sieci semantyczne
  6. Bazy danych NoSQL
  7. Bazy danych typu blockchain
  8. Uczenie maszynowe
  9. Wizualizacja informacji
  10. Paradygmat MapReduce
  11. Usługi Amazon Web Services

Strategiczne cele i obszary ADALab

  1. Szersza współpraca z biznesem w obszarze analityki dużych danych.
  2. Usługi doradcze w zakresie budowy, konfiguracji i utrzymania środowisk obliczeniowych opartych o Apache Spark.
  3. Komercjalizacja i rozwój usług do automatycznej analizy dokumentów.
Skip to content