What: | Lecture |
When: | Tuesday, 03 March 2020, 18:00–20:00 |
Where: | Точка кипения, Петербургская 52 |
Apache Spark — это фреймворк с открытым исходным кодом для параллельной обработки и анализа слабоструктурированных данных в оперативной памяти. Мы рассмотрим применение данного фреймворка для обработки графов большой размерности.
В этой лекции будут освещены самые необходимые понятия и алгоритмы теории графов. Графы занимают важное место в прикладных исследованиях по различным разделам знаний. Однако, обработка графов больших размерностей требует специальных инструментов как Apache Spark и библиотек. Мы рассмотрим краткую историю создания инструмента и его будущее развитие. Практическое применение на различных задачах и датасетах.
Мы узнаем:
Краткая история Apache Spark
Задачи графов в программировании, науке, бизнесе. Место графов в модели распределенных вычислений
Представление графов в GraphX, GraphFrames. Создание графов
Операции с графами
Apache Spark 3.0 и новые возможности