Проведем разбор ошибок, которые остались неисправленными: 

  1. Ошибка в кубе (отсутствует ключ в измерении “Store”). Возникает ошибка “ArrayIndexOutOfBoundsException: 0”. Все логично, если вспомнить, что это OLAP куб.
  2. При запуске ETL процесса было выявлена низкая скорость выполнения “database look up”. Причина состоит в том, что отсутствует ключ по полю OLTP_FK в контрольном измерении. После введения ключа по полям (OLTP_FK, date_sale) скорость обработки увеличилась с 6 r/s до 148 r/s.

Рекомендую просматривать видео на Youtube (ссылка http://youtu.be/VavgkaEr_6Q). Материалы для загрузки (Загрузка/Download)

План видео /Video plan

00:05 План видео / Video plan
00:15 Исправление ошибки "ArrayIndexOutOfBoundsException: 0" / Error correction "ArrayIndexOutOfBoundsException: 0"
01:58 Тюнинг ETL процесса. / Tuning of ETL process.

Ссылки по теме:

  1. Часть 3. Установка Pentaho и PDI (видео)
  2. Часть 5. Разработка WH (видео)
  3. Часть 5. Организация хранилища данных (WareHouse)
  4. Часть 6. Развертывание системы WH через PDI (видео)
  5. Часть 7. Разработка ETL в PDI (видео)
  6. Часть 9. Разработка куба и его публикация