パイプラインアプリケーションは、 HERE Workspace で展開するために JAR ファイル にコンパイルされます。 パイプラインは、ストリーム処理フレームワーク( Apache Flink )またはバッチ処理フレームワーク( Apache Spark )で実行できます。 パイプラインアプリケーションには、次の 2 つの基本コンポーネントがあります。
フレームワークインターフェイスこれは、処理中のデータおよび選択した処理フレームワークのアーティファクトです。 データのインジェストとデータ出力もアーティファクトです。 パイプラインの実行に必要な基本コンポーネントです。 パイプライン開発プロジェクトの基本は、 HERE Data SDK for Java and Scala で提供されている Maven の原型に基づいて事前定義されています。
データ処理ワークフローは、ハードコードされたデータ変換アルゴリズムで構成されています。このアルゴリズムによって、特に HERE のライブラリおよびリソースを使用する場合に、各パイプラインが一意になります。 データ入力をデータ出力の有用な形式に変換するには、パイプラインの特殊なアルゴリズムが必要です。
パイプラインは、使用前に設計および実装プロセスを通過します。 パイプラインが設計されると、実行可能な JAR ファイル として実装されます。 これらの JAR ファイルは、必要に応じて HERE Workspace で使用できます。 各パイプライン JAR ファイル は、ストリームまたはバッチ実行環境の設計要件および制約を満たす必要があります。
ストリーム環境が選択されている場合、 JAR ファイル はパイプラインに組み込まれている Apache Flink フレームワークで実行可能である必要があります。
バッチ環境が選択されている場合、 JAR ファイル はパイプラインに組み込まれている Apache Spark フレームワークで実行可能である必要があります。
HERE Workspace は、管理、プロビジョニング、拡張、設定、運用、 サーバー側のコンポーネントのメンテナンスを行い、アプリケーションのロジックとユースケースの開発に必要なデータに焦点を当てることができます。 HERE Workspace は、主にデータ処理、コンパイル、視覚化を行う開発者を対象としていますが、データアナリストはその場で開発を行うこともできます。