パイプライン開発者向けリファレンス

ストリーミングテーブルと具体化されたビューを定義するクエリを使用して、Lakeflow Spark 宣言パイプラインにデータの読み込みと変換を実装します。 Lakeflow Spark 宣言パイプラインでは、SQL インターフェイスと Python インターフェイスの両方がサポートされます。ほとんどのデータ処理ユースケースで同等の機能が提供されるため、最も使い慣れたインターフェイスを選択できます。決定方法については、「SQL と Python の選択」を参照してください。

Python開発

Python コードを使用してパイプラインを作成します。

トピック	Description
Pythonを使用してパイプラインコードを開発する	Pythonでのパイプライン開発の概要。
Lakeflow Spark 宣言パイプライン Python言語リファレンス	Python `pipelines` モジュールのリファレンスドキュメントです。
パイプラインの依存関係Python管理	パイプラインでPython ライブラリを管理する手順。
Git フォルダーまたはワークスペースファイルから Python モジュールをインポートします	Azure Databricksに格納Pythonモジュールを使用する手順。

SQL 開発

SQL コードを使用してパイプラインを作成します。

トピック	Description
SQL を使用して Lakeflow Spark 宣言パイプラインコードを開発する	SQL でのパイプライン開発の概要。
パイプライン SQL 言語リファレンス	Lakeflow Spark 宣言パイプラインの SQL 構文のリファレンスドキュメント。
スタンドアロンパイプライン	Databricks SQL を使用してパイプラインを操作します。

その他の開発トピック

次のトピックでは、パイプラインを開発する他の方法について説明します。

トピック	Description
パイプラインをバンドルプロジェクトに変換する	既存のパイプラインをバンドルに変換します。これにより、ソース管理された YAML ファイルでデータ処理構成を管理して、ターゲット環境へのメンテナンスと自動デプロイを容易にできます。
Lakeflow Spark 宣言パイプラインを使用したメタプログラミング	dlt-meta を使用してパイプラインを作成します。オープンソース `dlt-meta` ライブラリを使用して、メタデータドリブンフレームワークを使用してパイプラインの作成を自動化します。チュートリアル: 異なるパラメーターを使用して複数のフローを作成する。 Pythonのループ内に複数のフローを作成します。
ローカル開発環境でパイプラインコードを開発する	パイプラインをローカルで開発するためのオプションの概要。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-06-24