キャッシュ

既定のストレージ レベル (MEMORY_AND_DISK_DESER) で DataFrame を保持します。

構文

cache()

返品

DataFrame: キャッシュされたデータフレーム。

メモ

既定のストレージ レベルは、3.0 で Scala と一致するように MEMORY_AND_DISK_DESER に変更されました。

キャッシュされたデータは、クラスター上のすべての Spark セッションで共有されます。

例示

:::note サーバーレスの互換性

Databricks は、Databricks サーバーレス コンピューティング アーキテクチャと互換性がないため、 DataFrame.cache() から移行することをお勧めします。 代わりに、中間結果を Delta テーブルに具体化します。

:::

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...