既定のストレージ レベル (MEMORY_AND_DISK_DESER) で DataFrame を保持します。
構文
cache()
返品
DataFrame: キャッシュされたデータフレーム。
メモ
既定のストレージ レベルは、3.0 で Scala と一致するように MEMORY_AND_DISK_DESER に変更されました。
キャッシュされたデータは、クラスター上のすべての Spark セッションで共有されます。
例示
:::note サーバーレスの互換性
Databricks は、Databricks サーバーレス コンピューティング アーキテクチャと互換性がないため、 DataFrame.cache() から移行することをお勧めします。 代わりに、中間結果を Delta テーブルに具体化します。
:::
df = spark.range(1)
df.cache()
# DataFrame[id: bigint]
df.explain()
# == Physical Plan ==
# InMemoryTableScan ...