使用您的試算表資料來訓練 ML 模型

您可以使用 TensorFlow 決策樹森林 (TF-DF) 從表格資料訓練、評估及部署機器學習模型。這個過程非常快速,因為 TF-DF 只需要少量的程式碼,而且只需幾秒鐘即可完成訓練。但是,如果您的資料在試算表中,那麼使用試算表中的資料來訓練機器學習模型並對資料進行預測的最直接方法是什麼?

Simple ML Logo

您可以使用 Simple ML for Sheets 在 Google 試算表中直接完成大部分的 ML 工作。透過 Simple ML

  1. 您不需要編寫任何程式碼。
  2. 訓練會在您的瀏覽器中本機執行,只需幾秒鐘。
  3. 您可以將 Simple ML 產生的模型匯出至 TensorFlow、Colab 或 TF Serving。

Simple ML 使用與 TensorFlow 決策樹森林相同的程式碼來訓練您的模型,因此您不會為了易於使用而犧牲品質。

開始使用

我們來看看

例如,下圖顯示一個試算表,其中包含 Palmer Penguins 資料集的副本。每一列代表一隻企鵝。請注意,「species」欄位中的某些值遺失了。使用 Google 試算表的 Simple ML 附加元件,您可以使用機器學習來預測遺失的值。

Simple ML predicts missing species"

在底層,「預測遺失值」工作會在給定欄位(在本例中為「species」欄位)中包含值的列上訓練模型,然後使用該模型來預測遺失的值。您不必建立或調整模型,也不必設定輸入特徵如何被模型使用 – Simple ML 會為您處理所有這些。

您可以使用 Simple ML 做什麼?

在 Google 試算表中啟用 Simple ML 附加元件後,您可以預測遺失值並識別資料中的異常值。Simple ML 會在您的試算表中建立新欄位,以包含這些值以及新值的信賴度。

為了完成這些任務,Simple ML 會在背景中建立 ML 模型,並在您的試算表資料上進行訓練。模型會儲存在您 Google 雲端硬碟資料夾中名為 simple_ml_for_sheets 的資料夾中。

您也可以透過選擇要在哪些資料欄位上訓練模型,以及選擇性地選取訓練演算法來訓練模型。

模型訓練完成後,您可以使用它來執行任務,包括預測指定欄位中的所有值

您可以評估和理解模型。

您可以匯出模型以在 Colab 中使用。

您可以檢視模型的詳細資訊,以及重新命名和刪除 Simple ML 建立的模型。

Simple ML 可保護您的資料安全

Simple ML 會保留您的試算表資料。Simple ML 永遠不會覆寫現有資料,而是建立新欄位來顯示預測值以及預測的信賴度。這樣一來,您就不會因錯誤而遺失資料。

Simple ML 的訓練作業全部直接在您的瀏覽器中執行,這表示您的資料完全保留在您的 Google 試算表中。優點包括

  • 隱私權:資料集和模型不會傳送給 Google 試算表以外的第三方 (Google 雲端硬碟除外)。
  • 反應速度:訓練是即時的 (在小型資料集上)。
  • 沒有配額限制:由於您使用自己的機器進行訓練,因此您可以訓練任意數量的模型並訓練任意長的時間。

Simple ML 會在您的試算表資料上訓練模型

Simple ML 讓您可以在試算表中使用 ML 的強大功能,而無需擔心細節。您只需要擔心大方向 – 您將如何處理這些預測?

然而,對於更了解開發和使用 ML 模型的開發人員來說,Simple ML 讓您可以存取您的模型。例如,您可以手動訓練、評估、套用或分析模型,並且在建立新模型時可以選擇訓練演算法。

當您使用 Simple ML 執行預測遺失值等任務時,它會產生 ML 模型並將其儲存在您 Google 雲端硬碟中名為 simple_ml_for_sheets 的資料夾中。然後,您可以使用該模型來進行預測和分析其他資料。例如,您可以將儲存的模型上傳到 Colab,以編寫和執行使用該模型的程式碼。

進一步瞭解如何使用 Simple ML for Sheets

若要開始使用,請參閱 ML for Sheets 入門教學課程

若要進一步瞭解如何使用 Simple ML,請參閱 Simple ML for Sheets 文件