術語表
Spring Batch 詞彙表
- 批處理
-
隨著時間推移積累的業務事務。
- 批處理應用風格
-
用於將批處理指定為一種獨立的應用程式風格的術語,類似於線上、Web 或 SOA。它具有輸入、驗證、資訊轉換到業務模型、業務處理和輸出等標準元素。此外,它還需要宏觀層面的監控。
- 批處理
-
處理在一段時間內(例如一小時、一天、一週、一個月或一年)積累的大量業務事務。它是以重複和可預測的方式對許多資料實體或物件應用一個或一組過程,其中要麼沒有手動元素,要麼有單獨的手動元素用於錯誤處理。
- 批處理視窗
-
批處理作業必須完成的時間範圍。這可能會受到其他系統上線、其他依賴作業需要執行或批處理環境特有的其他因素的限制。
- 步驟
-
主要的批處理任務或工作單元。它根據提交間隔設定和其他因素初始化業務邏輯並控制事務環境。
- 任務
-
由應用程式開發人員建立的用於處理步驟業務邏輯的元件。
- 批處理作業型別
-
作業型別描述了作業在特定處理型別中的應用。常見的領域包括介面處理(通常是平面檔案)、表單處理(用於線上 PDF 生成或列印格式)和報告處理。
- 驅動查詢
-
驅動查詢識別作業要完成的工作集。然後,作業將該工作分解為單個工作單元。例如,驅動查詢可能是識別所有狀態為“待傳輸”的金融交易並將其傳送到合作伙伴系統。驅動查詢返回要處理的記錄 ID 集。每個記錄 ID 都成為一個工作單元。驅動查詢可能涉及連線(如果選擇條件跨越兩個或更多表),或者它可能處理單個表。
- 項
-
項表示用於處理的最小完整資料量。最簡單地說,這可能是一個檔案中的一行、資料庫表中的一行或 XML 檔案中的特定元素。
- 邏輯工作單元 (LUW)
-
批處理作業透過驅動查詢(或檔案等其他輸入源)迭代,以執行作業必須完成的工作集。每次執行的工作迭代都是一個工作單元。
- 提交間隔
-
在單個事務中處理的一組 LUW。
- 分割槽
-
將作業拆分為多個執行緒,每個執行緒負責處理整體資料的一個子集。執行執行緒可以在同一個 JVM 中,也可以跨叢集環境中支援工作負載平衡的 JVM。
- 暫存表
-
在處理過程中儲存臨時資料的表。
- 可重啟
-
可以再次執行並假定與初次執行時相同身份的作業。換句話說,它具有相同的作業例項 ID。
- 可重跑
-
一個可重啟的作業,它根據上次執行的記錄處理情況管理自己的狀態。基於驅動查詢的步驟就是可重跑步驟的一個示例。如果驅動查詢可以形成,以便在作業重啟時限制已處理的行,那麼它是可重跑的。這由應用程式邏輯管理。通常,
where語句中會新增一個條件,以使用類似於and processedFlag!= true的邏輯來限制驅動查詢返回的行。 - 重複
-
批處理最基本的單元之一,它透過重複呼叫部分程式碼來定義,直到程式碼完成且沒有錯誤。通常,只要有輸入,批處理過程就可以重複。
- 重試
-
簡化了具有重試語義的操作的執行,這些語義最常與處理事務性輸出異常相關聯。重試與重複略有不同。重試不是持續呼叫一個程式碼塊,而是有狀態的,並持續使用相同的輸入呼叫相同的程式碼塊,直到成功或超過某種重試限制。它通常只有在環境中的某些情況有所改善,後續呼叫操作可能成功時才有用。
- 恢復
-
恢復操作以某種方式處理異常,使重複過程能夠繼續。
- 跳過
-
跳過是一種恢復策略,常用於檔案輸入源,作為忽略未能透過驗證的錯誤輸入記錄的策略。