apache · majin1102 · Oct 16, 2024 · Oct 11, 2024 · Oct 11, 2024 · Oct 11, 2024
diff --git a/amoro-ams/src/main/java/org/apache/amoro/server/AmoroManagementConf.java b/amoro-ams/src/main/java/org/apache/amoro/server/AmoroManagementConf.java
@@ -332,6 +332,12 @@ public class AmoroManagementConf {
           .defaultValue(3000L)
           .withDescription("Optimizer polling task timeout.");
 
+  public static final ConfigOption<Integer> OPTIMIZER_IGNORE_FILTER_PARTITIONS =
+      ConfigOptions.key("optimizer.ignore-filter-partition-count")
+          .intType()
+          .defaultValue(100)
+          .withDescription("Filters will not be used beyond that number of partitions");
+
   /** config key prefix of terminal */
   public static final String TERMINAL_PREFIX = "terminal.";
 

diff --git a/amoro-ams/src/main/java/org/apache/amoro/server/DefaultOptimizingService.java b/amoro-ams/src/main/java/org/apache/amoro/server/DefaultOptimizingService.java
@@ -100,12 +100,15 @@ public class DefaultOptimizingService extends StatedPersistentBase
   private final TableService tableService;
   private final RuntimeHandlerChain tableHandlerChain;
   private final ExecutorService planExecutor;
+  private final int ignoreFilterPartitions;
 
   public DefaultOptimizingService(Configurations serviceConfig, DefaultTableService tableService) {
     this.optimizerTouchTimeout = serviceConfig.getLong(AmoroManagementConf.OPTIMIZER_HB_TIMEOUT);
     this.taskAckTimeout = serviceConfig.getLong(AmoroManagementConf.OPTIMIZER_TASK_ACK_TIMEOUT);
     this.maxPlanningParallelism =
         serviceConfig.getInteger(AmoroManagementConf.OPTIMIZER_MAX_PLANNING_PARALLELISM);
+    this.ignoreFilterPartitions =
+        serviceConfig.getInteger(AmoroManagementConf.OPTIMIZER_IGNORE_FILTER_PARTITIONS);
     this.pollingTimeout = serviceConfig.getLong(AmoroManagementConf.OPTIMIZER_POLLING_TIMEOUT);
     this.tableService = tableService;
     this.tableHandlerChain = new TableRuntimeHandlerImpl();
@@ -139,7 +142,8 @@ private void loadOptimizingQueues(List<TableRuntime> tableRuntimeMetaList) {
                   this,
                   planExecutor,
                   Optional.ofNullable(tableRuntimes).orElseGet(ArrayList::new),
-                  maxPlanningParallelism);
+                  maxPlanningParallelism,
+                  ignoreFilterPartitions);
           optimizingQueueByGroup.put(groupName, optimizingQueue);
         });
     optimizers.forEach(optimizer -> registerOptimizer(optimizer, false));
@@ -314,7 +318,8 @@ public void createResourceGroup(ResourceGroup resourceGroup) {
                   this,
                   planExecutor,
                   new ArrayList<>(),
-                  maxPlanningParallelism);
+                  maxPlanningParallelism,
+                  ignoreFilterPartitions);
           optimizingQueueByGroup.put(resourceGroup.getName(), optimizingQueue);
         });
   }

diff --git a/amoro-ams/src/main/java/org/apache/amoro/server/optimizing/OptimizingQueue.java b/amoro-ams/src/main/java/org/apache/amoro/server/optimizing/OptimizingQueue.java
@@ -83,6 +83,7 @@ public class OptimizingQueue extends PersistentBase {
   private final Lock scheduleLock = new ReentrantLock();
   private final Condition planningCompleted = scheduleLock.newCondition();
   private final int maxPlanningParallelism;
+  private final int ignoreFilterPartitionCount;
   private final OptimizerGroupMetrics metrics;
   private ResourceGroup optimizerGroup;
 
@@ -92,14 +93,16 @@ public OptimizingQueue(
       QuotaProvider quotaProvider,
       Executor planExecutor,
       List<TableRuntime> tableRuntimeList,
-      int maxPlanningParallelism) {
+      int maxPlanningParallelism,
+      int ignoreFilterPartitionCount) {
     Preconditions.checkNotNull(optimizerGroup, "Optimizer group can not be null");
     this.planExecutor = planExecutor;
     this.optimizerGroup = optimizerGroup;
     this.quotaProvider = quotaProvider;
     this.scheduler = new SchedulingPolicy(optimizerGroup);
     this.tableManager = tableManager;
     this.maxPlanningParallelism = maxPlanningParallelism;
+    this.ignoreFilterPartitionCount = ignoreFilterPartitionCount;
     this.metrics =
         new OptimizerGroupMetrics(
             optimizerGroup.getName(), MetricManager.getInstance().getGlobalRegistry(), this);
@@ -267,7 +270,8 @@ private TableOptimizingProcess planInternal(TableRuntime tableRuntime) {
               tableRuntime.refresh(table),
               (MixedTable) table.originalTable(),
               getAvailableCore(),
-              maxInputSizePerThread());
+              maxInputSizePerThread(),
+              ignoreFilterPartitionCount);
       if (planner.isNecessary()) {
         return new TableOptimizingProcess(planner);
       } else {

diff --git a/amoro-ams/src/main/java/org/apache/amoro/server/optimizing/plan/OptimizingPlanner.java b/amoro-ams/src/main/java/org/apache/amoro/server/optimizing/plan/OptimizingPlanner.java
@@ -43,6 +43,7 @@
 import java.util.Comparator;
 import java.util.List;
 import java.util.Map;
+import java.util.Set;
 import java.util.stream.Collectors;
 
 public class OptimizingPlanner extends OptimizingEvaluator {
@@ -64,10 +65,15 @@ public OptimizingPlanner(
       TableRuntime tableRuntime,
       MixedTable table,
       double availableCore,
-      long maxInputSizePerThread) {
+      long maxInputSizePerThread,
+      int ignoreFilterPartitionCount) {
     super(tableRuntime, table);
     this.partitionFilter =
-        tableRuntime.getPendingInput() == null
+        (tableRuntime.getPendingInput() == null
+                || tableRuntime.getPendingInput().getPartitions().values().stream()
+                        .mapToInt(Set::size)
+                        .sum()
+                    > ignoreFilterPartitionCount)
             ? Expressions.alwaysTrue()
             : tableRuntime.getPendingInput().getPartitions().entrySet().stream()
                 .map(

diff --git a/amoro-ams/src/test/java/org/apache/amoro/server/optimizing/TestOptimizingQueue.java b/amoro-ams/src/test/java/org/apache/amoro/server/optimizing/TestOptimizingQueue.java
@@ -112,7 +112,8 @@ protected OptimizingQueue buildOptimizingGroupService(TableRuntime tableRuntime)
         quotaProvider,
         planExecutor,
         Collections.singletonList(tableRuntime),
-        1);
+        1,
+        100);
   }
 
   private OptimizingQueue buildOptimizingGroupService() {
@@ -122,7 +123,8 @@ private OptimizingQueue buildOptimizingGroupService() {
         quotaProvider,
         planExecutor,
         Collections.emptyList(),
-        1);
+        1,
+        100);
   }
 
   @Test

diff --git a/amoro-ams/src/test/java/org/apache/amoro/server/optimizing/flow/CompleteOptimizingFlow.java b/amoro-ams/src/test/java/org/apache/amoro/server/optimizing/flow/CompleteOptimizingFlow.java
@@ -196,7 +196,8 @@ private OptimizingPlanner planner() {
         tableRuntime,
         table,
         availableCore,
-        OptimizerProperties.MAX_INPUT_FILE_SIZE_PER_THREAD_DEFAULT);
+        OptimizerProperties.MAX_INPUT_FILE_SIZE_PER_THREAD_DEFAULT,
+        100);
   }
 
   private OptimizingConfig optimizingConfig() {

diff --git a/amoro-ams/src/test/java/org/apache/amoro/server/optimizing/plan/TestOptimizingPlanner.java b/amoro-ams/src/test/java/org/apache/amoro/server/optimizing/plan/TestOptimizingPlanner.java
@@ -100,6 +100,7 @@ protected OptimizingPlanner buildOptimizingEvaluator() {
         getTableRuntime(),
         getMixedTable(),
         1,
-        OptimizerProperties.MAX_INPUT_FILE_SIZE_PER_THREAD_DEFAULT);
+        OptimizerProperties.MAX_INPUT_FILE_SIZE_PER_THREAD_DEFAULT,
+        100);
   }
 }
diff --git a/dist/src/main/amoro-bin/conf/config.yaml b/dist/src/main/amoro-bin/conf/config.yaml
@@ -54,6 +54,7 @@ ams:
     task-ack-timeout: 30000 # 30s
     polling-timeout: 3000 # 3s
     max-planning-parallelism: 1 # default 1
+    ignore-filter-partition-count: 100 # default 100
 
   blocker:
     timeout: 60000 # 1min