facebookincubator · gaoyangxiaozhu · May 20, 2024 · May 20, 2024 · May 21, 2024 · May 23, 2024
@@ -364,6 +364,7 @@ std::shared_ptr<common::ScanSpec> makeScanSpec(
     }
   }
 
+  int numChildren = 0;
   // Process columns that will be projected out.
   for (int i = 0; i < rowType->size(); ++i) {
     auto& name = rowType->nameOf(i);
@@ -373,7 +374,7 @@ std::shared_ptr<common::ScanSpec> makeScanSpec(
     }
     auto it = outputSubfields.find(name);
     if (it == outputSubfields.end()) {
-      auto* fieldSpec = spec->addFieldRecursively(name, *type, i);
+      auto* fieldSpec = spec->addFieldRecursively(name, *type, numChildren++);
       filterOutNullMapKeys(*type, *fieldSpec);
       filterSubfields.erase(name);
       continue;
@@ -388,7 +389,7 @@ std::shared_ptr<common::ScanSpec> makeScanSpec(
       }
       filterSubfields.erase(it);
     }
-    auto* fieldSpec = spec->addField(name, i);
+    auto* fieldSpec = spec->addField(name, numChildren++);
     addSubfields(*type, subfieldSpecs, 1, pool, *fieldSpec);
     filterOutNullMapKeys(*type, *fieldSpec);
     subfieldSpecs.clear();

@@ -310,15 +310,11 @@ void SplitReader::setRowIndexColumn(
   auto rowIndexColumnName = rowIndexColumn->name();
   auto rowIndexMetaColIdx =
       readerOutputType_->getChildIdxIfExists(rowIndexColumnName);
-  if (rowIndexMetaColIdx.has_value() &&
-      !fileType->containsChild(rowIndexColumnName) &&
-      hiveSplit_->partitionKeys.find(rowIndexColumnName) ==
-          hiveSplit_->partitionKeys.end()) {
-    dwio::common::RowNumberColumnInfo rowNumberColumnInfo;
-    rowNumberColumnInfo.insertPosition = rowIndexMetaColIdx.value();
-    rowNumberColumnInfo.name = rowIndexColumnName;
-    baseRowReaderOpts_.setRowNumberColumnInfo(std::move(rowNumberColumnInfo));
-  }
+  dwio::common::RowNumberColumnInfo rowNumberColumnInfo;
+  VELOX_CHECK(rowIndexMetaColIdx.has_value());
+  rowNumberColumnInfo.insertPosition = rowIndexMetaColIdx.value();
+  rowNumberColumnInfo.name = rowIndexColumnName;
+  baseRowReaderOpts_.setRowNumberColumnInfo(std::move(rowNumberColumnInfo));
 }
 
 std::vector<TypePtr> SplitReader::adaptColumns(

@@ -532,6 +532,10 @@ TEST_F(ParquetTableScanTest, rowIndex) {
       {"a", "_tmp_metadata_row_index"},
       assignments,
       "SELECT a, _tmp_metadata_row_index FROM tmp");
+  assertSelectWithAssignments(
+      {"_tmp_metadata_row_index", "a"},
+      assignments,
+      "SELECT _tmp_metadata_row_index, a FROM tmp");
   // case 2: file has `_tmp_metadata_row_index` column, then use user data
   // insteads of generating it.
   loadData(