Access track parameters in a sorted order to minimize the branching divergence

beomki-yeo · beomki-yeo · commit 8680ae53e003 · 2024-09-20T11:38:07.000-07:00
diff --git a/device/common/CMakeLists.txt b/device/common/CMakeLists.txt
@@ -26,6 +26,7 @@ traccc_add_library( traccc_device_common device_common TYPE SHARED
    "include/traccc/edm/device/triplet_counter.hpp"
    "include/traccc/edm/device/device_doublet.hpp"
    "include/traccc/edm/device/device_triplet.hpp"
+   "include/traccc/edm/device/sort_key.hpp"
    # Clusterization function(s).
    "include/traccc/clusterization/device/form_spacepoints.hpp"
    "include/traccc/clusterization/device/impl/form_spacepoints.ipp"
@@ -65,6 +66,7 @@ traccc_add_library( traccc_device_common device_common TYPE SHARED
    "include/traccc/finding/device/build_tracks.hpp"
    "include/traccc/finding/device/count_measurements.hpp"
    "include/traccc/finding/device/find_tracks.hpp"
+   "include/traccc/finding/device/get_sort_key_value.hpp"
    "include/traccc/finding/device/add_links_for_holes.hpp"
    "include/traccc/finding/device/make_barcode_sequence.hpp"
    "include/traccc/finding/device/propagate_to_next_surface.hpp"
@@ -73,13 +75,16 @@ traccc_add_library( traccc_device_common device_common TYPE SHARED
    "include/traccc/finding/device/impl/build_tracks.ipp"
    "include/traccc/finding/device/impl/count_measurements.ipp"
    "include/traccc/finding/device/impl/find_tracks.ipp"
+   "include/traccc/finding/device/impl/get_sort_key_value.ipp"
    "include/traccc/finding/device/impl/add_links_for_holes.ipp"
    "include/traccc/finding/device/impl/make_barcode_sequence.ipp"
    "include/traccc/finding/device/impl/propagate_to_next_surface.ipp"
    "include/traccc/finding/device/impl/prune_tracks.ipp"
    # Track fitting funtions(s).
    "include/traccc/fitting/device/fit.hpp"
    "include/traccc/fitting/device/impl/fit.ipp"
+   "include/traccc/fitting/device/get_sort_key_value.hpp"
+   "include/traccc/fitting/device/impl/get_sort_key_value.ipp"
    )
 target_link_libraries( traccc_device_common
    PUBLIC traccc::Thrust traccc::core vecmem::core )
diff --git a/device/common/include/traccc/edm/device/sort_key.hpp b/device/common/include/traccc/edm/device/sort_key.hpp
@@ -0,0 +1,42 @@
+/** TRACCC library, part of the ACTS project (R&D line)
+ *
+ * (c) 2024 CERN for the benefit of the ACTS project
+ *
+ * Mozilla Public License Version 2.0
+ */
+
+#pragma once
+
+// Project include(s).
+#include "traccc/definitions/primitives.hpp"
+#include "traccc/edm/track_candidate.hpp"
+#include "traccc/edm/track_parameters.hpp"
+
+namespace traccc::device {
+
+struct sort_key {
+    traccc::scalar key;
+};
+
+TRACCC_HOST_DEVICE
+inline sort_key get_sort_key(const bound_track_parameters& params) {
+    // key = |theta - pi/2|
+    return sort_key{math::abs(params.theta() - constant<traccc::scalar>::pi_2)};
+}
+
+TRACCC_HOST_DEVICE
+inline sort_key get_sort_key(
+    const track_candidate_collection_types::const_device& candidates) {
+    // Number of candidates
+    return sort_key{static_cast<traccc::scalar>(candidates.size())};
+}
+
+/// Comparator based on key
+struct sort_key_comp {
+    TRACCC_HOST_DEVICE
+    bool operator()(const sort_key& lhs, const sort_key& rhs) {
+        return lhs.key < rhs.key;
+    }
+};
+
+}  // namespace traccc::device
diff --git a/device/common/include/traccc/finding/device/get_sort_key_value.hpp b/device/common/include/traccc/finding/device/get_sort_key_value.hpp
@@ -0,0 +1,34 @@
+/** TRACCC library, part of the ACTS project (R&D line)
+ *
+ * (c) 2024 CERN for the benefit of the ACTS project
+ *
+ * Mozilla Public License Version 2.0
+ */
+
+#pragma once
+
+// Project include(s).
+#include "traccc/edm/device/sort_key.hpp"
+#include "traccc/edm/track_candidate.hpp"
+
+// System include(s).
+#include <cstddef>
+
+namespace traccc::device {
+
+/// Function used for fitting a track for a given track candidates
+///
+/// @param[in] globalIndex   The index of the current thread
+/// @param[out] keys_view    The key values
+/// @param[out] ids_view     The param ids
+///
+TRACCC_HOST_DEVICE inline void get_sort_key_value(
+    std::size_t globalIndex,
+    bound_track_parameters_collection_types::const_view params_view,
+    vecmem::data::vector_view<device::sort_key> keys_view,
+    vecmem::data::vector_view<unsigned int> ids_view);
+
+}  // namespace traccc::device
+
+// Include the implementation.
+#include "traccc/finding/device/impl/get_sort_key_value.ipp"
diff --git a/device/common/include/traccc/finding/device/impl/find_tracks.ipp b/device/common/include/traccc/finding/device/impl/find_tracks.ipp
@@ -145,7 +145,7 @@ TRACCC_DEVICE inline void find_tracks(
                 n_candidates[in_param_id]);
             num_candidates.fetch_add(1);
 
-            out_params[l_pos] = trk_state.filtered();
+            out_params.at(l_pos) = trk_state.filtered();
         }
     }
 }
diff --git a/device/common/include/traccc/finding/device/impl/get_sort_key_value.ipp b/device/common/include/traccc/finding/device/impl/get_sort_key_value.ipp
@@ -0,0 +1,34 @@
+/** TRACCC library, part of the ACTS project (R&D line)
+ *
+ * (c) 2024 CERN for the benefit of the ACTS project
+ *
+ * Mozilla Public License Version 2.0
+ */
+
+#pragma once
+
+namespace traccc::device {
+
+TRACCC_HOST_DEVICE inline void get_sort_key_value(
+    std::size_t globalIndex,
+    bound_track_parameters_collection_types::const_view params_view,
+    vecmem::data::vector_view<device::sort_key> keys_view,
+    vecmem::data::vector_view<unsigned int> ids_view) {
+
+    bound_track_parameters_collection_types::const_device params(params_view);
+
+    // Keys
+    vecmem::device_vector<device::sort_key> keys_device(keys_view);
+
+    // Param id
+    vecmem::device_vector<unsigned int> ids_device(ids_view);
+
+    if (globalIndex >= keys_device.size()) {
+        return;
+    }
+
+    keys_device.at(globalIndex) = device::get_sort_key(params.at(globalIndex));
+    ids_device.at(globalIndex) = globalIndex;
+}
+
+}  // namespace traccc::device
diff --git a/device/common/include/traccc/finding/device/impl/propagate_to_next_surface.ipp b/device/common/include/traccc/finding/device/impl/propagate_to_next_surface.ipp
@@ -15,6 +15,7 @@ TRACCC_DEVICE inline void propagate_to_next_surface(
     typename propagator_t::detector_type::view_type det_data,
     bfield_t field_data,
     bound_track_parameters_collection_types::const_view in_params_view,
+    vecmem::data::vector_view<const unsigned int> param_ids_view,
     vecmem::data::vector_view<const candidate_link> links_view,
     const unsigned int step, const unsigned int& n_in_params,
     bound_track_parameters_collection_types::view out_params_view,
@@ -28,6 +29,11 @@ TRACCC_DEVICE inline void propagate_to_next_surface(
         return;
     }
 
+    // Theta id
+    vecmem::device_vector<const unsigned int> param_ids(param_ids_view);
+
+    const unsigned int param_id = param_ids.at(globalIndex);
+
     // Number of tracks per seed
     vecmem::device_vector<unsigned int> n_tracks_per_seed(
         n_tracks_per_seed_view);
@@ -36,7 +42,7 @@ TRACCC_DEVICE inline void propagate_to_next_surface(
     vecmem::device_vector<const candidate_link> links(links_view);
 
     // Seed id
-    unsigned int orig_param_id = links.at(globalIndex).seed_idx;
+    unsigned int orig_param_id = links.at(param_id).seed_idx;
 
     // Count the number of tracks per seed
     vecmem::device_atomic_ref<unsigned int> num_tracks_per_seed(
@@ -52,8 +58,8 @@ TRACCC_DEVICE inline void propagate_to_next_surface(
     vecmem::device_vector<typename candidate_link::link_index_type> tips(
         tips_view);
 
-    if (links[globalIndex].n_skipped > cfg.max_num_skipping_per_cand) {
-        tips.push_back({step, globalIndex});
+    if (links.at(param_id).n_skipped > cfg.max_num_skipping_per_cand) {
+        tips.push_back({step, param_id});
         return;
     }
 
@@ -71,7 +77,7 @@ TRACCC_DEVICE inline void propagate_to_next_surface(
     vecmem::device_vector<unsigned int> param_to_link(param_to_link_view);
 
     // Input bound track parameter
-    const bound_track_parameters in_par = in_params.at(globalIndex);
+    const bound_track_parameters in_par = in_params.at(param_id);
 
     // Create propagator
     propagator_t propagator(cfg.propagation);
@@ -115,17 +121,17 @@ TRACCC_DEVICE inline void propagate_to_next_surface(
 
         out_params[out_param_id] = propagation._stepping._bound_params;
 
-        param_to_link[out_param_id] = static_cast<unsigned int>(globalIndex);
+        param_to_link[out_param_id] = param_id;
     }
     // Unless the track found a surface, it is considered a tip
     else if (!s4.success && step >= cfg.min_track_candidates_per_track - 1) {
-        tips.push_back({step, globalIndex});
+        tips.push_back({step, param_id});
     }
 
     // If no more CKF step is expected, current candidate is
     // kept as a tip
     if (s4.success && step == cfg.max_track_candidates_per_track - 1) {
-        tips.push_back({step, globalIndex});
+        tips.push_back({step, param_id});
     }
 }
 
diff --git a/device/common/include/traccc/finding/device/propagate_to_next_surface.hpp b/device/common/include/traccc/finding/device/propagate_to_next_surface.hpp
@@ -26,6 +26,7 @@ namespace traccc::device {
 /// @param[in] cfg                Track finding config object
 /// @param[in] det_data           Detector view object
 /// @param[in] in_params_view     Input parameters
+/// @param[in] param_ids_view     Sorted param ids
 /// @param[in] links_view         Link container for the current step
 /// @param[in] step               Step index
 /// @param[in] n_in_params        The number of input parameters
@@ -41,6 +42,7 @@ TRACCC_DEVICE inline void propagate_to_next_surface(
     typename propagator_t::detector_type::view_type det_data,
     bfield_t field_data,
     bound_track_parameters_collection_types::const_view in_params_view,
+    vecmem::data::vector_view<const unsigned int> param_ids_view,
     vecmem::data::vector_view<const candidate_link> links_view,
     const unsigned int step, const unsigned int& n_in_params,
     bound_track_parameters_collection_types::view out_params_view,
diff --git a/device/common/include/traccc/fitting/device/fit.hpp b/device/common/include/traccc/fitting/device/fit.hpp
@@ -31,6 +31,7 @@ TRACCC_HOST_DEVICE inline void fit(
     const typename fitter_t::bfield_type field_data,
     const typename fitter_t::config_type cfg,
     track_candidate_container_types::const_view track_candidates_view,
+    vecmem::data::vector_view<const unsigned int> param_ids_view,
     track_state_container_types::view track_states_view);
 
 }  // namespace traccc::device
diff --git a/device/common/include/traccc/fitting/device/get_sort_key_value.hpp b/device/common/include/traccc/fitting/device/get_sort_key_value.hpp
@@ -0,0 +1,35 @@
+/** TRACCC library, part of the ACTS project (R&D line)
+ *
+ * (c) 2024 CERN for the benefit of the ACTS project
+ *
+ * Mozilla Public License Version 2.0
+ */
+
+#pragma once
+
+// Project include(s).
+#include "traccc/edm/device/sort_key.hpp"
+#include "traccc/edm/track_candidate.hpp"
+
+// System include(s).
+#include <cstddef>
+
+namespace traccc::device {
+
+/// Function used for fitting a track for a given track candidates
+///
+/// @param[in] globalIndex   The index of the current thread
+/// @param[in] track_candidates_view The input track candidates
+/// @param[out] keys_view    The key values
+/// @param[out] ids_view     The param ids
+///
+TRACCC_HOST_DEVICE inline void get_sort_key_value(
+    std::size_t globalIndex,
+    track_candidate_container_types::const_view track_candidates_view,
+    vecmem::data::vector_view<device::sort_key> keys_view,
+    vecmem::data::vector_view<unsigned int> ids_view);
+
+}  // namespace traccc::device
+
+// Include the implementation.
+#include "traccc/fitting/device/impl/get_sort_key_value.ipp"
diff --git a/device/common/include/traccc/fitting/device/impl/fit.ipp b/device/common/include/traccc/fitting/device/impl/fit.ipp
@@ -16,13 +16,16 @@ TRACCC_HOST_DEVICE inline void fit(
     const typename fitter_t::bfield_type field_data,
     const typename fitter_t::config_type cfg,
     track_candidate_container_types::const_view track_candidates_view,
+    vecmem::data::vector_view<const unsigned int> param_ids_view,
     track_state_container_types::view track_states_view) {
 
     typename fitter_t::detector_type det(det_data);
 
     track_candidate_container_types::const_device track_candidates(
         track_candidates_view);
 
+    vecmem::device_vector<const unsigned int> param_ids(param_ids_view);
+
     track_state_container_types::device track_states(track_states_view);
 
     fitter_t fitter(det, field_data, cfg);
@@ -31,15 +34,17 @@ TRACCC_HOST_DEVICE inline void fit(
         return;
     }
 
+    const unsigned int param_id = param_ids.at(globalIndex);
+
     // Track candidates per track
     const auto& track_candidates_per_track =
-        track_candidates[globalIndex].items;
+        track_candidates.at(param_id).items;
 
     // Seed parameter
-    const auto& seed_param = track_candidates[globalIndex].header;
+    const auto& seed_param = track_candidates.at(param_id).header;
 
     // Track states per track
-    auto track_states_per_track = track_states[globalIndex].items;
+    auto track_states_per_track = track_states.at(param_id).items;
 
     for (auto& cand : track_candidates_per_track) {
         track_states_per_track.emplace_back(cand);
@@ -51,7 +56,7 @@ TRACCC_HOST_DEVICE inline void fit(
     fitter.fit(seed_param, fitter_state);
 
     // Get the final fitting information
-    track_states[globalIndex].header = fitter_state.m_fit_res;
+    track_states.at(param_id).header = fitter_state.m_fit_res;
 }
 
 }  // namespace traccc::device
diff --git a/device/common/include/traccc/fitting/device/impl/get_sort_key_value.ipp b/device/common/include/traccc/fitting/device/impl/get_sort_key_value.ipp
@@ -0,0 +1,36 @@
+/** TRACCC library, part of the ACTS project (R&D line)
+ *
+ * (c) 2024 CERN for the benefit of the ACTS project
+ *
+ * Mozilla Public License Version 2.0
+ */
+
+#pragma once
+
+namespace traccc::device {
+
+TRACCC_HOST_DEVICE inline void get_sort_key_value(
+    std::size_t globalIndex,
+    track_candidate_container_types::const_view track_candidates_view,
+    vecmem::data::vector_view<device::sort_key> keys_view,
+    vecmem::data::vector_view<unsigned int> ids_view) {
+
+    track_candidate_container_types::const_device track_candidates(
+        track_candidates_view);
+
+    if (globalIndex >= track_candidates.size()) {
+        return;
+    }
+
+    // Keys
+    vecmem::device_vector<device::sort_key> keys_device(keys_view);
+
+    // Param id
+    vecmem::device_vector<unsigned int> ids_device(ids_view);
+
+    keys_device.at(globalIndex) =
+        device::get_sort_key(track_candidates.at(globalIndex).items);
+    ids_device.at(globalIndex) = globalIndex;
+}
+
+}  // namespace traccc::device
diff --git a/device/cuda/src/finding/finding_algorithm.cu b/device/cuda/src/finding/finding_algorithm.cu
diff --git a/device/cuda/src/fitting/fitting_algorithm.cu b/device/cuda/src/fitting/fitting_algorithm.cu

Original file line number	Diff line number	Diff line change
`@@ -145,7 +145,7 @@ TRACCC_DEVICE inline void find_tracks(`
`145`	`145`	`n_candidates[in_param_id]);`
`146`	`146`	`num_candidates.fetch_add(1);`
`147`	`147`
`148`		`- out_params[l_pos] = trk_state.filtered();`
	`148`	`+ out_params.at(l_pos) = trk_state.filtered();`
`149`	`149`	`}`
`150`	`150`	`}`
`151`	`151`	`}`
-Original file line number
+Diff line change
 #include "traccc/definitions/primitives.hpp"
 #include "traccc/definitions/qualifiers.hpp"
 #include "traccc/edm/device/finding_global_counter.hpp"
 +#include "traccc/edm/device/sort_key.hpp"
 #include "traccc/finding/candidate_link.hpp"
 #include "traccc/finding/device/add_links_for_holes.hpp"
 #include "traccc/finding/device/apply_interaction.hpp"
 #include "traccc/finding/device/build_tracks.hpp"
 #include "traccc/finding/device/count_measurements.hpp"
 #include "traccc/finding/device/find_tracks.hpp"
 +#include "traccc/finding/device/get_sort_key_value.hpp"
 #include "traccc/finding/device/make_barcode_sequence.hpp"
 #include "traccc/finding/device/propagate_to_next_surface.hpp"
 #include "traccc/finding/device/prune_tracks.hpp"
                                 n_total_candidates);
+}
 +/// CUDA kernel for running @c traccc::device::get_sort_key_value
 +__global__ void get_sort_key_value(
 +    bound_track_parameters_collection_types::const_view params_view,
 +    vecmem::data::vector_view<device::sort_key> keys_view,
 +    vecmem::data::vector_view<unsigned int> ids_view) {
++
 +    int gid = threadIdx.x + blockIdx.x * blockDim.x;
++
 +    device::get_sort_key_value(gid, params_view, keys_view, ids_view);
 +}
++
 /// CUDA kernel for running @c traccc::device::propagate_to_next_surface
 template <typename propagator_t, typename bfield_t, typename config_t>
 __global__ void propagate_to_next_surface(
     const config_t cfg,
     typename propagator_t::detector_type::view_type det_data,
     bfield_t field_data,
     bound_track_parameters_collection_types::const_view in_params_view,
 +    vecmem::data::vector_view<const unsigned int> param_ids_view,
     vecmem::data::vector_view<const candidate_link> links_view,
     const unsigned int step, const unsigned int& n_candidates,
     bound_track_parameters_collection_types::view out_params_view,
     int gid = threadIdx.x + blockIdx.x * blockDim.x;
     device::propagate_to_next_surface<propagator_t, bfield_t, config_t>(
 -        gid, cfg, det_data, field_data, in_params_view, links_view, step,
 -        n_candidates, out_params_view, param_to_link_view, tips_view,
 -        n_tracks_per_seed_view, n_out_params);
 +        gid, cfg, det_data, field_data, in_params_view, param_ids_view,
 +        links_view, step, n_candidates, out_params_view, param_to_link_view,
 +        tips_view, n_tracks_per_seed_view, n_out_params);
+}
 /// CUDA kernel for running @c traccc::device::build_tracks
         m_stream.synchronize();
         /*****************************************************************
 -         * Kernel6: Propagate to the next surface
 +         * Kernel6: Get key and value for parameter sorting
 +         *****************************************************************/
++
 +        vecmem::data::vector_buffer<device::sort_key> keys_buffer(
 +            global_counter_host.n_candidates, m_mr.main);
 +        vecmem::data::vector_buffer<unsigned int> param_ids_buffer(
 +            global_counter_host.n_candidates, m_mr.main);
++
 +        nThreads = m_warp_size * 2;
++
 +        if (global_counter_host.n_candidates > 0) {
 +            nBlocks =
 +                (global_counter_host.n_candidates + nThreads - 1) / nThreads;
 +            kernels::get_sort_key_value<<<nBlocks, nThreads, 0, stream>>>(
 +                updated_params_buffer, keys_buffer, param_ids_buffer);
 +            TRACCC_CUDA_ERROR_CHECK(cudaGetLastError());
 +        }
++
 +        // Sort the key and values
 +        vecmem::device_vector<device::sort_key> keys_device(keys_buffer);
 +        vecmem::device_vector<unsigned int> param_ids_device(param_ids_buffer);
 +        thrust::sort_by_key(thrust::cuda::par.on(stream), keys_device.begin(),
 +                            keys_device.end(), param_ids_device.begin(),
 +                            device::sort_key_comp());
++
 +        /*****************************************************************
 +         * Kernel7: Propagate to the next surface
          *****************************************************************/
         // Buffer for out parameters for the next step
                                                config_type>
                 <<<nBlocks, nThreads, 0, stream>>>(
                     m_cfg, det_view, field_view, updated_params_buffer,
 -                    link_map[step], step, (*global_counter_device).n_candidates,
 -                    out_params_buffer, param_to_link_map[step], tips_map[step],
 +                    param_ids_buffer, link_map[step], step,
 +                    (*global_counter_device).n_candidates, out_params_buffer,
 +                    param_to_link_map[step], tips_map[step],
                     n_tracks_per_seed_buffer,
                     (*global_counter_device).n_out_params);
             TRACCC_CUDA_ERROR_CHECK(cudaGetLastError());
+    }
     /*****************************************************************
 -     * Kernel7: Build tracks
 +     * Kernel8: Build tracks
      *****************************************************************/
     // Create track candidate buffer
-Original file line number
+Diff line change
 #include "../utils/utils.hpp"
 #include "traccc/cuda/fitting/fitting_algorithm.hpp"
 #include "traccc/fitting/device/fit.hpp"
 +#include "traccc/fitting/device/get_sort_key_value.hpp"
 #include "traccc/fitting/kalman_filter/kalman_fitter.hpp"
 // detray include(s).
 #include "detray/core/detector_metadata.hpp"
 #include "detray/detectors/bfield.hpp"
 #include "detray/propagator/rk_stepper.hpp"
 +// Thrust include(s).
 +#include <thrust/sort.h>
++
 // System include(s).
 #include <vector>
 namespace traccc::cuda {
 namespace kernels {
 +__global__ void get_sort_key_value(
 +    track_candidate_container_types::const_view track_candidates_view,
 +    vecmem::data::vector_view<device::sort_key> keys_view,
 +    vecmem::data::vector_view<unsigned int> ids_view) {
++
 +    int gid = threadIdx.x + blockIdx.x * blockDim.x;
++
 +    device::get_sort_key_value(gid, track_candidates_view, keys_view, ids_view);
 +}
++
 template <typename fitter_t, typename detector_view_t>
 __global__ void fit(
     detector_view_t det_data, const typename fitter_t::bfield_type field_data,
     const typename fitter_t::config_type cfg,
     track_candidate_container_types::const_view track_candidates_view,
 +    vecmem::data::vector_view<const unsigned int> param_ids_view,
     track_state_container_types::view track_states_view) {
     int gid = threadIdx.x + blockIdx.x * blockDim.x;
     device::fit<fitter_t>(gid, det_data, field_data, cfg, track_candidates_view,
 -                          track_states_view);
 +                          param_ids_view, track_states_view);
+}
 }  // namespace kernels
     m_copy.setup(track_states_buffer.headers);
     m_copy.setup(track_states_buffer.items);
 +    vecmem::data::vector_buffer<device::sort_key> keys_buffer(n_tracks,
 +                                                              m_mr.main);
 +    vecmem::data::vector_buffer<unsigned int> param_ids_buffer(n_tracks,
 +                                                               m_mr.main);
++
     // Calculate the number of threads and thread blocks to run the track
     // fitting
     if (n_tracks > 0) {
         const unsigned int nThreads = m_warp_size * 2;
         const unsigned int nBlocks = (n_tracks + nThreads - 1) / nThreads;
 +        // Get key and value for sorting
 +        kernels::get_sort_key_value<<<nBlocks, nThreads, 0, stream>>>(
 +            track_candidates_view, keys_buffer, param_ids_buffer);
 +        TRACCC_CUDA_ERROR_CHECK(cudaGetLastError());
++
 +        // Sort the key to get the sorted parameter ids
 +        vecmem::device_vector<device::sort_key> keys_device(keys_buffer);
 +        vecmem::device_vector<unsigned int> param_ids_device(param_ids_buffer);
++
 +        thrust::sort_by_key(thrust::cuda::par.on(stream), keys_device.begin(),
 +                            keys_device.end(), param_ids_device.begin(),
 +                            device::sort_key_comp());
++
         // Run the track fitting
         kernels::fit<fitter_t><<<nBlocks, nThreads, 0, stream>>>(
             det_view, field_view, m_cfg, track_candidates_view,
 -            track_states_buffer);
 +            param_ids_buffer, track_states_buffer);
         TRACCC_CUDA_ERROR_CHECK(cudaGetLastError());
+    }