kokkos · amklinv-nnl · May 16, 2023 · May 25, 2023 · May 31, 2023 · May 31, 2023
diff --git a/CMakeLists.txt b/CMakeLists.txt
@@ -130,6 +130,15 @@ if(LINALG_ENABLE_KOKKOS)
   find_package(KokkosKernels REQUIRED)
 endif()
 
+find_package(TBB)
+option(LINALG_ENABLE_TBB
+  "Enable Threaded Building Blocks for tests. Default: autodetect TBB installation."
+  ${TBB_FOUND}
+)
+if(LINALG_ENABLE_TBB)
+  find_package(TBB REQUIRED)
+endif()
+
 ################################################################################
 
 CONFIGURE_FILE(include/experimental/__p1673_bits/linalg_config.h.in
@@ -152,6 +161,10 @@ if(LINALG_ENABLE_KOKKOS)
   )
 endif()
 
+if(LINALG_ENABLE_TBB)
+  target_link_libraries(linalg INTERFACE TBB::tbb)
+endif()
+
 target_include_directories(linalg INTERFACE
   $<BUILD_INTERFACE:${CMAKE_CURRENT_SOURCE_DIR}/include>
   $<INSTALL_INTERFACE:include>

diff --git a/examples/01_scale.cpp b/examples/01_scale.cpp
@@ -13,7 +13,7 @@
 // Make mdspan less verbose
 using std::experimental::mdspan;
 using std::experimental::extents;
-using std::experimental::dynamic_extent;
+using std::dynamic_extent;
 
 int main(int argc, char* argv[]) {
   std::cout << "Scale" << std::endl;

diff --git a/examples/02_matrix_vector_product_basic.cpp b/examples/02_matrix_vector_product_basic.cpp
@@ -13,7 +13,7 @@
 // Make mdspan less verbose
 using std::experimental::mdspan;
 using std::experimental::extents;
-using std::experimental::dynamic_extent;
+using std::dynamic_extent;
 
 int main(int argc, char* argv[]) {
   std::cout << "Matrix Vector Product Basic" << std::endl;

diff --git a/examples/03_matrix_vector_product_mixedprec.cpp b/examples/03_matrix_vector_product_mixedprec.cpp
@@ -5,9 +5,9 @@
 // Make mdspan less verbose
 using std::experimental::mdspan;
 using std::experimental::extents;
-using std::experimental::dynamic_extent;
+using std::dynamic_extent;
 using std::experimental::submdspan;
-using std::experimental::full_extent;
+using std::full_extent;
 
 int main(int argc, char* argv[]) {
   std::cout << "Matrix Vector Product MixedPrec" << std::endl;

diff --git a/examples/kokkos-based/add_kokkos.cpp b/examples/kokkos-based/add_kokkos.cpp
@@ -30,7 +30,7 @@ int main(int argc, char* argv[])
     value_type* y_ptr = y_view.data();
     value_type* z_ptr = z_view.data();
 
-    using dyn_1d_ext_type = std::experimental::extents<std::experimental::dynamic_extent>;
+    using dyn_1d_ext_type = std::experimental::extents<std::dynamic_extent>;
     using mdspan_type  = std::experimental::mdspan<value_type, dyn_1d_ext_type>;
     mdspan_type x(x_ptr,N);
     mdspan_type y(y_ptr,N);

diff --git a/examples/kokkos-based/dot_kokkos.cpp b/examples/kokkos-based/dot_kokkos.cpp
@@ -16,7 +16,7 @@ int main(int argc, char* argv[])
     value_type* a_ptr = a_view.data();
     value_type* b_ptr = b_view.data();
 
-    using dyn_1d_ext_type = std::experimental::extents<std::experimental::dynamic_extent>;
+    using dyn_1d_ext_type = std::experimental::extents<std::dynamic_extent>;
     using mdspan_type  = std::experimental::mdspan<value_type, dyn_1d_ext_type>;
     mdspan_type a(a_ptr,N);
     mdspan_type b(b_ptr,N);

diff --git a/examples/kokkos-based/dotc_kokkos.cpp b/examples/kokkos-based/dotc_kokkos.cpp
@@ -16,7 +16,7 @@ int main(int argc, char* argv[])
     value_type* a_ptr = a_view.data();
     value_type* b_ptr = b_view.data();
 
-    using dyn_1d_ext_type = std::experimental::extents<std::experimental::dynamic_extent>;
+    using dyn_1d_ext_type = std::experimental::extents<std::dynamic_extent>;
     using mdspan_type  = std::experimental::mdspan<value_type, dyn_1d_ext_type>;
     mdspan_type a(a_ptr,N);
     mdspan_type b(b_ptr,N);

diff --git a/examples/kokkos-based/scale_kokkos.cpp b/examples/kokkos-based/scale_kokkos.cpp
@@ -15,7 +15,7 @@ int main(int argc, char* argv[])
 
     // Requires CTAD working, GCC 11.1 works but some others are buggy
     // std::experimental::mdspan a(a_ptr,N);
-    std::experimental::mdspan<double,std::experimental::extents<std::experimental::dynamic_extent>> a(a_ptr,N);
+    std::experimental::mdspan<double,std::experimental::extents<std::dynamic_extent>> a(a_ptr,N);
     for(std::size_t i=0; i<a.extent(0); i++) a(i) = i;
 
     // This forwards to KokkosKernels (https://github.com/kokkos/kokkos-kernels

diff --git a/examples/kokkos-based/vector_abs_sum_kokkos.cpp b/examples/kokkos-based/vector_abs_sum_kokkos.cpp
@@ -13,7 +13,7 @@ int main(int argc, char* argv[])
     Kokkos::View<value_type*> x_view("x",N);
     value_type* x_ptr = x_view.data();
 
-    using dyn_1d_ext_type = std::experimental::extents<std::experimental::dynamic_extent>;
+    using dyn_1d_ext_type = std::experimental::extents<std::dynamic_extent>;
     using mdspan_type  = std::experimental::mdspan<value_type, dyn_1d_ext_type>;
     mdspan_type x(x_ptr,N);
     for(std::size_t i=0; i<x.extent(0); i++){

diff --git a/examples/kokkos-based/vector_norm2_kokkos.cpp b/examples/kokkos-based/vector_norm2_kokkos.cpp
@@ -13,7 +13,7 @@ int main(int argc, char* argv[])
     Kokkos::View<value_type*> x_view("x",N);
     value_type* x_ptr = x_view.data();
 
-    using dyn_1d_ext_type = std::experimental::extents<std::experimental::dynamic_extent>;
+    using dyn_1d_ext_type = std::experimental::extents<std::dynamic_extent>;
     using mdspan_type  = std::experimental::mdspan<value_type, dyn_1d_ext_type>;
     mdspan_type x(x_ptr,N);
     for(std::size_t i=0; i<x.extent(0); i++){

diff --git a/examples/kokkos-based/vector_sum_of_squares_kokkos.cpp b/examples/kokkos-based/vector_sum_of_squares_kokkos.cpp
@@ -13,7 +13,7 @@ int main(int argc, char* argv[])
     Kokkos::View<value_type*> x_view("x",N);
     value_type* x_ptr = x_view.data();
 
-    using dyn_1d_ext_type = std::experimental::extents<std::experimental::dynamic_extent>;
+    using dyn_1d_ext_type = std::experimental::extents<std::dynamic_extent>;
     using mdspan_type  = std::experimental::mdspan<value_type, dyn_1d_ext_type>;
     mdspan_type x(x_ptr,N);
     for(std::size_t i=0; i<x.extent(0); i++){

diff --git a/include/experimental/__p1673_bits/blas1_dot.hpp b/include/experimental/__p1673_bits/blas1_dot.hpp
@@ -43,6 +43,7 @@
 #ifndef LINALG_INCLUDE_EXPERIMENTAL___P1673_BITS_BLAS1_DOT_HPP_
 #define LINALG_INCLUDE_EXPERIMENTAL___P1673_BITS_BLAS1_DOT_HPP_
 
+#include <ranges>
 #include <type_traits>
 
 namespace std {
@@ -90,7 +91,7 @@ template<class ElementType1,
          class Accessor2,
          class Scalar>
 Scalar dot(
-  std::experimental::linalg::impl::inline_exec_t&& /* exec */,
+  std::experimental::linalg::impl::inline_exec_t&& exec,
   std::experimental::mdspan<ElementType1, std::experimental::extents<SizeType1, ext1>, Layout1, Accessor1> v1,
   std::experimental::mdspan<ElementType2, std::experimental::extents<SizeType2, ext2>, Layout2, Accessor2> v2,
   Scalar init)
@@ -100,10 +101,18 @@ Scalar dot(
                 v1.static_extent(0) == v2.static_extent(0));
 
   using size_type = std::common_type_t<SizeType1, SizeType2>;
-  for (size_type k = 0; k < v1.extent(0); ++k) {
-    init += v1(k) * v2(k);
-  }
-  return init;
+  using scalar_type = std::common_type_t<ElementType1, ElementType2, Scalar>;
+  using std::ranges::iota_view;
+  using std::ranges::begin;
+  using std::ranges::end;
+
+  iota_view range{size_type{}, v1.extent(0)};
+
+  Scalar sum = std::transform_reduce(exec, begin(range), end(range), init,
-  Scalar sum = std::transform_reduce(exec, begin(range), end(range), init,
+  Scalar sum = std::transform_reduce(begin(range), end(range), init,
-  Scalar sum = std::transform_reduce(exec, begin(range), end(range), init,
+  Scalar sum = std::transform_reduce(begin(range), end(range), init,
+    std::plus<scalar_type> {},
+    [=](size_type i) { return v1[i] * v2[i]; });
+
+  return sum;
 }
 
 template<class ExecutionPolicy,
@@ -155,7 +164,7 @@ Scalar dot(std::experimental::mdspan<ElementType1, std::experimental::extents<Si
            std::experimental::mdspan<ElementType2, std::experimental::extents<SizeType2, ext2>, Layout2, Accessor2> v2,
            Scalar init)
 {
-  return dot(std::experimental::linalg::impl::default_exec_t(), v1, v2, init);
+  return dot(std::experimental::linalg::impl::default_exec(), v1, v2, init);
 }
 
 template<class ElementType1,

diff --git a/include/experimental/__p1673_bits/linalg_execpolicy_mapper.hpp b/include/experimental/__p1673_bits/linalg_execpolicy_mapper.hpp
@@ -12,11 +12,12 @@ inline namespace __p1673_version_0 {
 namespace linalg {
 namespace impl {
 // the execution policy used for default serial inline implementations
-struct inline_exec_t {};
+using inline_exec_t = std::execution::sequenced_policy;
 
 // The execution policy used when no execution policy is provided
 // It must be remapped to some other execution policy, which the default mapper does
-struct default_exec_t {};
+using default_exec_t = std::execution::parallel_policy;
+auto default_exec() { return std::execution::par; };
 
 // helpers
 template<class T> struct is_inline_exec : std::false_type{};

diff --git a/tests/kokkos-based/gtest_fixtures.hpp b/tests/kokkos-based/gtest_fixtures.hpp
@@ -53,7 +53,7 @@
 // is a header since this is limited to tests
 using std::experimental::mdspan;
 using std::experimental::extents;
-using std::experimental::dynamic_extent;
+using std::dynamic_extent;
 
 //
 // helper class for generating random numbers

diff --git a/tests/kokkos-based/matrix_frob_norm_kokkos.cpp b/tests/kokkos-based/matrix_frob_norm_kokkos.cpp
@@ -87,7 +87,7 @@ TEST_F(blas2_signed_float_fixture, kokkos_matrix_frob_norm_trivial_empty)
 {
   std::vector<value_type> v;
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 0);
   namespace stdla = std::experimental::linalg;
@@ -109,7 +109,7 @@ TEST_F(blas2_signed_float_fixture, kokkos_matrix_frob_norm_trivial_one_element)
   constexpr value_type myvalue = static_cast<value_type>(-1.5);
   std::vector<value_type> v = {myvalue};
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 1, 1);
   namespace stdla = std::experimental::linalg;
@@ -143,7 +143,7 @@ TEST_F(blas2_signed_double_fixture, kokkos_matrix_frob_norm_trivial_empty)
 {
   std::vector<value_type> v;
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 0);
   namespace stdla = std::experimental::linalg;
@@ -165,7 +165,7 @@ TEST_F(blas2_signed_double_fixture, kokkos_matrix_frob_norm_trivial_one_element)
   constexpr value_type myvalue = static_cast<value_type>(-1.5);
   std::vector<value_type> v = {myvalue};
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 1, 1);
   namespace stdla = std::experimental::linalg;
@@ -202,7 +202,7 @@ TEST_F(blas2_signed_complex_double_fixture, kokkos_matrix_frob_norm_trivial_empt
   using stdc_t = value_type;
   if constexpr (alignof(value_type) == alignof(kc_t)){
     std::vector<value_type> v;
-    constexpr auto de = std::experimental::dynamic_extent;
+    constexpr auto de = std::dynamic_extent;
     using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
     s_t M(v.data(), 0, 0);
     namespace stdla = std::experimental::linalg;
@@ -229,7 +229,7 @@ TEST_F(blas2_signed_complex_double_fixture, kokkos_matrix_frob_norm_trivial_one_
     constexpr value_type myvalue{-1.5, 2.2};
     std::vector<value_type> v = {myvalue};
 
-    constexpr auto de = std::experimental::dynamic_extent;
+    constexpr auto de = std::dynamic_extent;
     using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
     s_t M(v.data(), 1, 1);
     namespace stdla = std::experimental::linalg;

diff --git a/tests/kokkos-based/matrix_inf_norm_kokkos.cpp b/tests/kokkos-based/matrix_inf_norm_kokkos.cpp
@@ -88,7 +88,7 @@ TEST_F(blas2_signed_float_fixture, kokkos_matrix_inf_norm_trivial_empty)
 {
   std::vector<value_type> v;
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 0);
   namespace stdla = std::experimental::linalg;
@@ -109,7 +109,7 @@ TEST_F(blas2_signed_float_fixture, kokkos_matrix_inf_norm_trivial_zero_rows)
 {
   std::vector<value_type> v{1.2, -2.4};
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 2);
   namespace stdla = std::experimental::linalg;
@@ -143,7 +143,7 @@ TEST_F(blas2_signed_double_fixture, kokkos_matrix_inf_norm_trivial_empty)
 {
   std::vector<value_type> v;
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 0);
   namespace stdla = std::experimental::linalg;
@@ -164,7 +164,7 @@ TEST_F(blas2_signed_double_fixture, kokkos_matrix_inf_norm_trivial_zero_rows)
 {
   std::vector<value_type> v{1.2, -2.4};
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 2);
   namespace stdla = std::experimental::linalg;
@@ -202,7 +202,7 @@ TEST_F(blas2_signed_complex_double_fixture, kokkos_matrix_inf_norm_trivial_empty
   if constexpr (alignof(value_type) == alignof(kc_t)){
 
     std::vector<value_type> v;
-    constexpr auto de = std::experimental::dynamic_extent;
+    constexpr auto de = std::dynamic_extent;
     using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
     s_t M(v.data(), 0, 0);
     namespace stdla = std::experimental::linalg;
@@ -230,7 +230,7 @@ TEST_F(blas2_signed_complex_double_fixture, kokkos_matrix_inf_norm_trivial_zero_
     v[0] = {1.2, -1.};
     v[1] = {-2.4, 4.};
 
-    constexpr auto de = std::experimental::dynamic_extent;
+    constexpr auto de = std::dynamic_extent;
     using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
     s_t M(v.data(), 0, 2);
     namespace stdla = std::experimental::linalg;

diff --git a/tests/kokkos-based/matrix_one_norm_kokkos.cpp b/tests/kokkos-based/matrix_one_norm_kokkos.cpp
@@ -88,7 +88,7 @@ TEST_F(blas2_signed_float_fixture, kokkos_matrix_one_norm_trivial_empty)
 {
   std::vector<value_type> v;
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 0);
   namespace stdla = std::experimental::linalg;
@@ -109,7 +109,7 @@ TEST_F(blas2_signed_float_fixture, kokkos_matrix_one_norm_trivial_zero_col)
 {
   std::vector<value_type> v{1.2, -2.4};
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 2, 0);
   namespace stdla = std::experimental::linalg;
@@ -143,7 +143,7 @@ TEST_F(blas2_signed_double_fixture, kokkos_matrix_one_norm_trivial_empty)
 {
   std::vector<value_type> v;
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 0, 0);
   namespace stdla = std::experimental::linalg;
@@ -164,7 +164,7 @@ TEST_F(blas2_signed_double_fixture, kokkos_matrix_one_norm_trivial_zero_col)
 {
   std::vector<value_type> v{1.2, -2.4};
 
-  constexpr auto de = std::experimental::dynamic_extent;
+  constexpr auto de = std::dynamic_extent;
   using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
   s_t M(v.data(), 2, 0);
   namespace stdla = std::experimental::linalg;
@@ -203,7 +203,7 @@ TEST_F(blas2_signed_complex_double_fixture, kokkos_matrix_one_norm_trivial_empty
 
     std::vector<value_type> v;
 
-    constexpr auto de = std::experimental::dynamic_extent;
+    constexpr auto de = std::dynamic_extent;
     using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
     s_t M(v.data(), 0, 0);
     namespace stdla = std::experimental::linalg;
@@ -231,7 +231,7 @@ TEST_F(blas2_signed_complex_double_fixture, kokkos_matrix_one_norm_trivial_zero_
     v[0] = {1.2, -1.};
     v[1] = {-2.4, 4.};
 
-    constexpr auto de = std::experimental::dynamic_extent;
+    constexpr auto de = std::dynamic_extent;
     using s_t = std::experimental::mdspan<value_type, std::experimental::extents<de, de>>;
     s_t M(v.data(), 2, 0);
     namespace stdla = std::experimental::linalg;

diff --git a/tests/kokkos-based/mdspan_to_view.cpp b/tests/kokkos-based/mdspan_to_view.cpp
@@ -13,7 +13,7 @@ void mdspan_to_view_test_impl()
 {
   using std::experimental::mdspan;
   using std::experimental::extents;
-  using std::experimental::dynamic_extent;
+  using std::dynamic_extent;
 
   // rank1, non-const
   {
@@ -96,7 +96,7 @@ void transposed_mdspan_to_view_test_impl()
 {
   using std::experimental::mdspan;
   using std::experimental::extents;
-  using std::experimental::dynamic_extent;
+  using std::dynamic_extent;
 
   using lr_t = std::experimental::layout_right;
   using ll_t = std::experimental::layout_left;

diff --git a/tests/native/add.cpp b/tests/native/add.cpp
@@ -6,7 +6,7 @@
 #include <vector>
 
 namespace {
-  using std::experimental::dynamic_extent;
+  using std::dynamic_extent;
   using std::experimental::extents;
   using std::experimental::mdspan;
   using std::experimental::linalg::add;

diff --git a/tests/native/conjugate_transposed.cpp b/tests/native/conjugate_transposed.cpp
@@ -6,7 +6,7 @@
 #include <vector>
 
 namespace {
-  using std::experimental::dynamic_extent;
+  using std::dynamic_extent;
   using std::experimental::extents;
   using std::experimental::mdspan;
   using std::experimental::linalg::conjugate_transposed;