diff --git a/cpp/src/community/k_truss_impl.cuh b/cpp/src/community/k_truss_impl.cuh
index e052a89291..d1150b8d36 100644
--- a/cpp/src/community/k_truss_impl.cuh
+++ b/cpp/src/community/k_truss_impl.cuh
@@ -19,6 +19,7 @@
 #include "prims/extract_transform_e.cuh"
 #include "prims/extract_transform_v_frontier_outgoing_e.cuh"
 #include "prims/fill_edge_property.cuh"
+#include "prims/per_v_pair_dst_nbr_intersection.cuh"
 #include "prims/transform_e.cuh"
 #include "prims/transform_reduce_dst_nbr_intersection_of_e_endpoints_by_v.cuh"
 #include "prims/update_edge_src_dst_property.cuh"
@@ -41,7 +42,199 @@
 #include <thrust/transform.h>
 #include <thrust/tuple.h>
 
+#include <chrono>
+using namespace std::chrono;
+
 namespace cugraph {
+template <typename vertex_t, typename edge_t, bool multi_gpu>
+void order_edge_based_on_dodg(raft::handle_t const& handle,
+                              graph_view_t<vertex_t, edge_t, false, multi_gpu>& graph_view,
+                              raft::device_span<vertex_t> edgelist_srcs,
+                              raft::device_span<vertex_t> edgelist_dsts)
+
+{
+  std::vector<size_t> rx_counts{};
+  std::optional<rmm::device_uvector<vertex_t>> srcs{std::nullopt};
+  std::optional<rmm::device_uvector<vertex_t>> dsts{std::nullopt};
+
+  std::optional<rmm::device_uvector<vertex_t>> cp_edgelist_srcs{std::nullopt};
+  std::optional<rmm::device_uvector<vertex_t>> cp_edgelist_dsts{std::nullopt};
+
+  // FIXME: Minor comm is not working for all cases so I believe some edges a beyond
+  // the partitioning range
+  if constexpr (multi_gpu) {
+    auto& comm                 = handle.get_comms();
+    auto const comm_size       = comm.get_size();
+    auto& major_comm           = handle.get_subcomm(cugraph::partition_manager::major_comm_name());
+    auto const major_comm_size = major_comm.get_size();
+    auto& minor_comm           = handle.get_subcomm(cugraph::partition_manager::minor_comm_name());
+    auto const minor_comm_size = minor_comm.get_size();
+
+    auto vertex_partition_range_lasts = graph_view.vertex_partition_range_lasts();
+
+    rmm::device_uvector<vertex_t> d_vertex_partition_range_lasts(
+      vertex_partition_range_lasts.size(), handle.get_stream());
+
+    raft::update_device(d_vertex_partition_range_lasts.data(),
+                        vertex_partition_range_lasts.data(),
+                        vertex_partition_range_lasts.size(),
+                        handle.get_stream());
+
+    auto func = cugraph::detail::compute_gpu_id_from_int_edge_endpoints_t<vertex_t>{
+      raft::device_span<vertex_t const>(d_vertex_partition_range_lasts.data(),
+                                        d_vertex_partition_range_lasts.size()),
+      comm_size,
+      major_comm_size,
+      minor_comm_size};
+
+    rmm::device_uvector<vertex_t> tmp_srcs(edgelist_srcs.size(), handle.get_stream());
+    rmm::device_uvector<vertex_t> tmp_dsts(edgelist_srcs.size(), handle.get_stream());
+
+    thrust::copy(handle.get_thrust_policy(),
+                 thrust::make_zip_iterator(edgelist_srcs.begin(), edgelist_dsts.begin()),
+                 thrust::make_zip_iterator(edgelist_srcs.end(), edgelist_dsts.end()),
+                 thrust::make_zip_iterator(tmp_srcs.begin(), tmp_dsts.begin()));
+
+    cp_edgelist_srcs = std::move(tmp_srcs);
+    cp_edgelist_dsts = std::move(tmp_dsts);
+
+    auto unique_pair_end = thrust::unique(
+      handle.get_thrust_policy(),
+      thrust::make_zip_iterator(cp_edgelist_srcs->begin(), cp_edgelist_dsts->begin()),
+      thrust::make_zip_iterator(cp_edgelist_srcs->end(), cp_edgelist_dsts->end()));
+
+    auto num_unique_pair = thrust::distance(
+      thrust::make_zip_iterator(cp_edgelist_srcs->begin(), cp_edgelist_dsts->begin()),
+      unique_pair_end);
+
+    cp_edgelist_srcs->resize(num_unique_pair, handle.get_stream());
+    cp_edgelist_dsts->resize(num_unique_pair, handle.get_stream());
+
+    auto d_tx_counts = cugraph::groupby_and_count(
+      thrust::make_zip_iterator(cp_edgelist_srcs->begin(), cp_edgelist_dsts->begin()),
+      thrust::make_zip_iterator(cp_edgelist_srcs->end(), cp_edgelist_dsts->end()),
+      [func] __device__(auto val) { return func(val); },
+      comm_size,
+      std::numeric_limits<size_t>::max(),
+      handle.get_stream());
+
+    std::vector<size_t> h_tx_counts(d_tx_counts.size());
+
+    raft::update_host(
+      h_tx_counts.data(), d_tx_counts.data(), d_tx_counts.size(), handle.get_stream());
+
+    handle.sync_stream();
+
+    std::tie(srcs, rx_counts) =
+      shuffle_values(comm, cp_edgelist_srcs->begin(), h_tx_counts, handle.get_stream());
+
+    std::tie(dsts, std::ignore) =
+      shuffle_values(comm, cp_edgelist_dsts->begin(), h_tx_counts, handle.get_stream());
+  }
+
+  std::optional<rmm::device_uvector<bool>> edge_exists{std::nullopt};
+  edge_exists = graph_view.has_edge(
+    handle,
+    srcs ? raft::device_span<vertex_t const>(srcs->data(), srcs->size())
+         : raft::device_span<vertex_t const>(edgelist_srcs.data(), edgelist_srcs.size()),
+    dsts ? raft::device_span<vertex_t const>(dsts->data(), dsts->size())
+         : raft::device_span<vertex_t const>(edgelist_dsts.data(), edgelist_dsts.size()));
+
+  if constexpr (multi_gpu) {
+    // Send the result back
+    std::tie(edge_exists, std::ignore) =
+      shuffle_values(handle.get_comms(), edge_exists->begin(), rx_counts, handle.get_stream());
+
+    thrust::sort_by_key(
+      handle.get_thrust_policy(),
+      thrust::make_zip_iterator(cp_edgelist_srcs->begin(), cp_edgelist_dsts->begin()),
+      thrust::make_zip_iterator(cp_edgelist_srcs->end(), cp_edgelist_dsts->end()),
+      edge_exists->begin());
+
+    // Match DODG edges
+    thrust::transform(
+      handle.get_thrust_policy(),
+      thrust::make_counting_iterator<edge_t>(0),
+      thrust::make_counting_iterator<edge_t>(edgelist_srcs.size()),
+      thrust::make_zip_iterator(edgelist_srcs.begin(), edgelist_dsts.begin()),
+      [edge_exists    = edge_exists->data(),
+       edgelist_first = thrust::make_zip_iterator(edgelist_srcs.begin(), edgelist_dsts.begin()),
+       cp_edgelist_first =
+         thrust::make_zip_iterator(cp_edgelist_srcs->begin(), cp_edgelist_dsts->begin()),
+       cp_edgelist_last = thrust::make_zip_iterator(cp_edgelist_srcs->end(),
+                                                    cp_edgelist_dsts->end())] __device__(auto idx) {
+        auto src = thrust::get<0>(edgelist_first[idx]);
+        auto dst = thrust::get<1>(edgelist_first[idx]);
+
+        auto itr_pair = thrust::lower_bound(
+          thrust::seq, cp_edgelist_first, cp_edgelist_last, thrust::make_tuple(src, dst));
+
+        auto idx_pair = thrust::distance(cp_edgelist_first, itr_pair);
+
+        return edge_exists[idx_pair] ? thrust::make_tuple(src, dst) : thrust::make_tuple(dst, src);
+      });
+
+  } else {
+    // Match DODG edges
+    thrust::transform(handle.get_thrust_policy(),
+                      thrust::make_counting_iterator<edge_t>(0),
+                      thrust::make_counting_iterator<edge_t>(edgelist_srcs.size()),
+                      thrust::make_zip_iterator(edgelist_srcs.begin(), edgelist_dsts.begin()),
+                      [edge_exists    = edge_exists->data(),
+                       edgelist_first = thrust::make_zip_iterator(
+                         edgelist_srcs.begin(), edgelist_dsts.begin())] __device__(auto idx) {
+                        auto src = thrust::get<0>(edgelist_first[idx]);
+                        auto dst = thrust::get<1>(edgelist_first[idx]);
+
+                        return edge_exists[idx] ? thrust::make_tuple(src, dst)
+                                                : thrust::make_tuple(dst, src);
+                      });
+  }
+}
+
+template <typename vertex_t, typename edge_t>
+struct extract_weak_edges {
+  edge_t k{};
+  __device__ thrust::optional<thrust::tuple<vertex_t, vertex_t>> operator()(
+    vertex_t src, vertex_t dst, thrust::nullopt_t, thrust::nullopt_t, edge_t count) const
+  {
+    return ((count < k - 2) && (count > 0))
+             ? thrust::optional<thrust::tuple<vertex_t, vertex_t>>{thrust::make_tuple(src, dst)}
+             : thrust::nullopt;
+  }
+};
+
+template <typename vertex_t, typename edge_t>
+struct extract_triangles_from_weak_edges {
+  size_t chunk_start{};
+  raft::device_span<size_t const> intersection_offsets{};
+  raft::device_span<vertex_t const> intersection_indices{};
+  raft::device_span<vertex_t const> weak_srcs{};
+  raft::device_span<vertex_t const> weak_dsts{};
+
+  __device__ thrust::tuple<vertex_t, vertex_t, vertex_t, vertex_t, vertex_t, vertex_t> operator()(
+    edge_t i) const
+  {
+    auto itr = thrust::upper_bound(
+      thrust::seq, intersection_offsets.begin() + 1, intersection_offsets.end(), i);
+    auto idx = thrust::distance(intersection_offsets.begin() + 1, itr);
+
+    auto edge_p_q = thrust::make_tuple(weak_srcs[chunk_start + idx], weak_dsts[chunk_start + idx]);
+
+    // Extract (p, r) edges
+    auto edge_p_r = thrust::make_tuple(weak_srcs[chunk_start + idx], intersection_indices[i]);
+
+    // Extract (q, r) edges
+    auto edge_q_r = thrust::make_tuple(weak_dsts[chunk_start + idx], intersection_indices[i]);
+
+    return thrust::make_tuple(thrust::get<0>(edge_p_q),
+                              thrust::get<1>(edge_p_q),
+                              thrust::get<0>(edge_p_r),
+                              thrust::get<1>(edge_p_r),
+                              thrust::get<0>(edge_q_r),
+                              thrust::get<1>(edge_q_r));
+  }
+};
 
 namespace {
 
@@ -121,6 +314,8 @@ k_truss(raft::handle_t const& handle,
     edge_weight{std::nullopt};
   std::optional<rmm::device_uvector<weight_t>> wgts{std::nullopt};
 
+  cugraph::edge_bucket_t<vertex_t, void, true, multi_gpu, true> edgelist_dodg(handle);
+
   if (graph_view.count_self_loops(handle) > edge_t{0}) {
     auto [srcs, dsts] = extract_transform_e(handle,
                                             graph_view,
@@ -214,121 +409,501 @@ k_truss(raft::handle_t const& handle,
 
   // 3. Keep only the edges from a low-degree vertex to a high-degree vertex.
 
-  {
-    auto cur_graph_view = modified_graph_view ? *modified_graph_view : graph_view;
+  auto cur_graph_view = modified_graph_view ? *modified_graph_view : graph_view;
+
+  auto vertex_partition_range_lasts =
+    renumber_map
+      ? std::make_optional<std::vector<vertex_t>>(cur_graph_view.vertex_partition_range_lasts())
+      : std::nullopt;
+
+  auto out_degrees = cur_graph_view.compute_out_degrees(handle);
+  edge_src_property_t<decltype(cur_graph_view), edge_t> edge_src_out_degrees(handle,
+                                                                             cur_graph_view);
+  edge_dst_property_t<decltype(cur_graph_view), edge_t> edge_dst_out_degrees(handle,
+                                                                             cur_graph_view);
+  update_edge_src_property(
+    handle, cur_graph_view, out_degrees.begin(), edge_src_out_degrees.mutable_view());
+  update_edge_dst_property(
+    handle, cur_graph_view, out_degrees.begin(), edge_dst_out_degrees.mutable_view());
+
+  rmm::device_uvector<vertex_t> srcs(0, handle.get_stream());
+  rmm::device_uvector<vertex_t> dsts(0, handle.get_stream());
+
+  edge_weight_view = edge_weight
+                       ? std::make_optional((*edge_weight).view())
+                       : std::optional<edge_property_view_t<edge_t, weight_t const*>>{std::nullopt};
+  if (edge_weight_view) {
+    std::tie(srcs, dsts, wgts) = extract_transform_e(
+      handle,
+      cur_graph_view,
+      edge_src_out_degrees.view(),
+      edge_dst_out_degrees.view(),
+      *edge_weight_view,
+      extract_low_to_high_degree_weighted_edges_t<vertex_t, weight_t, edge_t>{});
+  } else {
+    std::tie(srcs, dsts) =
+      extract_transform_e(handle,
+                          cur_graph_view,
+                          edge_src_out_degrees.view(),
+                          edge_dst_out_degrees.view(),
+                          edge_dummy_property_t{}.view(),
+                          extract_low_to_high_degree_edges_t<vertex_t, edge_t>{});
+  }
 
-    auto vertex_partition_range_lasts =
-      renumber_map
-        ? std::make_optional<std::vector<vertex_t>>(cur_graph_view.vertex_partition_range_lasts())
-        : std::nullopt;
+  cugraph::edge_property_t<graph_view_t<vertex_t, edge_t, false, multi_gpu>, bool> dodg_mask(
+    handle, cur_graph_view);
+  cugraph::fill_edge_property(handle, cur_graph_view, dodg_mask.mutable_view(), bool{false});
 
-    auto out_degrees = cur_graph_view.compute_out_degrees(handle);
-    edge_src_property_t<decltype(cur_graph_view), edge_t> edge_src_out_degrees(handle,
-                                                                               cur_graph_view);
-    edge_dst_property_t<decltype(cur_graph_view), edge_t> edge_dst_out_degrees(handle,
-                                                                               cur_graph_view);
-    update_edge_src_property(
-      handle, cur_graph_view, out_degrees.begin(), edge_src_out_degrees.mutable_view());
-    update_edge_dst_property(
-      handle, cur_graph_view, out_degrees.begin(), edge_dst_out_degrees.mutable_view());
-
-    rmm::device_uvector<vertex_t> srcs(0, handle.get_stream());
-    rmm::device_uvector<vertex_t> dsts(0, handle.get_stream());
-
-    edge_weight_view =
-      edge_weight ? std::make_optional((*edge_weight).view())
-                  : std::optional<edge_property_view_t<edge_t, weight_t const*>>{std::nullopt};
-    if (edge_weight_view) {
-      std::tie(srcs, dsts, wgts) = extract_transform_e(
-        handle,
-        cur_graph_view,
-        edge_src_out_degrees.view(),
-        edge_dst_out_degrees.view(),
-        *edge_weight_view,
-        extract_low_to_high_degree_weighted_edges_t<vertex_t, weight_t, edge_t>{});
-    } else {
-      std::tie(srcs, dsts) =
-        extract_transform_e(handle,
-                            cur_graph_view,
-                            edge_src_out_degrees.view(),
-                            edge_dst_out_degrees.view(),
-                            edge_dummy_property_t{}.view(),
-                            extract_low_to_high_degree_edges_t<vertex_t, edge_t>{});
-    }
+  // Masking edges not part of the DODG
+  edgelist_dodg.insert(srcs.begin(), srcs.end(), dsts.begin());
 
-    if constexpr (multi_gpu) {
-      std::tie(srcs, dsts, wgts, std::ignore, std::ignore, std::ignore) =
-        detail::shuffle_ext_vertex_pairs_with_values_to_local_gpu_by_edge_partitioning<vertex_t,
-                                                                                       edge_t,
-                                                                                       weight_t,
-                                                                                       int32_t>(
-          handle, std::move(srcs), std::move(dsts), std::move(wgts), std::nullopt, std::nullopt);
-    }
-
-    std::optional<rmm::device_uvector<vertex_t>> tmp_renumber_map{std::nullopt};
-
-    std::tie(*modified_graph, edge_weight, std::ignore, std::ignore, tmp_renumber_map) =
-      create_graph_from_edgelist<vertex_t, edge_t, weight_t, edge_t, int32_t, false, multi_gpu>(
-        handle,
-        std::nullopt,
-        std::move(srcs),
-        std::move(dsts),
-        std::move(wgts),
-        std::nullopt,
-        std::nullopt,
-        cugraph::graph_properties_t{false /* now asymmetric */, cur_graph_view.is_multigraph()},
-        true);
+  cugraph::transform_e(
+    handle,
+    cur_graph_view,
+    edgelist_dodg,
+    cugraph::edge_src_dummy_property_t{}.view(),
+    cugraph::edge_dst_dummy_property_t{}.view(),
+    cugraph::edge_dummy_property_t{}.view(),
+    [] __device__(auto src, auto dst, thrust::nullopt_t, thrust::nullopt_t, thrust::nullopt_t) {
+      return true;
+    },
+    dodg_mask.mutable_view(),
+    false);
 
-    modified_graph_view = (*modified_graph).view();
-    if (renumber_map) {  // collapse renumber_map
-      unrenumber_int_vertices<vertex_t, multi_gpu>(handle,
-                                                   (*tmp_renumber_map).data(),
-                                                   (*tmp_renumber_map).size(),
-                                                   (*renumber_map).data(),
-                                                   *vertex_partition_range_lasts);
-    }
-    renumber_map = std::move(tmp_renumber_map);
-  }
+  edgelist_dodg.clear();
 
   // 4. Compute triangle count using nbr_intersection and unroll weak edges
 
   {
     auto cur_graph_view = modified_graph_view ? *modified_graph_view : graph_view;
 
-    edge_weight_view =
-      edge_weight ? std::make_optional((*edge_weight).view())
-                  : std::optional<edge_property_view_t<edge_t, weight_t const*>>{std::nullopt};
+    cugraph::edge_property_t<decltype(cur_graph_view), bool> weak_edges_mask(handle,
+                                                                             cur_graph_view);
+    cugraph::fill_edge_property(handle, cur_graph_view, weak_edges_mask.mutable_view(), bool{true});
+
+    // Attach mask
+    cur_graph_view.attach_edge_mask(dodg_mask.view());
+
+    auto edge_triangle_counts =
+      edge_triangle_count<vertex_t, edge_t, multi_gpu>(handle, cur_graph_view, false);
+
+    cugraph::edge_bucket_t<vertex_t, void, true, multi_gpu, true> edgelist_weak(handle);
+    cugraph::edge_bucket_t<vertex_t, void, true, multi_gpu, true> edges_to_decrement_count(handle);
 
-    cugraph::edge_property_t<decltype(cur_graph_view), bool> edge_mask(handle, cur_graph_view);
-    cugraph::fill_edge_property(handle, cur_graph_view, edge_mask.mutable_view(), bool{true});
+    size_t prev_chunk_size = 0;  // FIXME: Add support for chunking
 
     while (true) {
-      // FIXME: This approach is very expensive when invalidating only few edges per iteration
-      // and should be address.
-      auto edge_triangle_counts =
-        edge_triangle_count<vertex_t, edge_t, multi_gpu>(handle, cur_graph_view);
+      cur_graph_view.clear_edge_mask();
+      cur_graph_view.attach_edge_mask(dodg_mask.view());
 
-      // Mask all the edges that have k - 2 count
+      // Extract weak edges
+      auto [weak_edgelist_srcs, weak_edgelist_dsts] =
+        extract_transform_e(handle,
+                            cur_graph_view,
+                            edge_src_dummy_property_t{}.view(),
+                            edge_dst_dummy_property_t{}.view(),
+                            edge_triangle_counts.view(),
+                            extract_weak_edges<vertex_t, edge_t>{k});
+
+      auto weak_edgelist_first =
+        thrust::make_zip_iterator(weak_edgelist_srcs.begin(), weak_edgelist_dsts.begin());
+      auto weak_edgelist_last =
+        thrust::make_zip_iterator(weak_edgelist_srcs.end(), weak_edgelist_dsts.end());
+
+      // Perform nbr_intersection of the weak edges from the undirected
+      // graph view
+      cur_graph_view.clear_edge_mask();
+
+      // Attach the weak edge mask
+      cur_graph_view.attach_edge_mask(weak_edges_mask.view());
+
+      auto [intersection_offsets, intersection_indices] = per_v_pair_dst_nbr_intersection(
+        handle, cur_graph_view, weak_edgelist_first, weak_edgelist_last, false);
+
+      // Identify (p, q) edges, and form edges (p, q), (p, r) and (q, r)
+      // To avoid overcompensation, redirect all edges in the triangle to follow this unique
+      // pattern: (p, q) then (q, r) then (p, r)
+
+      auto triangles_from_weak_edges = allocate_dataframe_buffer<
+        thrust::tuple<vertex_t, vertex_t, vertex_t, vertex_t, vertex_t, vertex_t>>(
+        intersection_indices.size(), handle.get_stream());
+
+      // Form (p, q) edges
+      // Extract triangle from weak
+      thrust::tabulate(
+        handle.get_thrust_policy(),
+        get_dataframe_buffer_begin(triangles_from_weak_edges),
+        get_dataframe_buffer_end(triangles_from_weak_edges),
+        extract_triangles_from_weak_edges<vertex_t, edge_t>{
+          prev_chunk_size,
+          raft::device_span<size_t const>(intersection_offsets.data(), intersection_offsets.size()),
+          raft::device_span<vertex_t const>(intersection_indices.data(),
+                                            intersection_indices.size()),
+          raft::device_span<vertex_t const>(weak_edgelist_srcs.data(), weak_edgelist_srcs.size()),
+          raft::device_span<vertex_t const>(weak_edgelist_dsts.data(), weak_edgelist_dsts.size())});
+
+      cur_graph_view.clear_edge_mask();
+      // Check for edge existance on the directed graph view
+      cur_graph_view.attach_edge_mask(dodg_mask.view());
+
+      rmm::device_uvector<bool> edge_exists(0, handle.get_stream());
+
+      // Handling (p, r) edges
+
+      // (p, q) edges are owned by the current GPU while (p, r) and (q, r)
+      // can be owned by different GPUs
+      // Ordering (p, r) edges based on the DODG
+      order_edge_based_on_dodg<vertex_t, edge_t, multi_gpu>(
+        handle,
+        cur_graph_view,
+        raft::device_span<vertex_t>(std::get<2>(triangles_from_weak_edges).data(),
+                                    std::get<2>(triangles_from_weak_edges).size()),
+        raft::device_span<vertex_t>(std::get<3>(triangles_from_weak_edges).data(),
+                                    std::get<3>(triangles_from_weak_edges).size()));
 
-      auto prev_number_of_edges = cur_graph_view.compute_number_of_edges(handle);
+      // Handling (q, r) edges
 
+      // (p, q) edges are owned by the current GPU while (p, r) and (q, r)
+      // can be owned by different GPUs
+      // Ordering (q, r) edges based on the DODG
+      order_edge_based_on_dodg<vertex_t, edge_t, multi_gpu>(
+        handle,
+        cur_graph_view,
+        raft::device_span<vertex_t>(std::get<4>(triangles_from_weak_edges).data(),
+                                    std::get<4>(triangles_from_weak_edges).size()),
+        raft::device_span<vertex_t>(std::get<5>(triangles_from_weak_edges).data(),
+                                    std::get<5>(triangles_from_weak_edges).size()));
+
+      // re-order triangles
+      // To avoid overcompensation, redirect all edges in the triangle to follow this unique
+      // pattern: (p, q) then (q, r) then (p, r)
+      thrust::transform(
+        handle.get_thrust_policy(),
+        get_dataframe_buffer_begin(triangles_from_weak_edges),
+        get_dataframe_buffer_end(triangles_from_weak_edges),
+        get_dataframe_buffer_begin(triangles_from_weak_edges),
+        [] __device__(auto triangle) {
+          auto edge_p_q = thrust::make_tuple(thrust::get<0>(triangle), thrust::get<1>(triangle));
+          auto edge_p_r = thrust::make_tuple(thrust::get<2>(triangle), thrust::get<3>(triangle));
+          auto edge_q_r = thrust::make_tuple(thrust::get<4>(triangle), thrust::get<5>(triangle));
+
+          if (thrust::get<1>(edge_p_q) == thrust::get<1>(edge_q_r)) {
+            if (thrust::get<0>(edge_p_q) == thrust::get<0>(edge_p_r)) {
+              triangle = thrust::make_tuple(thrust::get<0>(edge_p_r),
+                                            thrust::get<1>(edge_p_r),
+                                            thrust::get<0>(edge_q_r),
+                                            thrust::get<1>(edge_q_r),
+                                            thrust::get<0>(edge_p_q),
+                                            thrust::get<1>(edge_p_q));
+
+            } else {
+              triangle = thrust::make_tuple(thrust::get<0>(edge_p_r),
+                                            thrust::get<1>(edge_p_r),
+                                            thrust::get<0>(edge_p_q),
+                                            thrust::get<1>(edge_p_q),
+                                            thrust::get<0>(edge_q_r),
+                                            thrust::get<1>(edge_q_r));
+            }
+          } else if (thrust::get<1>(edge_p_q) == thrust::get<0>(edge_q_r)) {
+            triangle = thrust::make_tuple(thrust::get<0>(edge_p_q),
+                                          thrust::get<1>(edge_p_q),
+                                          thrust::get<0>(edge_q_r),
+                                          thrust::get<1>(edge_q_r),
+                                          thrust::get<0>(edge_p_r),
+                                          thrust::get<1>(edge_p_r));
+          }
+          return triangle;
+        });
+
+      thrust::sort(handle.get_thrust_policy(),
+                   get_dataframe_buffer_begin(triangles_from_weak_edges),
+                   get_dataframe_buffer_end(triangles_from_weak_edges));
+
+      auto unique_triangle_end =
+        thrust::unique(handle.get_thrust_policy(),
+                       get_dataframe_buffer_begin(triangles_from_weak_edges),
+                       get_dataframe_buffer_end(triangles_from_weak_edges));
+
+      auto num_unique_triangles = thrust::distance(
+        get_dataframe_buffer_begin(triangles_from_weak_edges), unique_triangle_end);
+
+      resize_dataframe_buffer(triangles_from_weak_edges, num_unique_triangles, handle.get_stream());
+
+      if constexpr (multi_gpu) {
+        auto& comm           = handle.get_comms();
+        auto const comm_size = comm.get_size();
+        auto& major_comm     = handle.get_subcomm(cugraph::partition_manager::major_comm_name());
+        auto const major_comm_size = major_comm.get_size();
+        auto& minor_comm = handle.get_subcomm(cugraph::partition_manager::minor_comm_name());
+        auto const minor_comm_size = minor_comm.get_size();
+
+        auto vertex_partition_range_lasts = cur_graph_view.vertex_partition_range_lasts();
+
+        rmm::device_uvector<vertex_t> d_vertex_partition_range_lasts(
+          vertex_partition_range_lasts.size(), handle.get_stream());
+
+        raft::update_device(d_vertex_partition_range_lasts.data(),
+                            vertex_partition_range_lasts.data(),
+                            vertex_partition_range_lasts.size(),
+                            handle.get_stream());
+
+        // FIXME: put the redundant code above in a function
+        std::tie(triangles_from_weak_edges, std::ignore) = groupby_gpu_id_and_shuffle_values(
+          handle.get_comms(),
+          get_dataframe_buffer_begin(triangles_from_weak_edges),
+          get_dataframe_buffer_end(triangles_from_weak_edges),
+
+          [key_func =
+             cugraph::detail::compute_gpu_id_from_int_edge_endpoints_t<vertex_t>{
+               raft::device_span<vertex_t const>(d_vertex_partition_range_lasts.data(),
+                                                 d_vertex_partition_range_lasts.size()),
+               comm_size,
+               major_comm_size,
+               minor_comm_size}] __device__(auto val) {
+            return key_func(thrust::get<0>(val), thrust::get<1>(val));
+          },
+
+          handle.get_stream());
+
+        thrust::sort(handle.get_thrust_policy(),
+                     get_dataframe_buffer_begin(triangles_from_weak_edges),
+                     get_dataframe_buffer_end(triangles_from_weak_edges));
+
+        unique_triangle_end = thrust::unique(handle.get_thrust_policy(),
+                                             get_dataframe_buffer_begin(triangles_from_weak_edges),
+                                             get_dataframe_buffer_end(triangles_from_weak_edges));
+
+        num_unique_triangles = thrust::distance(
+          get_dataframe_buffer_begin(triangles_from_weak_edges), unique_triangle_end);
+        resize_dataframe_buffer(
+          triangles_from_weak_edges, num_unique_triangles, handle.get_stream());
+      }
+
+      auto edgelist_to_update_count = allocate_dataframe_buffer<thrust::tuple<vertex_t, vertex_t>>(
+        3 * num_unique_triangles, handle.get_stream());
+
+      // Flatten the triangle to a list of egdes.
+      thrust::transform(
+        handle.get_thrust_policy(),
+        thrust::make_counting_iterator<edge_t>(0),
+        thrust::make_counting_iterator<edge_t>(size_dataframe_buffer(edgelist_to_update_count)),
+        get_dataframe_buffer_begin(edgelist_to_update_count),
+        [num_unique_triangles,
+         triangles_from_weak_edges =
+           get_dataframe_buffer_begin(triangles_from_weak_edges)] __device__(auto idx) {
+          auto idx_triangle           = idx % num_unique_triangles;
+          auto idx_vertex_in_triangle = idx / num_unique_triangles;
+          auto triangle = (triangles_from_weak_edges + idx_triangle).get_iterator_tuple();
+          vertex_t src;
+          vertex_t dst;
+
+          if (idx_vertex_in_triangle == 0) {
+            src = *(thrust::get<0>(triangle));
+            dst = *(thrust::get<1>(triangle));
+          }
+
+          if (idx_vertex_in_triangle == 1) {
+            src = *(thrust::get<2>(triangle));
+            dst = *(thrust::get<3>(triangle));
+          }
+
+          if (idx_vertex_in_triangle == 2) {
+            src = *(thrust::get<4>(triangle));
+            dst = *(thrust::get<5>(triangle));
+          }
+
+          return thrust::make_tuple(src, dst);
+        });
+
+      // If multi-GPU, shuffle and reduce
+      if constexpr (multi_gpu) {
+        auto& comm           = handle.get_comms();
+        auto const comm_size = comm.get_size();
+        auto& major_comm     = handle.get_subcomm(cugraph::partition_manager::major_comm_name());
+        auto const major_comm_size = major_comm.get_size();
+        auto& minor_comm = handle.get_subcomm(cugraph::partition_manager::minor_comm_name());
+        auto const minor_comm_size = minor_comm.get_size();
+
+        auto vertex_partition_range_lasts = cur_graph_view.vertex_partition_range_lasts();
+
+        rmm::device_uvector<vertex_t> d_vertex_partition_range_lasts(
+          vertex_partition_range_lasts.size(), handle.get_stream());
+        raft::update_device(d_vertex_partition_range_lasts.data(),
+                            vertex_partition_range_lasts.data(),
+                            vertex_partition_range_lasts.size(),
+                            handle.get_stream());
+
+        std::tie(edgelist_to_update_count, std::ignore) = groupby_gpu_id_and_shuffle_values(
+          handle.get_comms(),
+          get_dataframe_buffer_begin(edgelist_to_update_count),
+          get_dataframe_buffer_end(edgelist_to_update_count),
+
+          [key_func =
+             cugraph::detail::compute_gpu_id_from_int_edge_endpoints_t<vertex_t>{
+               raft::device_span<vertex_t const>(d_vertex_partition_range_lasts.data(),
+                                                 d_vertex_partition_range_lasts.size()),
+               comm_size,
+               major_comm_size,
+               minor_comm_size}] __device__(auto val) {
+            return key_func(thrust::get<0>(val), thrust::get<1>(val));
+          },
+
+          handle.get_stream());
+      }
+
+      thrust::sort(handle.get_thrust_policy(),
+                   get_dataframe_buffer_begin(edgelist_to_update_count),
+                   get_dataframe_buffer_end(edgelist_to_update_count));
+
+      auto unique_pair_count =
+        thrust::unique_count(handle.get_thrust_policy(),
+                             get_dataframe_buffer_begin(edgelist_to_update_count),
+                             get_dataframe_buffer_end(edgelist_to_update_count));
+
+      auto vertex_pair_buffer_unique = allocate_dataframe_buffer<thrust::tuple<vertex_t, vertex_t>>(
+        unique_pair_count, handle.get_stream());
+
+      rmm::device_uvector<edge_t> decrease_count(unique_pair_count, handle.get_stream());
+
+      thrust::reduce_by_key(handle.get_thrust_policy(),
+                            get_dataframe_buffer_begin(edgelist_to_update_count),
+                            get_dataframe_buffer_end(edgelist_to_update_count),
+                            thrust::make_constant_iterator(size_t{1}),
+                            get_dataframe_buffer_begin(vertex_pair_buffer_unique),
+                            decrease_count.begin(),
+                            thrust::equal_to<thrust::tuple<vertex_t, vertex_t>>{});
+
+      // Update count of weak edges
+      edges_to_decrement_count.clear();
+
+      edges_to_decrement_count.insert(std::get<0>(vertex_pair_buffer_unique).begin(),
+                                      std::get<0>(vertex_pair_buffer_unique).end(),
+                                      std::get<1>(vertex_pair_buffer_unique).begin());
+
+      // Update count of weak edges from the DODG view
       cugraph::transform_e(
         handle,
         cur_graph_view,
+        edges_to_decrement_count,
         cugraph::edge_src_dummy_property_t{}.view(),
         cugraph::edge_dst_dummy_property_t{}.view(),
         edge_triangle_counts.view(),
-        [k] __device__(auto src, auto dst, thrust::nullopt_t, thrust::nullopt_t, auto count) {
-          return count >= k - 2;
+        [edge_buffer_first =
+           thrust::make_zip_iterator(std::get<0>(vertex_pair_buffer_unique).begin(),
+                                     std::get<1>(vertex_pair_buffer_unique).begin()),
+         edge_buffer_last = thrust::make_zip_iterator(std::get<0>(vertex_pair_buffer_unique).end(),
+                                                      std::get<1>(vertex_pair_buffer_unique).end()),
+         decrease_count   = raft::device_span<edge_t>(
+           decrease_count.data(), decrease_count.size())] __device__(auto src,
+                                                                     auto dst,
+                                                                     thrust::nullopt_t,
+                                                                     thrust::nullopt_t,
+                                                                     edge_t count) {
+          auto itr_pair = thrust::lower_bound(
+            thrust::seq, edge_buffer_first, edge_buffer_last, thrust::make_tuple(src, dst));
+
+          auto idx_pair = thrust::distance(edge_buffer_first, itr_pair);
+
+          count -= decrease_count[idx_pair];
+
+          return count;
         },
-        edge_mask.mutable_view(),
+        edge_triangle_counts.mutable_view(),
         false);
 
-      cur_graph_view.attach_edge_mask(edge_mask.view());
+      edgelist_weak.clear();
+
+      thrust::sort(
+        handle.get_thrust_policy(),
+        thrust::make_zip_iterator(weak_edgelist_srcs.begin(), weak_edgelist_dsts.begin()),
+        thrust::make_zip_iterator(weak_edgelist_srcs.end(), weak_edgelist_dsts.end()));
+
+      edgelist_weak.insert(
+        weak_edgelist_srcs.begin(), weak_edgelist_srcs.end(), weak_edgelist_dsts.begin());
+
+      // Get undirected graph view
+      cur_graph_view.clear_edge_mask();
+      cur_graph_view.attach_edge_mask(weak_edges_mask.view());
+
+      auto prev_number_of_edges = cur_graph_view.compute_number_of_edges(handle);
+
+      cugraph::transform_e(
+        handle,
+        cur_graph_view,
+        edgelist_weak,
+        cugraph::edge_src_dummy_property_t{}.view(),
+        cugraph::edge_dst_dummy_property_t{}.view(),
+        cugraph::edge_dummy_property_t{}.view(),
+        [] __device__(auto src, auto dst, thrust::nullopt_t, thrust::nullopt_t, thrust::nullopt_t) {
+          return false;
+        },
+        weak_edges_mask.mutable_view(),
+        false);
+
+      edgelist_weak.clear();
+
+      // shuffle the edges if multi_gpu
+      if constexpr (multi_gpu) {
+        std::tie(weak_edgelist_dsts,
+                 weak_edgelist_srcs,
+                 std::ignore,
+                 std::ignore,
+                 std::ignore,
+                 std::ignore) =
+          detail::shuffle_int_vertex_pairs_with_values_to_local_gpu_by_edge_partitioning<vertex_t,
+                                                                                         edge_t,
+                                                                                         weight_t,
+                                                                                         int32_t>(
+            handle,
+            std::move(weak_edgelist_dsts),
+            std::move(weak_edgelist_srcs),
+            std::nullopt,
+            std::nullopt,
+            std::nullopt,
+            cur_graph_view.vertex_partition_range_lasts());
+      }
+
+      thrust::sort(
+        handle.get_thrust_policy(),
+        thrust::make_zip_iterator(weak_edgelist_dsts.begin(), weak_edgelist_srcs.begin()),
+        thrust::make_zip_iterator(weak_edgelist_dsts.end(), weak_edgelist_srcs.end()));
+
+      edgelist_weak.insert(
+        weak_edgelist_dsts.begin(), weak_edgelist_dsts.end(), weak_edgelist_srcs.begin());
+
+      cugraph::transform_e(
+        handle,
+        cur_graph_view,
+        edgelist_weak,
+        cugraph::edge_src_dummy_property_t{}.view(),
+        cugraph::edge_dst_dummy_property_t{}.view(),
+        cugraph::edge_dummy_property_t{}.view(),
+        [] __device__(auto src, auto dst, thrust::nullopt_t, thrust::nullopt_t, thrust::nullopt_t) {
+          return false;
+        },
+        weak_edges_mask.mutable_view(),
+        false);
+
+      cur_graph_view.attach_edge_mask(weak_edges_mask.view());
 
       if (prev_number_of_edges == cur_graph_view.compute_number_of_edges(handle)) { break; }
     }
 
+    cur_graph_view.clear_edge_mask();
+    cur_graph_view.attach_edge_mask(dodg_mask.view());
+
+    cugraph::transform_e(
+      handle,
+      cur_graph_view,
+      cugraph::edge_src_dummy_property_t{}.view(),
+      cugraph::edge_dst_dummy_property_t{}.view(),
+      edge_triangle_counts.view(),
+      [] __device__(auto src, auto dst, thrust::nullopt_t, thrust::nullopt_t, auto count) {
+        return count == 0 ? false : true;
+      },
+      dodg_mask.mutable_view(),
+      false);
+
     rmm::device_uvector<vertex_t> edgelist_srcs(0, handle.get_stream());
     rmm::device_uvector<vertex_t> edgelist_dsts(0, handle.get_stream());
     std::optional<rmm::device_uvector<weight_t>> edgelist_wgts{std::nullopt};
@@ -337,11 +912,12 @@ k_truss(raft::handle_t const& handle,
       decompress_to_edgelist(
         handle,
         cur_graph_view,
-        edge_weight_view ? std::make_optional(*edge_weight_view) : std::nullopt,
+        edge_weight_view,
         std::optional<edge_property_view_t<edge_t, edge_t const*>>{std::nullopt},
         std::optional<cugraph::edge_property_view_t<edge_t, int32_t const*>>{std::nullopt},
-        std::make_optional(
-          raft::device_span<vertex_t const>((*renumber_map).data(), (*renumber_map).size())));
+        renumber_map ? std::make_optional(raft::device_span<vertex_t const>((*renumber_map).data(),
+                                                                            (*renumber_map).size()))
+                     : std::nullopt);
 
     std::tie(edgelist_srcs, edgelist_dsts, edgelist_wgts) =
       symmetrize_edgelist<vertex_t, weight_t, false, multi_gpu>(handle,